SSIS/ETL-Jobs schlagen mit netzwerkbezogenen Fehlern fehl, wenn das Netzwerk in Ordnung ist

SSIS/ETL-Jobs schlagen mit netzwerkbezogenen Fehlern fehl, wenn das Netzwerk in Ordnung ist

Wir haben eine SQL Server 2012-Instanz, die unser Haupt-ETL/DW-Server ist. Die täglichen Jobs bestehen aus über 40 ETL-Prozessen, die andere Datenquellen abfragen, den DataMart aktualisieren, Standard-ETL- und BI-Prozesse.

In den letzten Wochen sind viele Jobs aufgrund von Netzwerkfehlern fehlgeschlagen. Die meisten dieser Fehler sind:
"Der Anmeldevorgang kann aufgrund einer Verzögerung beim Öffnen der Serververbindung nicht abgeschlossen werden."
"Anmelde-Timeout abgelaufen"
"Beim Herstellen einer Verbindung zu SQL Server ist ein netzwerkbezogener oder instanzspezifischer Fehler aufgetreten. Der Server wurde nicht gefunden oder ist nicht erreichbar. Überprüfen Sie, ob der Instanzname korrekt ist und ob SQL Server so konfiguriert ist, dass Remoteverbindungen zulässig sind.."

Alle Datenquellenkonten, Berechtigungen und Verfügbarkeiten wurden als funktionsfähig verifiziert und das Anmelden und manuelle Ausführen der ETL-Pakete funktionierte problemlos. Das einzige Ressourcenproblem, das wir haben, ist eine hohe CPU-Auslastung zwischen 90 und 99 % während der täglichen Auftragsverarbeitung, bei der diese Fehler auftreten.

Die Ausfälle treten nicht einheitlich auf, aber normalerweise kommt es ungefähr einmal pro Woche an einem Tag zu einer größeren Anzahl von Ausfällen, wenn alles andere einwandfrei läuft.

Wo könnte ich sonst noch nach der Ursache dieser Probleme suchen? Führt eine hohe CPU-Auslastung zu langen Wartezeiten, die sich als Netzwerkfehler äußern?

Antwort1

Es könnte sehr gut an der hohen CPU-Auslastung des SSIS-Servers liegen. Wenn die CPUs auf dem Client (in diesem Fall dem SSIS-Server) zu stark ausgelastet sind, kann es sein, dass der Client zu lange wartet, um die Antwort vom SQL Server zu verarbeiten. Sie müssen die Arbeitslast auf der SSIS-Box reduzieren oder einige Dinge optimieren, damit die CPU-Last sinkt und die Verbindungen ohne Probleme funktionieren.

verwandte Informationen