У нас есть экземпляр SQL Server 2012, который является нашим основным сервером ETL/DW. Ежедневные задания состоят из более чем 40 процессов ETL, запрашивающих другие источники данных, обновляющих DataMart, стандартные процессы ETL и BI.
За последние несколько недель многие задания были неудачными из-за ошибок, связанных с сетью. Большинство этих ошибок состоят из:
"Невозможно завершить процесс входа из-за задержки открытия соединения с сервером."
"Время ожидания входа истекло"
"Произошла ошибка, связанная с сетью или экземпляром, при установлении соединения с SQL Server. Сервер не найден или недоступен. Проверьте правильность имени экземпляра и настройки SQL Server для разрешения удаленных подключений."
Все учетные записи источников данных, разрешения, доступность были проверены как рабочие, а вход в систему и запуск пакетов ETL вручную прошли без проблем. Единственная проблема с ресурсами, с которой мы столкнулись, — это высокая загрузка ЦП, между 90-99% во время ежедневной обработки заданий, когда и возникают эти ошибки.
Сбои не постоянны, но обычно примерно раз в неделю мы сталкиваемся с большим их количеством в течение одного дня, когда все остальное работает нормально.
Где еще я могу искать источник этих проблем? Высокая загрузка ЦП приводит к длительному ожиданию, которое проявляется в виде сетевых ошибок?
решение1
Это вполне может быть связано с высокой загрузкой ЦП на сервере SSIS. Если ЦП на клиенте (в данном случае на сервере SSIS) слишком заняты, то клиент может слишком долго ждать, чтобы обработать ответ от SQL Server. Вам нужно будет уменьшить нагрузку на SSIS-бокс или оптимизировать некоторые вещи, чтобы загрузка ЦП снизилась и соединения работали без проблем.