Как отладить и предотвратить нестабильную и ненадежную ИТ-среду?

Как отладить и предотвратить нестабильную и ненадежную ИТ-среду?

Я не ИТ-администратор, я разработчик программного обеспечения (стек Microsoft) и пытаюсь понять, что не так с ИТ-средой одного из наших клиентов.

Мы развернули наше клиент\серверное решение для среднего бизнеса. Проблема в том, что ИТ-среда клиентов (в основном различные типы серверов Microsoft — серверы SQL, SharePoint, Lync, серверы IIS и т. д. и т. п.) выглядит крайне хаотичной и нестабильной. Постоянно происходит сбой в работе той или иной системы из-за того, что администратор что-то перенастроил на сервере, что влияет на наше программное обеспечение, работающее на нем. Службе поддержки приходится тратить много времени на то, чтобы продолжать вникать и обнаруживать, что администратор изменил какие-то настройки на сервере, которые влияют на наше решение, а не на что-то, связанное непосредственно с нашим программным обеспечением.

Это не только наше программное обеспечение, это, кажется, происходит во всех их системах, и администраторы, кажется, постоянно тушат пожары. Не успевают все домино встать, как кто-то что-то меняет, и 1 снова сбивается...

Я собираюсь поговорить с их ИТ-менеджером, но я не очень хорошо разбираюсь в практиках ИТ-администрирования.

Что нужно рассмотреть или поставить под сомнение? Есть ли в мире ИТ-администрирования какая-либо передовая практика или процесс, которые могут решить эту проблему? Другие предложения?

решение1

Как правило, надежность в ИТ обеспечивается несколькими различными методами, а именно:

  • Контроль доступа
  • Управление изменениями
  • Управление конфигурацией
  • Контроль версий
  • Секретный соус

Контроль доступа просто ограничивает тех, кто может вносить изменения в критические/производственные системы. Управление изменениями обычно осуществляется посредством контроля доступа и системы тикетов. Запросы должны быть одобрены кем-то вышестоящим, прежде чем изменение может быть внесено. Управление конфигурацией обеспечивает согласованность систем с помощью внешнего инструмента для жесткого контроля всех их параметров конфигурации. Обычно это достигается с помощью групповой политики или других инструментов, таких как Puppet/Chef и т. д. Контроль версий обеспечивает историю конфигурации.

Секретный соус — это ИТ-команда, которая знает, что, черт возьми, она делает. Все процессы и протоколы в мире не могут компенсировать плохие суждения и неопытных/неталантливых инженеров.

решение2

Лучший процесс, которому нужно следовать, это "нанять кого-то компетентного" imho. Если команда системных администраторов постоянно борется с пожарами и не прилагает никаких усилий для структурного улучшения своей среды, я бы посчитал их неподходящими для этой работы.

решение3

Вы нанимаете не капризная, надежная команда. Другого пути нет.

Похоже, у них некомпетентный админ. Админ может быть просто перегружен работой, не проводит тестирование и делает ошибки по ходу дела.

Вы могли бы купить их админкуПрактика системного и сетевого администрирования. Или они могли бы нанять кого-то, кто уже разбирается в этом деле.

Связанный контент