Como depurar e evitar ambientes de TI instáveis ​​e não confiáveis?

Como depurar e evitar ambientes de TI instáveis ​​e não confiáveis?

Não sou administrador de TI, sou desenvolvedor de software (microsoft stack) e estou tentando entender o que há de errado com o ambiente de TI de um de nossos clientes.

Implantamos nossa solução cliente\servidor em uma empresa de médio porte. O problema é que o ambiente de TI dos clientes (principalmente vários tipos de servidores Microsoft - servidores SQL, SharePoint, Lync, servidores IIS, etc., etc.) parece ser extremamente caótico e instável. Constantemente parece haver uma falha de um sistema ou outro devido a um administrador ter reconfigurado algo em um servidor que afeta nosso software em execução nele. Está consumindo muito tempo de suporte para continuar e descobrir que um administrador alterou alguma configuração em um servidor que afeta nossa solução, em vez de qualquer coisa diretamente relacionada ao nosso software.

Não é apenas o nosso software, parece estar acontecendo em todos os seus sistemas e os administradores parecem estar constantemente combatendo incêndios. Assim que todos os dominós estão em pé, alguém muda algo que derruba 1 novamente...

Vou conversar com o gerente de TI, mas não tenho muito conhecimento sobre as práticas de administração de TI.

O que precisa ser observado ou questionado? No mundo da administração de TI, existe algum tipo de prática ou processo recomendado que possa resolver isso? Outras sugestões?

Responder1

Geralmente a confiabilidade em TI é fornecida por algumas práticas diferentes, a saber:

  • Controle de acesso
  • Mudar a gestão
  • Gerenciamento de configurações
  • Controle de revisão
  • Molho secreto

O controle de acesso é simplesmente limitar quem pode fazer alterações em sistemas críticos/de produção. O gerenciamento de mudanças geralmente é feito por meio de controle de acesso e de um sistema de tickets. As solicitações devem ser aprovadas por alguém de nível superior antes que a alteração possa ser feita. O gerenciamento de configuração garante a consistência dos sistemas usando uma ferramenta externa para controlar rigorosamente todos os seus parâmetros de configuração. Isso geralmente é conseguido pela Política de Grupo ou outras ferramentas como Puppet/Chef/etc. O controle de revisão fornece um histórico da configuração.

The Secret Sauce é uma equipe de TI que sabe o que está fazendo. Todos os processos e protocolos do mundo não podem compensar o mau julgamento e os engenheiros inexperientes/sem talento.

Responder2

O melhor processo a seguir seria "contratar alguém competente". Se uma equipe de administradores de sistemas estiver constantemente combatendo incêndios e não fazendo nenhum esforço para melhorar estruturalmente seu ambiente, eu os consideraria inadequados para o trabalho.

Responder3

Você contrata funcionários confiáveis ​​e não esquisitos. Não há outro caminho.

Parece que eles têm um administrador incompetente. O administrador pode simplesmente estar sobrecarregado, sem testar e cometendo erros ao longo do caminho.

Você poderia comprar o administrador delesA prática de administração de sistemas e redes. Ou poderiam contratar alguém que já conhece essas coisas.

informação relacionada