
Não sou administrador de TI, sou desenvolvedor de software (microsoft stack) e estou tentando entender o que há de errado com o ambiente de TI de um de nossos clientes.
Implantamos nossa solução cliente\servidor em uma empresa de médio porte. O problema é que o ambiente de TI dos clientes (principalmente vários tipos de servidores Microsoft - servidores SQL, SharePoint, Lync, servidores IIS, etc., etc.) parece ser extremamente caótico e instável. Constantemente parece haver uma falha de um sistema ou outro devido a um administrador ter reconfigurado algo em um servidor que afeta nosso software em execução nele. Está consumindo muito tempo de suporte para continuar e descobrir que um administrador alterou alguma configuração em um servidor que afeta nossa solução, em vez de qualquer coisa diretamente relacionada ao nosso software.
Não é apenas o nosso software, parece estar acontecendo em todos os seus sistemas e os administradores parecem estar constantemente combatendo incêndios. Assim que todos os dominós estão em pé, alguém muda algo que derruba 1 novamente...
Vou conversar com o gerente de TI, mas não tenho muito conhecimento sobre as práticas de administração de TI.
O que precisa ser observado ou questionado? No mundo da administração de TI, existe algum tipo de prática ou processo recomendado que possa resolver isso? Outras sugestões?
Responder1
Geralmente a confiabilidade em TI é fornecida por algumas práticas diferentes, a saber:
- Controle de acesso
- Mudar a gestão
- Gerenciamento de configurações
- Controle de revisão
- Molho secreto
O controle de acesso é simplesmente limitar quem pode fazer alterações em sistemas críticos/de produção. O gerenciamento de mudanças geralmente é feito por meio de controle de acesso e de um sistema de tickets. As solicitações devem ser aprovadas por alguém de nível superior antes que a alteração possa ser feita. O gerenciamento de configuração garante a consistência dos sistemas usando uma ferramenta externa para controlar rigorosamente todos os seus parâmetros de configuração. Isso geralmente é conseguido pela Política de Grupo ou outras ferramentas como Puppet/Chef/etc. O controle de revisão fornece um histórico da configuração.
The Secret Sauce é uma equipe de TI que sabe o que está fazendo. Todos os processos e protocolos do mundo não podem compensar o mau julgamento e os engenheiros inexperientes/sem talento.
Responder2
O melhor processo a seguir seria "contratar alguém competente". Se uma equipe de administradores de sistemas estiver constantemente combatendo incêndios e não fazendo nenhum esforço para melhorar estruturalmente seu ambiente, eu os consideraria inadequados para o trabalho.
Responder3
Você contrata funcionários confiáveis e não esquisitos. Não há outro caminho.
Parece que eles têm um administrador incompetente. O administrador pode simplesmente estar sobrecarregado, sem testar e cometendo erros ao longo do caminho.
Você poderia comprar o administrador delesA prática de administração de sistemas e redes. Ou poderiam contratar alguém que já conhece essas coisas.