A escolha da CPU afeta o orçamento de energia de um conjunto de servidores comuns?

A escolha da CPU afeta o orçamento de energia de um conjunto de servidores comuns?

Como a escolha da CPU afeta o orçamento de energia de um farm de servidores básicos? Estou me perguntando quanto custa por ano alimentar os tipos de servidores de commodities Facebook, Twitter e outros. usar.

Vamos pegar um servidor típico – um processador Intel Xeon X5650 – e uma carga típica com todos os 12 núcleos, cada um rodando com 90% da capacidade.

Qual seria o consumo anual de energia? Que suposições precisam ser feitas além do cenário acima? E quanto isso custaria para uma empresa operando na escala acima? Que tal resfriar. Quanto para resfriar esse servidor?

Se a carga fosse reduzida para, digamos, 45%, em que proporção os custos de energia e refrigeração diminuiriam?

Responder1

Sua pergunta original éinteiramentemuito amplo, pois é impossível fazer uma estimativa aproximada dos dólares reais, porque háapenasmuitas variáveis ​​envolvidas (centenas de milhares). Não vou nem tentar inventar um número. Em vez disso, discutirei apenas um aspecto específico dos custos de hospedagem: a CPU.


CPUs!

Os custos operacionais da CPU dependemfortementenogeraçãodo servidor.

PorgeraçãoQuero dizer, aproximadamente quando o processador foi lançado, mas mais importante ainda, em que arquitetura ele se baseia.

À medida que os processadores se tornaram mais complicados e avançados, eles também desenvolveram recursos de gerenciamento de energia mais sofisticados. Vamos dar uma olhada na evolução do gerenciamento de energia dos processadores Intel e ter em mente que todos os recursos sãocumulativoao longo do tempo, o que significa que se um recurso existia em um processador mais antigo, provavelmente existe em processadores mais novos, mas pode ser melhorado ou mais eficiente em gerações de processadores mais recentes.

Para um exemplo extremo, se você olhasse para um chip de servidor muito antigo, algo como umPentium II Xeon, você pode notar que a folha de especificações não menciona nada sobre a tecnologia de economia de energia. Este chip usará seu TDP máximo praticamente o tempo todo.

Algo um pouco mais novo (mas ainda muito antigo - ~2005), como umXeon3.80E, que é algo mais recente que o Pentium IV, mas mais antigo que a arquitetura "Core", começa a mostrar sinais de que a Intel está consciente da economia de energia: a "Tecnologia Intel SpeedStep" está listada na folha de dados do produto.

Vá em frente para um Xeon baseado em microarquitetura Core2 (~2008), como esteX5365, e você percebe várias coisas:

  • A CPU temEstados ociososfuncionalidade de economia de energia, o que significa que ele pode cair para um modo de baixo consumo de energia, em algum ponto entre estar "desligado" e "totalmente funcionando", quando não está fazendo nada ativamente. Ele pode alternar estados inativos dezenas ou centenas de vezes por segundo, para obter muitas economias de energia muito "refinadas".

  • A tecnologia SpeedStep que vimos antes agora éAprimoradoTecnologia SpeedStep, que é mais refinada, o que significa que a CPU pode cair para uma voltagem específica que se ajusta exatamente à carga de trabalho atual e, se a carga de trabalho aumentar ou diminuir, pode dimensionar tanto a velocidade do ventilador quanto o consumo de energia da CPU com base em a carga de trabalho muda (mesmo que a carga de trabalho flutue mais de uma vez por segundo).

  • Começando pela Microarquitetura Core, começamos a ver a Intel vendendo processadores Xeon com o prefixo “L”, para “Baixa tensão”. Esses processadores têm menor Thermal Design Power (TDP), o que significa que eles são projetados para operar consistentemente com menor consumo de energia (principalmente impulsionado pela operação em tensão mais baixa) do que seus equivalentes que consomem mais energia. Essas peças são oferecidas comouma opção, porque você pode obter um pouco mais de desempenho se usar peças comuns que consomem muita energia, que são prefixadas com um "E" ou "X".

  • A tecnologia Intel Demand-Based Switching é usada. Citando o site da Intel:

    Intel® Demand Based Switching é uma tecnologia de gerenciamento de energia na qual a tensão aplicada e a velocidade do clock de um microprocessador são mantidas nos níveis mínimos necessários até que mais poder de processamento seja necessário. Esta tecnologia foi introduzida como Tecnologia Intel SpeedStep® no mercado de servidores.

Avance para um Xeon baseado na microarquitetura Nehalem, como esteX3480, e você percebe várias coisas:

  • Tecnologia Intel Turbo Boost; esta CPU funcionará em velocidades muito eficientes em termos de energia (ótimo desempenho por watt) na maior parte do tempo, mas se a CPU obtiver picos de utilização muito altos, ela será capaz de exceder o TDP normal (para maior consumo de energia e menos eficiência) para fornecer mais desempenho no modo "Turbo".

  • Hiperthreading; isso significa que você pode executar quatro núcleos com desempenhoaproximarqual seria o desempenho com oito núcleos, mas com eficiência muito alta. Hyperthreading é um mecanismo de economia de custos e de energia, permitindo que você melhoredesempenho por watt(você coloca a mesma energia, mas obtém mais desempenho do que faria em processadoressemhiperthreading).

Vá em frente para um Westmere (Nehalem-C também conhecido como o psiquiatra de Nehalem)Xeon X5650, que é o que você perguntou em sua pergunta, e a situação é basicamente a mesma em termos de energia que o Nehalem original acima, exceto que você terá um uso de energia um pouco menor em geral, porque o tamanho de fabricação é menor.

Agora, depois de Westmere/Nehalem, temostrêsmais microarquiteturas serão necessárias para nos levar até os dias atuais:

  • Sandy Bridge, 2011, uma família de processadores de 32 nm com uma nova microarquitetura (também conhecida como “tock”);
  • Ivy Bridge, 2012, uma família de processadores de 22 nm baseada na microarquitetura Sandy Bridge, mas com menor consumo de energia e melhor eficiência energética (também conhecido como "tick-plus");
  • Haswell, 2013, uma família de processadores de 22 nm com uma nova microarquitetura (também conhecida como "tock").

Cada uma dessas gerações sucessivas de processadores nos proporcionou melhores recursos de gerenciamento de energia, já que esta é uma das principais áreas de foco da Intel no momento, por vários motivos:

  • Eles estão enviando tablets x86 com capacidades de bateria muito pequenas, que precisam de processadores com baixo consumo de energia.
  • Os datacenters querem reduzir os custos de energia e de aquecimento e refrigeração.
  • À medida que os usuários normais de desktops param de precisar de cada vez mais poder de computação, eles podem começar a reduzir seus custos de energia, produção de calor, etc., optando por processadores mais eficientes que oferecem melhorias de desempenho mais modestas, mas reduzem drasticamente o uso de energia.
  • À medida que os processadores se tornam mais complicados internamente, há mais espaço para lógicas e circuitos complicados que calculam exatamente quanta energia é necessária para fornecer a carga de trabalho atual de forma eficiente, ao mesmo tempo que mantém o desperdício no mínimo absoluto. A Intel investiu pesadamente nesta tecnologia nas últimas gerações de CPU.

  • Um Xeon de baixa tensão Sandy Bridge, como oE3-1260L, ébastanteeficiente, ao mesmo tempo que é quad-core com hyperthreading. Seu TDP de 45 Watts não deve ser considerado um indicador de lentidão; longe disso - é muito mais rápido do que os processadores TDP de 105 W de apenas alguns anos antes.

  • Um Xeon de baixa tensão Ivy Bridge, como oE3-1265L v2, é ainda mais eficiente que o 1260L, ainda com um TDP de 45 Watts, mas com desempenho significativamente melhor e um regulador de tensão na CPU para uma resposta de mudança de tensão extremamente rápida.

  • Um Xeon de baixa tensão Haswell, como oE3-1265Lv3, é o auge do que está atualmente disponível no mercado em termos de eficiência energética, ainda com um TDP de 45 Watts, mas ainda com melhor desempenho e mais economia de energia.

Claro, fora da categoria de baixa tensão, também existem Xeons de maior desempenho nas séries recentes, como o bestial15 núcleosE7-8890 v2, com lançamento previsto para o primeiro trimestre de 2014, que é incrivelmente topo de linha, com um TDP de 155 Watts (muito grande para uma CPU) - a grande diferença é que, com todos aqueles núcleos de ponta, este processador pode fazerbastantemais do que um chip de baixa tensão.

No geral, o seu X5650, sendo quatro gerações distante da geração atual (ele tem apenas 6 núcleos com hyperthreading, a propósito, não 12 núcleos), vai rivalizar com algo como um Xeon de marca "E3" quad-core de nível de commodity. das gerações Ivy Bridge ou Haswell, embora tenha mais núcleos. As CPUs mais recentes têm uma frequência de clock mais alta, mais cache L3, suportam RAM mais rápida e são mais eficientes em termos de energia do que um X5650 mais antigo, o que significa que serão capazes de acompanhá-lo mesmo que tenham menos núcleos.


Impacto do ajuste de carga no custo

Se a carga fosse reduzida para, digamos, 45%, em que proporção os custos de energia e refrigeração diminuiriam?

Bem, com base no que sabemos acima, se as CPUs fossem CPUs modernas (Sandy Bridge, Ivy Bridge ou Haswell), é provável que os custos de energia e refrigeraçãoapenas para a CPU(para não falar da placa-mãe, disco rígido, RAM, etc.) provavelmente cairiaaproximadamente linearmentecom carga reduzida. De qualquer forma, esse é o objetivo final: se você quiser um número X de instruções por segundo, custará $AAA; se você quiser um número X*10 de instruções por segundo, custará $YYY*10. As escalas lineares proporcionam uma economia muito previsível, e é isso que a Intel pretende.

É claro que as CPUs da geração mais antiga não chegavam nem perto de serem lineares, porque desperdiçavam muita energia simplesmente ficando ociosas, e mesmo quando estavam totalmente utilizadas, não estavam fazendo o melhor uso dos recursos disponíveis, porque faltavam recursos como HyperThreading.


Tentar (muito vagamente) esboçar como abordar uma resposta à sua pergunta original

Agora que você conhece todos esses detalhes sobre CPUs, vou lhe contar um segredo: as CPUs não representam a maior parte dos custos operacionais dos principais sites. Os maiores custos sãofuncionários,instalações(imóveis, terrenos, datacenters, etc.), eresfriamento.

Para chegar a um custo operacional "traseiro" para algo como Facebook ou Twitter, você deve considerar o seguinte:

  • Mesmo que usem as CPUs mais novas, eles ainda pagam pela eletricidade para resfriamento (custa menos, obviamente, se o ambiente externo estiver muito frio, em comparação com o verão, quando pode custar muito caro manter os servidores resfriados). Os custos de resfriamento variam dependendo se eles estão usando energia "fora da rede" (eólica, solar) ou comprando eletricidade da concessionária, que pode produzi-la a partir de carvão ou nuclear, etc. , uma vez que os custos de energia variam de região para região, dependendo da origem da energia, da procura existente, etc.

  • Placas-mãe, discos rígidos, SSDs, RAM, ventiladores de resfriamento, equipamentos de rede, iluminação, equipamentos de segurança, escritórios para funcionários, etc., todos consomem energia adicional e os custos incorridos aqui podem variardescontroladamentedependendo da eficiência com que a operação está sendo executada.

  • Os custos das instalações dependerão de quanta ênfase é colocada na segurança e proteção. Por exemplo, os geradores diesel de reserva incorrem num custo significativo, tanto em termos de combustível, testes regulares do correto funcionamento dos geradores, baterias (para manter uma energia consistente enquanto os geradores diesel arrancam), etc. está mais propenso a sofrer interrupções totais no caso de uma falha de energia principal, mas os custos operacionais diários diminuirão significativamente. Além disso, os custos aumentam com coisas como câmeras de segurança, guardas armados, leitores de crachás, etc., que também podem ser considerados “extras opcionais” se você estiver realmente tentando praticar o básico.

  • Você também tem que refinar odefinição da pergunta que você está fazendopara chegar a números precisos. Por exemplo, os especialistas de suporte de TI, que mantêm o hardware e a rede do servidor, são considerados parte do custo da operação de um datacenter? Os programadores que escrevem o software são levados em consideração no custo? E os administradores de sistema? E os gerentes? E os zeladores que limpam o chão e substituem as lâmpadas? E quanto aos impostos que devem ao governo? Onde você para de medir os custos? Tudo isso faz parte da definição do seu problema e, como não sou vidente e não sei exatamente o que você está perguntando, não tentarei responder a nenhuma dessas perguntas. A maioria deles está fora do assunto do SuperUser, de qualquer maneira.

Dito tudo isso, estouaindanão farei estimativas aproximadas em termos de dólares. Você terá que descobrir isso por conta própria, com base em quaisquer suposições que queira fazer sobre os procedimentos operacionais da empresa, custo de eletricidade, temperatura externa, custo de mão de obra, etc.

informação relacionada