O Micosoft HPC Pack 2012 R2 não é executado com Network Direct após ingressar em um novo domínio

O Micosoft HPC Pack 2012 R2 não é executado com Network Direct após ingressar em um novo domínio

Estou trabalhando com um cluster de 13 computadores, rodando no Windows Server 2012 R2, usando o MS HPC Pack 2012 R2. O headnode está funcionando corretamente. Os servidores são conectados à rede corporativa via IPv4 em adaptadores padrão. Os nós, entretanto, também estão conectados entre si via infiniBand.

Há uma semana, o cluster foi movido para um novo domínio, com os mesmos nomes de host. O FQDN mudou, é claro, e está se comportando corretamente em muitos aspectos, exceto que o Network Direct agora está definido como falso em todos os 12 nós de computação.

Após a migração, o nó principal teve todos os componentes HPC reinstalados. Os nós foram deixados intocados. Como pensei que esse era o motivo da ativação do Network Direct, também tentei reinstalar o HPC em um dos nós. Isso não resolveu o problema.

O Firewall do Windows está DESATIVADO em todos os níveis de todos os nós, incluindo o nó principal.

Em

  • Adaptador ifiniBand no headnode: Adaptador Mellanox ConnectX-3 Pro IPoIB
  • Adaptador inifiniBand em nós: Adaptador HP 10Gb/40Gb 2 portas 544+FLR-QSFP IPoIB

Os servidores respondem às solicitações PING nos IPs definidos para os adaptadores infiniBand.

Alguém tem alguma ideia sobre isso? Desde já, obrigado.

Responder1

Flash Mellanox NICs em Etherent para que tudo funcione de maneira confiável. InfiBand com Windows é uma PITA!

http://www.mellanox.com/page/firmware_table_ConnectX3IB

informação relacionada