Micosoft HPC Pack 2012 R2는 새 도메인에 가입한 후 Network Direct에서 실행되지 않습니다.

Micosoft HPC Pack 2012 R2는 새 도메인에 가입한 후 Network Direct에서 실행되지 않습니다.

저는 MS HPC Pack 2012 R2를 사용하여 Windows Server 2012 R2에서 실행되는 13대의 컴퓨터 클러스터로 작업하고 있습니다. 헤드노드가 제대로 작동하고 있습니다. 서버는 표준 어댑터의 IPv4를 통해 회사 네트워크에 연결됩니다. 그러나 노드는 infiniBand를 통해 서로 연결됩니다.

일주일 전에 클러스터는 동일한 호스트 이름을 가진 새 도메인으로 이동되었습니다. 물론 FQDN은 변경되었으며 Network Direct가 이제 12개의 컴퓨팅 노드 모두에서 false로 설정되어 있다는 점을 제외하면 대부분의 방식으로 올바르게 작동합니다.

마이그레이션 후 헤드 노드에는 모든 HPC 구성 요소가 다시 설치되었습니다. 노드는 그대로 유지되었습니다. 이것이 Network Direct가 활성화된 이유라고 생각했기 때문에 노드 중 하나에 HPC를 다시 설치해 보기도 했습니다. 문제가 해결되지 않았습니다.

헤드 노드를 포함하여 모든 노드의 모든 수준에서 Windows 방화벽이 꺼져 있습니다.

~ 안에

  • 헤드노드의 ifiniBand 어댑터: Mellanox ConnectX-3 Pro IPoIB 어댑터
  • 노드의 inifiniBand 어댑터: HP 10Gb/40Gb 2포트 544+FLR-QSFP IPoIB 어댑터

서버는 infiniBand 어댑터에 대해 설정된 IP에 대한 PING 요청에 응답합니다.

누구든지 이것에 대한 아이디어가 있습니까? 미리 감사드립니다.

답변1

Mellanox NIC를 Etherent로 플래시하면 모든 것이 안정적으로 작동합니다. Windows 기반 InfiBand는 정말 PITA입니다!

http://www.mellanox.com/page/firmware_table_ConnectX3IB

관련 정보