CentOS8.2에서 기존 QLogic IBA7322 Infiniband 카드를 부활시킵니다.

CentOS8.2에서 기존 QLogic IBA7322 Infiniband 카드를 부활시킵니다.

CentOS 8에서 사용하고 싶은 QLogic Infiniband 카드 IBA7322가 장착된 HP Blades Gen7이 몇 개 있습니다. 문제는 이에 적합한 드라이버를 찾을 수 없다는 것입니다. 내가 찾은 모든 정보는 오래되었거나 링크가 작동하지 않습니다(예: Marvell 다운로드 링크).

lspci를 사용하여 카드를 볼 수 있지만 그 외에는 카드를 켤 기회가 없었습니다.

누구든지 이 문제에 대해 어떤 방향으로 나에게 지시할 수 있습니까?

건배.

편집하다:

결과 lspci -vv:

01:00.0 InfiniBand: QLogic Corp. IBA7322 QDR InfiniBand HCA (rev 02)
        Subsystem: Hewlett-Packard Company Device 178a
        Physical Slot: 0
        Control: I/O+ Mem+ BusMaster- SpecCycle- MemWINV- VGASnoop- ParErr+ Stepping- SERR+ FastB2B- DisINTx-
        Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
        Interrupt: pin A routed to IRQ 10
        Region 0: Memory at fd400000 (64-bit, non-prefetchable) [size=4M]
        Capabilities: [40] Power Management version 3
                Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0-,D1-,D2-,D3hot-,D3cold-)
                Status: D0 NoSoftRst- PME-Enable- DSel=0 DScale=0 PME-
        Capabilities: [70] Express (v2) Endpoint, MSI 00
                DevCap: MaxPayload 512 bytes, PhantFunc 0, Latency L0s <64ns, L1 <1us
                        ExtTag- AttnBtn- AttnInd- PwrInd- RBE+ FLReset- SlotPowerLimit 0.000W
                DevCtl: Report errors: Correctable+ Non-Fatal+ Fatal+ Unsupported+
                        RlxdOrd+ ExtTag- PhantFunc- AuxPwr- NoSnoop-
                        MaxPayload 128 bytes, MaxReadReq 4096 bytes
                DevSta: CorrErr- UncorrErr- FatalErr- UnsuppReq- AuxPwr- TransPend-
                LnkCap: Port #0, Speed 5GT/s, Width x8, ASPM L0s, Exit Latency L0s <4us
                        ClockPM- Surprise- LLActRep- BwNot- ASPMOptComp-
                LnkCtl: ASPM Disabled; RCB 64 bytes Disabled- CommClk+
                        ExtSynch- ClockPM- AutWidDis- BWInt- AutBWInt-
                LnkSta: Speed 5GT/s, Width x8, TrErr- Train- SlotClk+ DLActive- BWMgmt- ABWMgmt-
                DevCap2: Completion Timeout: Not Supported, TimeoutDis+, LTR-, OBFF Not Supported
                         AtomicOpsCap: 32bit- 64bit- 128bitCAS-
                DevCtl2: Completion Timeout: 50us to 50ms, TimeoutDis-, LTR-, OBFF Disabled
                         AtomicOpsCtl: ReqEn-
                LnkCtl2: Target Link Speed: 5GT/s, EnterCompliance- SpeedDis-
                         Transmit Margin: Normal Operating Range, EnterModifiedCompliance- ComplianceSOS-
                         Compliance De-emphasis: -6dB
                LnkSta2: Current De-emphasis Level: -6dB, EqualizationComplete-, EqualizationPhase1-
                         EqualizationPhase2-, EqualizationPhase3-, LinkEqualizationRequest-
        Capabilities: [b0] MSI-X: Enable- Count=32 Masked-
                Vector table: BAR=0 offset=00008000
                PBA: BAR=0 offset=00009000
        Capabilities: [100 v1] Advanced Error Reporting
                UESta:  DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt- UnxCmplt- RxOF- MalfTLP- ECRC- UnsupReq- ACSViol-
                UEMsk:  DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt- UnxCmplt- RxOF- MalfTLP- ECRC- UnsupReq+ ACSViol-
                UESvrt: DLP- SDES+ TLP- FCP- CmpltTO- CmpltAbrt- UnxCmplt- RxOF- MalfTLP- ECRC- UnsupReq- ACSViol-
                CESta:  RxErr- BadTLP- BadDLLP- Rollover- Timeout- NonFatalErr-
                CEMsk:  RxErr- BadTLP- BadDLLP- Rollover- Timeout- NonFatalErr-
                AERCap: First Error Pointer: 00, ECRCGenCap+ ECRCGenEn- ECRCChkCap+ ECRCChkEn-
                        MultHdrRecCap- MultHdrRecEn- TLPPfxPres- HdrLogCap-
                HeaderLog: 00000000 00000000 00000000 00000000

답변1

가장 먼저 해야 할 일은 문제의 하드웨어에 대한 PCI 공급업체 및 장치 ID를 얻는 것입니다. 귀하의 카드는 1077:7322인 것 같습니다. ㅏ한눈에Linux 드라이버 데이터베이스에서 이 카드가 ib_qib 드라이버를 사용한다고 알려줍니다.

RHEL 문서를 살펴보았습니다.RHEL 8에서 드라이버 제거, 그러나 이 드라이버를 보지 못했습니다. 그러나 RHEL 8 VM을 실행했는데 드라이버가 더 이상 존재하지 않으며 해당 커널 구성에서 활성화되지 않습니다. 그러나 RHEL 7에는 존재합니다.

이러한 상황에서 사람들이 일반적으로 하는 일은 오래된 하드웨어를 사용하기 위해엘레포RHEL 8의 경우 누락된 ib_qib 드라이버(및 Red Hat이 삭제한 기타 여러 드라이버)가 포함된 리포지토리입니다. 예를 들어:

dnf install https://www.elrepo.org/elrepo-release-8.el8.elrepo.noarch.rpm
dnf install kmod-ib_qib

답변2

많은 시도 끝에 내 친구는 Mary에게 환호를 보내고 Rocky 8.5에서 4.19 커널을 다시 컴파일하고 qib드라이버를 활성화했습니다. 그것은 계속해서 존재했지만 기본 커널에서 컴파일되지 않았습니다.

이제 이전 QLogic 카드가 다시 작동하게 되었습니다. 서브넷 관리자를 실행하는 Mellanox Infiniband 스위치에 연결되어 있습니다.

노드는 노드 간에 40Gbps로 통신할 수 있으며 훨씬 새로운 100Gbps Mellanox ConnectX5 카드와도 통신할 수 있습니다.

이제 인피니밴드 랜드에서는 모든 것이 괜찮습니다!

이것이 누군가에게 도움이 되기를 바라며 질문이 있으면 최선을 다해 답변해 드리겠습니다. 나는 이런 일에 전문가가 아니라는 점을 명심하십시오. 뭔가를 알아내고 오래된 장비를 다시 관련되게 만들어야 하는 사람일 뿐입니다!

관련 정보