
請原諒英文:-)
我正在安裝 IBM 平台 HPC v4.2 以在高可用性模式下學習。
我的實驗室是:
- 物理機Fedora 25:用於共享儲存的nfs3
- VM1:管理器1:RHEL 6.5
- VM2:管理器2:RHEL 6.5
安裝過程如下:
- 在第一個管理器上安裝 phpc:manager1
- 在第二個管理器上安裝 phpc:manager2(使用相同的選項)
- 為 HA 配置 NFS3 共享(主目錄和資料)
- 觸發 manager1 上的 HA 安裝
所有這些步驟都已成功完成,但在 HA 安裝結束時,我無法登入 phpc webmin 介面,出現一些未運行的服務/守護程序的錯誤。
經過一番挖掘,我發現了問題,我想我至少有:-)
問題來自 ActiveMQ 進程,該進程啟動但未綁定到其連接埠(61616)。 - 該連接埠是免費的並在防火牆上打開。
activemq進程使用/opt/pcm/activemq/data來儲存它的日誌檔案、pid檔案和包含它的資料庫的kahadb目錄(我對activemq不太了解)。
在HA 模式下,資料目錄被複製到nfs3 共用中,安裝在/shared_phpc/opt/pcm/activemq/data 上,並在/opt/pcm/activemq/data 上的兩個管理器上建立一個符號連結以指向該目錄。
/opt/pcm/activemq/data -> /shared_phpc/opt/pcm/activemq/data
如果我重命名符號連結並使用真實目錄(由 HA 安裝程式備份),則 activemq 進程會成功啟動,但如果我使用符號連結則不會,它會啟動但不會綁定到它的連接埠。
我甚至刪除了共享資料目錄上的所有文件,看看是否是某些存取權限問題,但事實並非如此,activemq進程啟動,重新創建其日誌文件,pid文件,kahadb目錄,lock文件kahadb 目錄,但它不會創建kahadb 文件,並且無法正常啟動。
我的日誌檔案中沒有錯誤訊息,我現在不知道去哪裡查看。
提前致謝。