
英語が下手で申し訳ありません :-)
学習目的で、高可用性モードで IBM プラットフォーム HPC v4.2 をインストールしています。
私の研究室は:
- 物理マシン Fedora 25 : 共有ストレージ用の nfs3
- VM1: マネージャー1: RHEL 6.5
- VM2: マネージャー2: RHEL 6.5
インストールは次のようになります:
- 最初のマネージャーにphpcをインストールします: manager1
- 2番目のマネージャーにphpcをインストールします: manager2 (同じオプションを使用)
- HA 用に NFS3 共有 (ホームとデータ) を構成する
- manager1 で HA インストールをトリガーする
これらの手順はすべて正常に完了しましたが、HA インストールの最後に、phpc webmin インターフェイスにログインできず、一部のサービス/デーモンが実行されていないというエラーが発生しました。
少し調べた後、問題を見つけました。少なくとも私の場合は見つかったと思います :-)
この問題は ActiveMQ プロセスに起因しています。プロセスは開始されますが、ポート (61616) にバインドされません。 - ポートは空いており、ファイアウォール上で開いています。
activemq プロセスは、/opt/pcm/activemq/data を使用して、ログ ファイル、pid ファイル、およびデータベースを含む kahadb ディレクトリを保存します (activemq についてはあまり詳しくありません)。
HA モードでは、データ ディレクトリが nfs3 共有にコピーされ、/shared_phpc/opt/pcm/activemq/data にマウントされ、両方のマネージャーの /opt/pcm/activemq/data にそのディレクトリを指すシンボリック リンクが作成されます。
/opt/pcm/activemq/data -> /shared_phpc/opt/pcm/activemq/data
シンボリック リンクの名前を変更して実際のディレクトリ (HA インストーラによってバックアップされた) を使用すると、activemq プロセスは正常に起動しますが、シンボリック リンクを使用すると起動せず、ポートにバインドされません。
アクセス権の問題かどうかを確認するために共有データ ディレクトリ上のすべてのファイルを削除しましたが、問題はありませんでした。activemq プロセスが起動し、ログ ファイル、pid ファイル、kahadb ディレクトリ、kahadb ディレクトリ内のロック ファイルが再作成されますが、kahadb ファイルは作成されず、正常に起動しません。
ログ ファイルにエラー メッセージが表示されていないため、どこを確認すればよいかわかりません。
前もって感謝します。