
и извините за английский :-)
Я устанавливаю платформу IBM HPC v4.2 в учебных целях в режиме высокой доступности.
Моя лаборатория:
- физическая машина Fedora 25: nfs3 для общего хранилища
- VM1: менеджер1: RHEL 6.5
- VM2: менеджер2: RHEL 6.5
Установка происходит следующим образом:
- установить phpc на первого менеджера: manager1
- установить phpc на втором менеджере: manager2 (используя те же параметры)
- настроить общий ресурс NFS3 (домашний и для данных) для HA
- запустить установку HA на manager1
Все эти шаги были выполнены успешно, но в конце установки HA я не смог войти в интерфейс phpc webmin, возникла ошибка некоторых служб/демонов, которые не запущены.
После некоторых поисков я нашел проблему, по крайней мере, я думаю, что нашел :-)
Проблема возникает из-за процесса ActiveMQ, процесс запускается, но не привязывается к своему порту (61616). - порт свободен и открыт на брандмауэре.
Процесс activemq использует /opt/pcm/activemq/data для хранения своего файла журнала, pid-файла и каталога kahadb, содержащего его базу данных (я не слишком много знаю об activemq).
В режиме HA каталог данных копируется в общий ресурс nfs3, монтируется в /shared_phpc/opt/pcm/activemq/data, и на обоих менеджерах в /opt/pcm/activemq/data создается символическая ссылка, указывающая на этот каталог.
/opt/pcm/activemq/data -> /shared_phpc/opt/pcm/activemq/data
Если я переименую символическую ссылку и использую реальный каталог (резервную копию которого создал установщик HA), процесс activemq успешно запустится, но если я использую символическую ссылку, то этого не произойдет, он запустится, но не привяжется к своему порту.
Я даже удалил все файлы в каталоге общих данных, чтобы проверить, не связана ли проблема с правами доступа, но ее не было: процесс activemq запускается, заново создает свой файл журнала, файл pid, каталог kahadb, файл блокировки в каталоге kahadb, но не создает файлы kahadb и не запускается должным образом.
В файле журнала нет сообщений об ошибках, теперь не знаю, где искать.
Заранее спасибо.