
y disculpen los ingleses :-)
Estoy instalando la plataforma IBM HPC v4.2 con fines de aprendizaje en modo de alta disponibilidad.
Mi laboratorio es:
- máquina física Fedora 25: nfs3 para almacenamiento compartido
- VM1: administrador1: RHEL 6.5
- VM2: administrador2: RHEL 6.5
La instalación es la siguiente:
- instale phpc en el primer administrador: manager1
- instale phpc en el segundo administrador: manager2 (usando las mismas opciones)
- configurar un recurso compartido NFS3 (hogar y datos) para HA
- desencadenar la instalación de HA en manager1
Todos estos pasos se realizaron exitosamente, pero al final de la instalación de HA, no pude iniciar sesión en la interfaz phpc webmin, tuve un error de algunos servicios/demonios que no se están ejecutando.
Después de investigar un poco, encontré el problema, creo que al menos lo tengo :-)
El problema proviene del proceso ActiveMQ, el proceso se inicia pero no se vincula a su puerto (61616). - el puerto está libre y abierto en el firewall.
El proceso activemq usa /opt/pcm/activemq/data para almacenar su archivo de registro, archivo pid y directorio kahadb que contiene su base de datos (no sé mucho sobre activemq).
En el modo HA, el directorio de datos se copia en el recurso compartido nfs3, se monta en /shared_phpc/opt/pcm/activemq/data, y se crea un enlace simbólico en ambos administradores en /opt/pcm/activemq/data para apuntar a ese directorio.
/opt/pcm/activemq/data -> /shared_phpc/opt/pcm/activemq/data
Si cambio el nombre del enlace simbólico y uso el directorio real (que fue respaldado por el instalador de HA), el proceso activemq se inicia exitosamente, pero si uso el enlace simbólico no lo hace, se inicia pero no se vincula a su puerto.
Incluso eliminé todos los archivos en el directorio de datos compartidos para ver si se trataba de algún problema de derechos de acceso, pero no fue así, el proceso activemq comienza, recrea su archivo de registro, su archivo pid, el directorio kahadb, el archivo de bloqueo en el directorio kahadb, pero no crea los archivos kahadb y no se inicia correctamente.
No tengo mensajes de error en el archivo de registro, no sé dónde buscar ahora.
Gracias de antemano.