Actualizar:
Una investigación más profunda muestra que los contenedores LXC no obtenían direcciones IP durante la instalación.
Pero si se dejan durante varias horas, los contenedores LXC eventualmente obtienen una IP del MAAS.
Así que esta mañana tomé el clúster y lo moví de un conmutador Cisco L3 muy caro a un conmutador Dell L2 barato. Todos los contenedores LXC obtienen instantáneamente las direcciones DHCP y el instalador de Openstack se completa sin ningún problema. Probablemente debamos realizar algún tipo de configuración en el conmutador Cisco, pero por el momento mantendremos la red simple mientras jugamos con el software en nuestro laboratorio.
¡Se ha dedicado mucho tiempo a este tema bastante irritante y extraño! Muchas gracias por tu esfuerzo.
Tenemos una pila de máquinas de 5 nodos que están configuradas en MAAS.
Suben y bajan muy bien, sin embargo, la implementación de Openstack Autopilot de Ubuntu falla con:
./cloud-install/commands.log:
http://paste.ubuntu.com/10676002/
machine-0.log:
2015-03-24 16:49:19 ERROR juju.worker runner.go:219 exited "api": unable to connect to "wss://localhost:17070/"
2015-03-24 16:49:22 ERROR juju.rpc server.go:554 error writing response: EOF
2015-03-24 16:49:45 ERROR juju.state.unit unit.go:665 unit apache2/0 cannot get assigned machine: unit "apache2/0" is not assigned to a machine
2015-03-24 16:49:45 ERROR juju.state.unit unit.go:665 unit apache2/0 cannot get assigned machine: unit "apache2/0" is not assigned to a machine
2015-03-24 16:49:50 ERROR juju.state.unit unit.go:665 unit haproxy/0 cannot get assigned machine: unit "haproxy/0" is not assigned to a machine
2015-03-24 16:49:50 ERROR juju.state.unit unit.go:665 unit haproxy/0 cannot get assigned machine: unit "haproxy/0" is not assigned to a machine
-- Más registros
Desde la máquina de arranque juju:
/var/log/juju/all-machines.log
http://paste.ubuntu.com/10724991/
No puedo entender esto, solo muestra lo siguiente una y otra vez hasta que falla:
machine-0: 2015-04-02 13:50:10 INFO juju.worker runner.go:261 start "api"
machine-0: 2015-04-02 13:50:10 INFO juju.api apiclient.go:252 dialing "wss://localhost:17070/"
machine-0: 2015-04-02 13:50:10 INFO juju.api apiclient.go:260 error dialing "wss://localhost:17070/": websocket.Dial wss://localhost:17070/: dial tcp 127.0.0.1:17070: connection refused
machine-0: 2015-04-02 13:50:10 ERROR juju.worker runner.go:219 exited "api": unable to connect to "wss://localhost:17070/"
machine-0: 2015-04-02 13:50:10 INFO juju.worker runner.go:253 restarting "api" in 3s
No estoy seguro de si esto está relacionado, pero tengo una implementación funcional en un laboratorio diferente y la única diferencia que veo es que en el laboratorio que no funciona en el nodo juju boostrap el /var/lib/juju/agents/machine-0/agent.conf
valor SECURE_STATESERVER_CONNECTION: "true"
está establecido y la versión es 1.22.0
.
SECURE_STATESERVER_CONNECTION: "true"
Falta el entorno de trabajo y la versión es 1.21.3
.
Respuesta1
Agregaré una respuesta general aquí que podría ayudar a otros.
Cuando nos encontramos con problemas de este tipo, en los que no está claro qué está fallando, la sugerencia general es ir de forma sencilla.
En este caso, intente aprovisionar nodos en MAAS directamente con juju en lugar de utilizar el instalador de la nube. Debería ser mucho más fácil y rápido depurar.
Esta URL tiene instrucciones sobre cómo usar juju con MAAS directamente:https://maas.ubuntu.com/docs1.7/juju-quick-start.html