Marcapasos de Linux: previene la división del cerebro

Question 1

Nunca he configurado un tiempo de espera de token en Corosync a más de 10 segundos, pero puedes intentar aumentar/establecer el tokenvalor en corosync.conf( 120000120 segundos en milisegundos). tokendebe estar definido en la totem{}sección de su corosync.conf; man corosync.confpara más detalles.

Eso debería evitar que Corosync declare un nodo muerto durante 120 segundos cuando la red falla.

Answer

Nunca he configurado un tiempo de espera de token en Corosync a más de 10 segundos, pero puedes intentar aumentar/establecer el tokenvalor en corosync.conf( 120000120 segundos en milisegundos). tokendebe estar definido en la totem{}sección de su corosync.conf; man corosync.confpara más detalles.

Eso debería evitar que Corosync declare un nodo muerto durante 120 segundos cuando la red falla.

Question 2

Puede cambiar el intervalo de monitoreo del recurso op monitor interval=Nsdonde Nestá el número de segundos y luego configurar el migration-thresholdrecurso en 2. Tenga en cuenta que con una configuración 120spodría ver un retraso total de 120 a 240 s dependiendo de cuándo ocurre la falla inicial en el intervalo de monitoreo.

Hay otras advertencias al respecto, ya que el contador de fallas aplicado migration-thresholdno se reinicia en caso de éxito. Para hacer eso, también necesitarás configurar failure-timeouto intervenir manualmente.

Con op monitor interval=120s, y su configuración, deberá realizar pruebas para asegurarse de que proporcione la funcionalidad que espera y cómo se comportan los contadores de fallas cuando se recupera el maestro original migration-threshold=2. Podría requerir intervención manual pero no estoy 100% seguro de eso.failure-timeout=121sresource-stickiness

Answer

Puede cambiar el intervalo de monitoreo del recurso op monitor interval=Nsdonde Nestá el número de segundos y luego configurar el migration-thresholdrecurso en 2. Tenga en cuenta que con una configuración 120spodría ver un retraso total de 120 a 240 s dependiendo de cuándo ocurre la falla inicial en el intervalo de monitoreo.

Hay otras advertencias al respecto, ya que el contador de fallas aplicado migration-thresholdno se reinicia en caso de éxito. Para hacer eso, también necesitarás configurar failure-timeouto intervenir manualmente.

Con op monitor interval=120s, y su configuración, deberá realizar pruebas para asegurarse de que proporcione la funcionalidad que espera y cómo se comportan los contadores de fallas cuando se recupera el maestro original migration-threshold=2. Podría requerir intervención manual pero no estoy 100% seguro de eso.failure-timeout=121sresource-stickiness

Marcapasos de Linux: previene la división del cerebro

Respuesta1

Respuesta2

información relacionada