Diagnosticando problemas de replicação do MySQL

Question 1

Bem-vindo ao maravilhoso mundo da replicação MySQL. Eu não abordei seu problema específico, mas encontrei muitos outros problemas estranhos e a solução imediata é apenas ressincronizar do mestre como se fosse um escravo totalmente novo e pronto.

Answer

Bem-vindo ao maravilhoso mundo da replicação MySQL. Eu não abordei seu problema específico, mas encontrei muitos outros problemas estranhos e a solução imediata é apenas ressincronizar do mestre como se fosse um escravo totalmente novo e pronto.

Question 2

Você deve examinar o log de erros do escravo - geralmente é bastante explícito sobre qual é o problema.

Você deve ter os logs de erros do MySQL vinculados ao seu sistema de monitoramento, caso contrário, seus escravos serão potencialmente inúteis.

Além disso, você deve ter um monitor que verifique o status do escravo.

E para ter alguma utilidade, você também vai querer verificar a sincronização dos escravos de tempos em tempos, talvez usando algo como mk-table-checksum; idealmente, vincule os resultados disso também ao seu sistema de monitoramento.

Answer

Você deve examinar o log de erros do escravo - geralmente é bastante explícito sobre qual é o problema.

Você deve ter os logs de erros do MySQL vinculados ao seu sistema de monitoramento, caso contrário, seus escravos serão potencialmente inúteis.

Além disso, você deve ter um monitor que verifique o status do escravo.

E para ter alguma utilidade, você também vai querer verificar a sincronização dos escravos de tempos em tempos, talvez usando algo como mk-table-checksum; idealmente, vincule os resultados disso também ao seu sistema de monitoramento.

Question 3

Muitas pessoas configuram skip-slave-start para que possam ter certeza de que tudo está bem se um escravo parar de replicar antes de iniciá-lo. Tente executar 'start slave' e veja se algo muda ou se algo é registrado. Além disso, é estranho que o processo SlaveSQL esteja em execução e o SlaveIO não. É possível que os logs de retransmissão locais no escravo tenham sido corrompidos, embora issodeveser relatado nos logs. Você pode tentar desativar o Mysql e excluir os logs de retransmissão.

Answer

Muitas pessoas configuram skip-slave-start para que possam ter certeza de que tudo está bem se um escravo parar de replicar antes de iniciá-lo. Tente executar 'start slave' e veja se algo muda ou se algo é registrado. Além disso, é estranho que o processo SlaveSQL esteja em execução e o SlaveIO não. É possível que os logs de retransmissão locais no escravo tenham sido corrompidos, embora issodeveser relatado nos logs. Você pode tentar desativar o Mysql e excluir os logs de retransmissão.

Question 4

No relatório acima, encontrei o problema, este campo deve ser definido como (Slave_IO_Running): sim, mas no relatório acima está mostrando Slave_IO_Running: No.

Isso está causando o problema. Se esta variável for 'Não', o encadeamento IO foi interrompido. então não há mais replicação. Você terá que verificar Last_SQL_Errno e Last_SQL_Err para obter mais informações sobre a causa. Um número de erro 0 e uma mensagem de string vazia significam “sem erro”. O Last_SQL_Error aparece no log de erros do escravo.

Para corrigir esse problema, pare o escravo

Então defina:

mysql> SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1;

Isso diz ao escravo para pular uma consulta (que é a inválida que causou a parada da replicação). Se quiser pular duas consultas, você usaria SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 2; em vez disso e assim por diante.

Em seguida, reinicie o escravo e verifique os logs, esperando que isso resolva o problema...

Answer

No relatório acima, encontrei o problema, este campo deve ser definido como (Slave_IO_Running): sim, mas no relatório acima está mostrando Slave_IO_Running: No.

Isso está causando o problema. Se esta variável for 'Não', o encadeamento IO foi interrompido. então não há mais replicação. Você terá que verificar Last_SQL_Errno e Last_SQL_Err para obter mais informações sobre a causa. Um número de erro 0 e uma mensagem de string vazia significam “sem erro”. O Last_SQL_Error aparece no log de erros do escravo.

Para corrigir esse problema, pare o escravo

Então defina:

mysql> SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1;

Isso diz ao escravo para pular uma consulta (que é a inválida que causou a parada da replicação). Se quiser pular duas consultas, você usaria SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 2; em vez disso e assim por diante.

Em seguida, reinicie o escravo e verifique os logs, esperando que isso resolva o problema...

Diagnosticando problemas de replicação do MySQL

Responder1

Responder2

Responder3

Responder4

informação relacionada