Wir verwalten für einen unserer Kunden einen MySQL-Server mit >100 Datenbanken mit jeweils ca. 50 Tabellen, viele davon InnoDB-Tabellen. Der Server ist abgestürzt und ich versuche, den Übeltäter zu finden. Beim Neustart mit innodb_force_recovery = 2
kann ich eine Verbindung herstellen und sehe keine Fehler im error.log. Noch wichtiger: mysqlcheck --all-databases
Für alle Tabellen wird „Ok“ gemeldet. Aber wenn ich entferne innodb_force_recovery
, stürzt der Server erneut ab, schreibt einen Stacktrace in error.log und kann nur mit gestoppt werden kill -9
.
Wie soll ich unter diesen Umständen die fehlerhafte Datenbank finden und was würde dazu führen, dass mysqlcheck die beschädigten Tabellen übersieht? Bitte sagen Sie mir nicht, dass ich es einfach ignorieren und alle Datenbanken aus Dumps wiederherstellen soll. Das mag für eine oder zwei Datenbanken akzeptabel sein und wenn es nur alle Jubeljahre einmal vorkommt, aber ich hatte mehr als einmal Probleme mit demselben Server und alles aus Dumps wiederherzustellen erfordert einfach zu viel Zeit und manuelle Arbeit, um das jedes Mal zu tun.
Die Serverversion ist 5.5.46 und innodb_file_per_table
aktiv.
Auszug aus error.log wie gewünscht ( The tablespace free space info is corrupt
heißt das, es liegt ein Fehler vor, der nicht in einer bestimmten Tabelle steht und nicht behoben werden kann?):
180222 17:13:48 mysqld_safe Starting mysqld daemon with databases from /home/mysql
180222 17:13:48 [Warning] 'THREAD_CONCURRENCY' is deprecated and will be removed in a future release.
180222 17:13:48 [Note] /usr/libexec/mysqld (mysqld 5.5.46) starting as process 26242 ...
180222 17:13:48 [Note] Plugin 'FEDERATED' is disabled.
180222 17:13:48 InnoDB: The InnoDB memory heap is disabled
180222 17:13:48 InnoDB: Mutexes and rw_locks use InnoDB's own implementation
180222 17:13:48 InnoDB: Compressed tables use zlib 1.2.3
180222 17:13:48 InnoDB: Using Linux native AIO
180222 17:13:48 InnoDB: Initializing buffer pool, size = 128.0M
180222 17:13:49 InnoDB: Completed initialization of buffer pool
180222 17:13:49 InnoDB: highest supported file format is Barracuda.
180222 17:13:49 InnoDB: Waiting for the background threads to start
180222 17:13:50 InnoDB: 5.5.46 started; log sequence number 1632912830888
180222 17:13:50 [Note] Server hostname (bind-address): '0.0.0.0'; port: 3306
180222 17:13:50 [Note] - '0.0.0.0' resolves to '0.0.0.0';
180222 17:13:50 [Note] Server socket created on IP: '0.0.0.0'.
180222 17:13:50 [Note] Event Scheduler: Loaded 0 events
180222 17:13:50 [Note] /usr/libexec/mysqld: ready for connections.
Version: '5.5.46' socket: '/var/lib/mysql/mysql.sock' port: 3306 MySQL Community Server (GPL) by Remi
InnoDB: Dump of the tablespace extent descriptor: len 40; hex 000000000000000200000000061600000000126e00000004ffffffffffffffffffffffffffffbfaa; asc n ;
InnoDB: Serious error! InnoDB is trying to free page 512
InnoDB: though it is already marked as free in the tablespace!
InnoDB: The tablespace free space info is corrupt.
InnoDB: You may need to dump your InnoDB tables and recreate the whole
InnoDB: database!
InnoDB: Please refer to
InnoDB: http://dev.mysql.com/doc/refman/5.5/en/forcing-innodb-recovery.html
InnoDB: about forcing recovery.
180222 17:13:50 InnoDB: Assertion failure in thread 2499464080 in file fsp0fsp.c line 3309
InnoDB: We intentionally generate a memory trap.
InnoDB: Submit a detailed bug report to http://bugs.mysql.com.
InnoDB: If you get repeated assertion failures or crashes, even
InnoDB: immediately after the mysqld startup, there may be
InnoDB: corruption in the InnoDB tablespace. Please refer to
InnoDB: http://dev.mysql.com/doc/refman/5.5/en/forcing-innodb-recovery.html
InnoDB: about forcing recovery.
16:13:50 UTC - mysqld got signal 6 ;
This could be because you hit a bug. It is also possible that this binary
or one of the libraries it was linked against is corrupt, improperly built,
or misconfigured. This error can also be caused by malfunctioning hardware.
We will try our best to scrape up some info that will hopefully help
diagnose the problem, but since we have already crashed,
something is definitely wrong and this may fail.
key_buffer_size=268435456
read_buffer_size=1048576
max_used_connections=0
max_threads=512
thread_count=0
connection_count=0
It is possible that mysqld could use up to
key_buffer_size + (read_buffer_size + sort_buffer_size)*max_threads = 1314506 K bytes of memory
Hope that's ok; if not, decrease some variables in the equation.
Thread pointer: 0x0
Attempting backtrace. You can use the following information to find out
where mysqld died. If you see no messages after this, something went
terribly wrong...
stack_bottom = 0 thread_stack 0x30000
/usr/libexec/mysqld(my_print_stacktrace+0x33)[0x842a1f3]
/usr/libexec/mysqld(handle_fatal_signal+0x42b)[0x82d9d3b]
[0x7bc420]
[0x7bc410]
/lib/libc.so.6(gsignal+0x50)[0x626b10]
/lib/libc.so.6(abort+0x101)[0x628421]
/usr/libexec/mysqld[0x85012e7]
/usr/libexec/mysqld[0x850147e]
/usr/libexec/mysqld[0x849c0b1]
/usr/libexec/mysqld[0x84a8a61]
/usr/libexec/mysqld[0x8561fef]
/usr/libexec/mysqld[0x85570a9]
/usr/libexec/mysqld[0x847b082]
/usr/libexec/mysqld[0x846bf04]
/usr/libexec/mysqld[0x846dad4]
/lib/libpthread.so.0[0x50d912]
/lib/libc.so.6(clone+0x5e)[0x6d347e]
The manual page at http://dev.mysql.com/doc/mysql/en/crashing.html contains
information that should help you find out what is causing the crash.
180222 17:13:50 mysqld_safe Number of processes running now: 0
180222 17:13:50 mysqld_safe mysqld restarted
Antwort1
Die Fehlermeldung selbst sagt Ihnen, warum das Überprüfen der Tabellendaten das Problem nicht behebt. Es wurde versucht, eine Seite freizugeben (wahrscheinlich aus einer Tabelle oder einem Index); aber diese Seite war bereits als frei markiert. Mit anderen Worten, eine Ihrer Tabellen oder Indizes hat eine Seite verwendet, obwohl die Seite als verfügbar angesehen wurde, um sie an eine andere Tabelle oder einen anderen Index weiterzugeben. Und wenn InnoDB nicht weiß, welche Seiten tatsächlich frei sind, können natürlich schlimme Dinge passieren.
Durch das Dumpen aller Tabellen-/Indexdaten und das erneute Laden erhält InnoDB die Möglichkeit, seine Sammlung freier Seiten neu aufzubauen. Idealerweise tun Sie dies mit einer neuen Datenbank. Warum? Nun, Sie sollten nie davon ausgehen, dass nur ein einziger, einzelner Beschädigungsfehler vorliegt. Wenn Sie die Daten also auf eine neue Installation verschieben, müssen Sie sich keine Sorgen machen, ob es weitere, unentdeckte Beschädigungsprobleme gibt.
Antwort2
Wie vorgeschlagen, entschied ich mich schließlich für das Erstellen und Wiederherstellen aller Datenbanken aus diesen Dumps. Glücklicherweise innodb_force_recovery = 2
konnte ich so alles ohne Fehler sichern, sodass ich keine Dumps aus Backups verwenden musste. Natürlich hätte ich lieber die wahre Fehlerursache herausgefunden, aber MySQL bietet keine Hilfe, abgesehen von einigen Erwähnungen von „Die Informationen zum freien Speicherplatz des Tablespace sind beschädigt“ in Fehlerberichten. Ohne die Fehlerursache zu identifizieren und zu beheben, gehe ich davon aus, dass der Fehler irgendwann erneut auftritt – unser Kunde wird wahrscheinlich noch wütender sein als ich.
Vielleicht liegt es an fehlerhafter Hardware, aber die SMART-Daten aller Festplatten im System sehen gut aus und /var/log/messages
enthalten zum Zeitpunkt des Absturzes nichts Verdächtiges. Es gab auch keinen unerwarteten Stromausfall oder Neustart.