RoundCube, zu viele Sleep-Verbindungen in MySQL

Question 1

Die Antwort ist:

Ich habe die Apache-Option „max_client“ bearbeitet, um den Wert von 256 --> 50 zu senken. Warum!?

aufgrund eines (noch) unbekannten Problems beanspruchen alle vorgeforkten Apache-Prozesse die CPU-Auslastung zu etwa 100 % (100 % Auslastung des Kerns, der den vorgeforkten Apache-Prozess für einige Momente ausführt)

Das System stürzt ab, weil das System über 64 CPU-Kerne verfügt, wenn alle 256 Prozesse von Apache 100 % der CPU-Auslastung nutzen, fallen das System und die Dienste aus.

das Problem besteht immer noch, aber bei den Diensten gibt es keine Probleme. Ich denke, das Problem hängt mit Netzwerkangriffen zusammen (unsere Überwachungstools melden viele Angriffe pro Tag), die manchmal zu Problemen wie Ressourcensperren oder etwas anderem führen

Danke für alle Vorschläge.

Answer

Die Antwort ist:

Ich habe die Apache-Option „max_client“ bearbeitet, um den Wert von 256 --> 50 zu senken. Warum!?

aufgrund eines (noch) unbekannten Problems beanspruchen alle vorgeforkten Apache-Prozesse die CPU-Auslastung zu etwa 100 % (100 % Auslastung des Kerns, der den vorgeforkten Apache-Prozess für einige Momente ausführt)

Das System stürzt ab, weil das System über 64 CPU-Kerne verfügt, wenn alle 256 Prozesse von Apache 100 % der CPU-Auslastung nutzen, fallen das System und die Dienste aus.

das Problem besteht immer noch, aber bei den Diensten gibt es keine Probleme. Ich denke, das Problem hängt mit Netzwerkangriffen zusammen (unsere Überwachungstools melden viele Angriffe pro Tag), die manchmal zu Problemen wie Ressourcensperren oder etwas anderem führen

Danke für alle Vorschläge.

Question 2

Jetzt

Nach etwa 5 Jahren

Das Problem wurde innerhalb weniger Tage erkannt und gelöst.

Es war so kompliziert für einen Junior-Systemadministrator wie mich ;)

Es gab ein Problem im GFS2-Cluster-Dateisystem, das mein Teamkollege auf iSCSI LUN vorbereitet hatte, und dieses Problem führte zu verschiedenen Problemen und Problemen in Dovecot und Roundcube (und dann Apache).

zu Ihrer Information: Als ich auf den Parameter %wa im obersten Befehl geachtet habe (er lag bei etwa 90 %), dachte ich (vielleicht), dass es ein Problem auf Dateisystemebene gibt.

Dann habe ich beschlossen, alle Daten auf ein neues Cluster-Dateisystem (ocfs2) zu übertragen, da GFS veraltet war!

Zuerst werden alle Daten in das neue Cluster-Dateisystem (auf OCF2) verschoben. Anschließend wird das gesamte System basierend auf Pacemake HaProxy auf Debian Wheezy neu gestaltet.

Answer