Erwartete IOPS für das Schreiben von Protokollen auf PS6000X SAN?

Erwartete IOPS für das Schreiben von Protokollen auf PS6000X SAN?

Der Kunde erlebt eine schlechte Sybase ASE 15-Leistung auf einem PS6000X SAN mit 16 x 450 GB 10K in RAID-50. Der Server ist ein Dell R710 mit 2003 Server R2 64bit in ESX 4.0.0,256968

Ich habe SQLio verwendet, um die sequentielle Schreibleistung von 4-KB-Blöcken auf dem Laufwerk zu vergleichen.

sqlio -kW -t1 -s600 -dE -o1 -fsequential -b4 -BH -LS sqliotestfile.dat

Das Ergebnis sind 1900 IOPS. Wenn Sybase jedoch eine dauerhafte Arbeitslast mit kleinen Einfügungen ausführt, zeigt SAN HQ konstant 590 IOPS (und 100 % 4K-Schreibaktivität). Es zeigt auch, dass die Schreiblatenz von <1 ms auf 1,2 ms ansteigt.

Überwachung und Tests in Sybase zeigen, dass das Leistungsproblem mit der E/A zusammenhängt und dass insbesondere beim Schreiben ins Protokoll lange Wartezeiten entstehen.

Das SAN zeigt an, dass der Schreibcache aktiviert ist.

Welche IOPS sollte das SAN für sequenzielle 4K-Schreibvorgänge leisten können? Sollte der Controller bei aktiviertem Schreibcache die 4K-Schreibvorgänge nicht effizienter zusammenfassen?

Auch Tipps zu Sybase auf ESX sind willkommen.

Antwort1

Ich würde erwarten, dass sequentielle IO schneller ist als das, was Sie sehen, aber anhaltende 4K 100 % zufällige Schreib-IO würden bei dieser Konfiguration bei etwa 500–600 IOPS liegen [bei angenommenen 14 aktiven Festplatten, 10K SAS, RAID 50]. Meine Frage wäre also: Wie können Sie sicher sein, dass das IO-Muster auf dem Datenträger wirklich sequentiell ist?

Welche anderen Volumes werden vom PS600X bereitgestellt und wofür werden sie verwendet? Die Equallogic-Arrays ermöglichen es Ihnen nicht wirklich, IO-Muster zwischen Volumes auf demselben Array zu isolieren. Wenn Sie ein oder mehrere andere Volumes aus denselben Festplatten herausgelöst haben, auf denen zufälliger IO-Verkehr auftritt, könnte dies die Ursache sein.

Antwort2

Das Wichtigste zuerst: Ist die Größe der Testdatei mit der der realen Datenbank vergleichbar? Wenn nicht, können die Suchzeitender DifferenzierungsfaktorHier.

Wenn Sie den VMware Paravirtual SCSI-Adapter für das Protokollvolume noch nicht verwenden, würde ich empfehlen, ihn einmal auszuprobieren. Es ist keine Wunderlösung, aber bestimmte Workloads profitieren davon. Normalerweise führt es zu etwas mehr Latenz, ermöglicht aber einen höheren Gesamtdurchsatz bei einer hohen Anzahl von Schreibvorgängen.

Wenn es machbar ist (und ich weiß, dass das ein großer Aufwand ist), sollten Sie vielleicht eine physische Instanz desselben Servers direkt an das SAN anschließen und denselben Test ausführen, wobei Sie ESX aus der Gleichung nehmen. Da Sie die IOPS-Zahlen von zwei verschiedenen Standorten und Produkten lesen, würde ich das auch als möglichen Faktor betrachten. Allerdings würde ich nicht erwarten, dass die Zahlen um das Dreifache abweichen.

verwandte Informationen