Welche Tools verwenden Sie als Ops-Team, um Ihre MTTR zu messen?

Welche Tools verwenden Sie als Ops-Team, um Ihre MTTR zu messen?

und messen Sie es überhaupt?

Mein Problem ist, dass es mir bei einer Störungsmeldung wie Zeitverschwendung vorkommt, erst ein JIRA-Ticket zu erstellen, also fange ich sofort an, das Problem zu lösen. Außerdem werden manche Störungen zuerst durch Workarounds gelöst und dann erneut versucht, sie richtig zu beheben.

Antwort1

„Mein Problem ist, dass es mir wie Zeitverschwendung vorkommt, wenn ich bei einem Ausfall eine Meldung bekomme und erst ein JIRA-Ticket erstelle.“

Dies lässt sich natürlich leicht lösen: Die meisten Warnsysteme können mehrere Warnungen gleichzeitig auslösen und eine dieser Warnungen kann die automatische Erstellung eines Jira-Tickets sein.

Teil der Schließung dieses Jira-Tickets kann dann die administrative Aufgabe sein, die vereinbarte Reparaturzeit aufzuzeichnen (auf eine für Sie geeignete Weise/mit einem geeigneten System).

(Es ist bereits angedeutet, aber lassen Sie es mich ausdrücklich sagen: Die von Ihrem Ticketsystem erfasste Ticketlösungszeit ist nicht dasselbe wie die Reparaturzeit.)

Wenn die Ticketlösungszeiten wichtig sind und selbst eine Leistungskennzahl darstellen, möchten Sie das automatisch generierte Ticket für den Ausfall möglicherweise sofort schließen, nachdem der Ausfall behoben wurde.
Wenn Sie eine Untersuchung zur Ursachenanalyse (RCA) starten, verwenden Sie ein verwandtes, aber neues Problemuntersuchungsticket #XYZ (das andere Leistungskriterien hat und anders gemeldet wird als Tickets zu Ausfällen).

Abhängig von den Ergebnissen der RCA können Sie mit der Arbeit an einer dauerhaften Lösung bzw. an Schadensbegrenzungsmaßnahmen beginnen, die Sie, je nachdem, was getan werden muss, wiederum auf andere Weise verfolgen.

verwandte Informationen