Diese Seite erläutert, wie Hotjar mit Vorfällen umgeht.
Was ist ein Vorfall?
Ein Vorfall wird erklärt, wenn wir eine ungeplante Unterbrechung oder eine Qualitätsminderung des normalen Dienstes feststellen, die länger als 15 Minuten gedauert hat und mindestens 5 Benutzer betrifft. Wenn ein Vorfall erklärt wird, aktivieren wir unseren Incident-Response-Plan.
Beispiele für frühere Vorfälle und unsere Reaktion darauf finden Sie auf unserer Statusseite.
Hotjars 9-Schritte-Incident-Response-Plan
Unser Incident-Response-Plan gibt uns einen definierten Prozess an die Hand, um die Ursache eines Vorfalls schnell zu identifizieren und eine Lösung bereitzustellen. Er hilft uns auch dabei, den Prozess der Kommunikation mit unseren Benutzern zu managen. Um Vorfälle effektiv angehen zu können, verfügt Hotjar über ein Team von Incident-Response-Managern (IRMs).
Sobald ein Vorfall vom Monitoring erkannt wird, werden unsere Bereitschaftsingenieure benachrichtigt. Ein IRM übernimmt dann die Verantwortung für die Durchführung unseres Incident-Response-Plans (IRP). Vorfälle, die außerhalb der Geschäftszeiten beginnen, benachrichtigen unsere Bereitschaftsingenieure, die das Problem eindämmen und eine vereinfachte Version des IRP befolgen, und nur dann einen IRM hinzuziehen, wenn die Schwere es erfordert. Unser Ziel ist es, die Probleme schnell zu lösen und unseren Benutzern durch transparente Kommunikation Unterstützung zu bieten. Der Prozess sieht wie folgt aus:
Schritt 1: Den Vorfall einrichten
Der IRM bestellt einen technischen und einen Support-Liaison. Diese drei Personen bilden dann das Incident-Response-Team und nehmen an einem vom IRM erstellten Videokonferenzanruf teil. Wenn vermutet wird, dass es sich bei dem Vorfall um einen Daten- oder Sicherheitsverstoß handelt, wird der Datenschutzbeauftragte (DPO) von Hotjar gebeten, dem Incident-Response-Team beizutreten.
Sobald die Art des Vorfalls identifiziert ist, wird seine Schwere vom Team bewertet, entweder als Kritisch, Haupt- oder Nebenvorfall. Diese Ebenen hängen vom Umfang der durch den Ausfall betroffenen Funktionen, dem Prozentsatz der betroffenen Kunden sowie der Datensicherheit ab.
Schritt 2: Ankündigung, dass ein Vorfall aufgetreten ist und untersucht wird
Die Vorfallinformationen werden innerhalb von Hotjar selbst geteilt (über Slack).
Das Incident-Response-Team prüft, wann wir genügend genaue Informationen haben, und eine Vorfallbenachrichtigung wird auf unserer öffentlichen Statusseite veröffentlicht. Das Incident-Response-Team wird diese Seite aktualisieren, während wir die Schritte 5-7 unten durchlaufen. Der Vorfallstatus wird auch auf unserem @hotjar_status Twitter-Account veröffentlicht.
Schritt 3: Einen Supportplan für betroffene Benutzer vorbereiten
Der Support-Liaison wird mit dem Hotjar-Supportteam zusammenarbeiten, um Benutzer zu unterstützen, die von dem Vorfall betroffen sind. Vorbereitungen könnten das Erstellen von Dokumentationen für Benutzer beinhalten, um ihnen bei der Bewältigung des Problems zu helfen. Das Hotjar-Supportteam wird auch in Betracht ziehen, betroffene Benutzer direkt zu kontaktieren.
Schritt 4: Identifizierung und Behebung des Vorfalls
Der technische Ansprechpartner wird mit dem Entwicklungsteam zusammenarbeiten, um den Umfang des Vorfalls zu identifizieren und, wenn möglich, die Ursache des Vorfalls. Der unmittelbare Fokus liegt darauf, die Situation zu mildern (d. h. den Service so schnell wie möglich wiederherzustellen).
Sobald mehr Informationen über den Vorfall bekannt sind, wird das Incident-Team die Schwere des Vorfalls neu bewerten.
Schritt 5: Den Vorfall identifizieren und bekanntgeben
Sobald der Umfang und die Ursache des Vorfalls identifiziert wurden, wird der Support-Ansprechpartner dies sowohl intern bei Hotjar als auch extern über unsere Statusseite bekanntgeben (falls der Vorfall öffentlich bekannt gegeben wurde).
Schritt 6: Den Vorfall als überwacht bekanntgeben
Sobald eine Lösung identifiziert und angewendet wurde, wird der Support-Ansprechpartner bekanntgeben, dass sie nun die Situation überwachen, um sicherzustellen, dass die Lösung funktioniert hat. Dies wird sowohl intern bei Hotjar als auch extern über unsere Statusseite durchgeführt (falls der Vorfall öffentlich bekannt gegeben wurde).
Schritt 7: Den Vorfall als behoben bekanntgeben
Wenn das Incident-Response-Team zufrieden ist, dass der Vorfall die Benutzer nicht mehr beeinträchtigt, wird bekanntgegeben, dass der Vorfall behoben ist. Dies wird sowohl intern bei Hotjar als auch extern über unsere Statusseite durchgeführt (falls der Vorfall öffentlich bekannt gegeben wurde).
Schritt 8: Abschluss der Kundenkommunikation
Wenn der Vorfall extern über die Statusseite bekannt gegeben wurde, wird das Incident-Response-Team nun einen öffentlichen Bericht mit weiteren Details zum Vorfall verfassen. Dies wird auf der Statusseite als "Postmortem"-Bericht bezeichnet.
In einigen Fällen wird der Support-Ansprechpartner mit dem Hotjar-Supportteam zusammenarbeiten, um direkt von dem Vorfall betroffene Benutzer zu kontaktieren.
Schritt 9: Folgeaktionen
Das Incident-Team wird ein internes Incident-Postmortem planen, das (wenn möglich) innerhalb von 24 Stunden nach Behebung des Vorfalls stattfindet. Das Postmortem wird wahrscheinlich weitere Maßnahmen identifizieren, die Hotjar ergreifen muss, um zu verhindern, dass der Vorfall erneut auftritt.
Das Incident-Response-Team wird den Bericht/Postmortem auf unserer Statusseite aktualisieren, wenn bei dem internen Postmortem weitere Details entdeckt werden.