Esta página describe cómo Hotjar trata los incidentes.
¿Qué es un incidente?
Se declara un incidente si descubrimos una interrupción no planificada o una reducción de la calidad del servicio normal que ha durado más de 15 minutos y que afecta al menos a 5 usuarios. Cuando se declara un incidente, activamos nuestro Plan de Respuesta a Incidentes.
Puede encontrar ejemplos de incidentes anteriores y nuestra respuesta a los mismos en nuestra página de Estado.
Plan de Respuesta a Incidentes de 9 pasos de Hotjar
Nuestro Plan de Respuesta a Incidentes nos proporciona un proceso definido para identificar rápidamente la causa raíz de un incidente y desplegar una solución. También nos ayuda a gestionar el proceso de comunicación con nuestros usuarios. Para poder abordar eficazmente los incidentes, Hotjar cuenta con un equipo de Gestores de Respuesta a Incidentes (IRM).
En cuanto la monitorización detecta un incidente, se avisa a nuestros ingenieros de guardia. Un IRM asumirá entonces la responsabilidad de ejecutar nuestro Plan de Respuesta a Incidentes (IRP). Los incidentes que comienzan fuera del horario laboral se notifican a nuestros ingenieros de guardia, que contendrán el problema y seguirán una versión simplificada del IRP, llamando a un IRM sólo si la gravedad lo requiere. Nuestro objetivo es resolver las incidencias rápidamente y ofrecer asistencia a nuestros usuarios mediante una comunicación transparente. El proceso es el siguiente
Paso 1: Establecimiento de la incidencia
El IRM designará a un técnico y a un enlace de soporte. Estas tres personas constituirán el equipo de respuesta a incidentes y se unirán a una videoconferencia creada por el IRM. Si se sospecha que el incidente es una violación de datos o de seguridad, se pedirá al responsable de protección de datos (RPD) de Hotjar que se una al equipo de respuesta a incidentes.
Una vez identificada la naturaleza del incidente, el equipo evalúa su gravedad, que puede ser Crítica, Mayor o Menor. Estos niveles dependen del alcance de las funciones afectadas por el fallo, del porcentaje de clientes afectados, así como de la seguridad de los datos.
Paso 2: Anunciar que se ha producido un incidente y que se está investigando
Los detalles del incidente se comparten dentro del propio Hotjar (a través de Slack).
El equipo de respuesta a incidentes evalúa cuándo tenemos suficiente información precisa y se publicará una notificación del incidente en nuestra página pública de Estado. El equipo de respuesta a incidentes actualizará esta página a medida que avancemos por los pasos 5-7 a continuación. El estado del incidente también se publica en nuestra cuenta de Twitter @hotjar_status.
Paso 3: Preparar un plan de soporte para los usuarios afectados
El enlace de soporte trabajará con el equipo de soporte de Hotjar para dar soporte a los usuarios afectados por el incidente. Los preparativos podrían incluir la creación de documentación para ayudar a los usuarios a solucionar el problema. El equipo de soporte de Hotjar también considerará la posibilidad de ponerse en contacto directamente con los usuarios afectados.
Paso 4: Trabajar para identificar y resolver el incidente
El enlace técnico trabajará con el equipo de ingeniería para identificar el alcance del incidente y, si es posible, la causa del mismo. El objetivo inmediato es mitigar la situación (es decir, restablecer el servicio lo antes posible).
A medida que se descubra más información sobre el incidente, el equipo de incidentes volverá a evaluar su gravedad.
Paso 5: Anunciar el incidente como identificado
Una vez que se ha identificado el alcance y la causa del incidente, el enlace de soporte lo anunciará tanto internamente en Hotjar como externamente a través de nuestra Página de estado (si el incidente se ha anunciado al público).
Paso 6: Anunciar la incidencia como controlada
Una vez que se ha identificado y aplicado una solución, el enlace de soporte anunciará que ahora está supervisando la situación para asegurarse de que la solución ha funcionado. Esto se llevará a cabo tanto internamente en Hotjar como externamente a través de nuestra página de Estado (si el incidente se anunció al público).
Paso 7: Anunciar el incidente como resuelto
Cuando el equipo de respuesta a incidentes esté satisfecho de que el incidente ya no afecta a los usuarios, anunciará que el incidente está resuelto. Esto se llevará a cabo tanto internamente en Hotjar como externamente a través de nuestra página de Estado (si el incidente se anunció al público).
Paso 8: Completar las comunicaciones de cara al cliente
Si el incidente se anunció externamente, a través de la página de Estado, el equipo de respuesta a incidentes redactará ahora un informe público con más detalles sobre el incidente. En la página de Estado se denomina informe "Postmortem".
En algunas circunstancias, el enlace de soporte trabajará con el equipo de soporte de Hotjar para contactar con los usuarios directamente afectados por el incidente.
Paso 9: Acciones de seguimiento
El equipo de incidentes programará una autopsia interna del incidente, que se celebrará (si es posible) en las 24 horas siguientes a la resolución del incidente. Es probable que la autopsia identifique otras acciones que Hotjar deba emprender para evitar que el incidente se repita.
El equipo de respuesta a incidentes actualizará el informe/postmortem en nuestra página de Estado si se descubren más detalles en el postmortem interno.