Learn which KPIs truly matter to senior leadership and how data-driven insights elevate business continuity from operational necessity to strategic governance.
Interrupción de TI de Microsoft 2024: Lecciones de continuidad del negocio con Philippe Tassé-Gagné, Vicepresidente de Servicios de Consultoría

El 19 de julio de 2024, una actualización defectuosa de CrowdStrike provocó una interrupción global de los servicios de Microsoft, afectando a millones de usuarios y generando disrupciones en numerosos sectores empresariales.
Frente a esta situación sin precedentes, la gestión de la continuidad del negocio se convirtió en un tema central para empresas de todos los tamaños.
Para comprender mejor los desafíos y las soluciones, entrevistamos a Philippe Tassé-Gagné, Vicepresidente de Servicios de Consultoría en Premier Continuum, y mantuvimos una conversación sumamente enriquecedora.
El señor Tassé-Gagné es un experto reconocido en continuidad del negocio y resiliencia organizacional, con más de 25 años de experiencia.
También fue galardonado como Consultor de Continuidad y Resiliencia 2024 en los BCI Americas Awards 2024.
¡Que lo disfrutes!

1. Philippe, ¿podría explicarnos brevemente qué ocurrió durante la interrupción de Microsoft en julio de 2024?
Por supuesto. El 19 de julio de 2024, una actualización del software de ciberseguridad CrowdStrike provocó errores de Blue Screen of Death (BSOD) en numerosos dispositivos Windows, afectando a más de 8,5 millones de equipos.

Esta actualización provocó interrupciones importantes en los servicios de Microsoft 365, afectando aplicaciones críticas como Outlook, Teams y OneDrive.
La falla tuvo un impacto global, perturbando sectores clave como el transporte, los servicios sociales y de salud, los servicios financieros y muchos otros.
A nivel personal, una de las cosas que más me sorprendió fue que ni siquiera la radio funcionaba esa mañana. Cuando todo sale mal, incluso la fuente que consideramos más confiable… ¡no estaba disponible!
2. ¿Alguna vez ha tenido que gestionar o acompañar a sus clientes en un incidente similar?
Aparte de la pandemia de COVID-19, no he tenido que gestionar un evento de tal magnitud en mis 28 años de carrera.
Esto me recuerda el dicho: “Siempre estamos preparados para el último incidente que vivimos.” Por ejemplo, cuando llegó la COVID-19, las organizaciones recurrieron a sus planes existentes de continuidad y gestión de crisis, que a su vez estaban basados en el último gran evento de naturaleza similar: el virus H1N1 de 2009. Como resultado, los protocolos estaban más o menos adaptados para la COVID-19, pero tal vez no eran adecuados para otros tipos de disrupciones relacionadas con el personal.
La enseñanza principal aquí es: ¿cuántas organizaciones se toman realmente el tiempo de realizar un debriefing, recopilar datos e información y actualizar sus planes y procedimientos basados en escenarios similares después de una crisis?Muy pocas… y, sin embargo, esto es de suma importancia.
3. En su opinión, ¿por qué fueron tan amplios los impactos del incidente de CrowdStrike?
Muchas organizaciones han incrementado sus dependencias hacia Microsoft. Y aunque los riesgos de interrupciones de servicios y herramientas sean bajos, debemos considerar que los impactos pueden ser catastróficos.
Dependemos cada vez más de empresas multinacionales, especialmente de aquellas que dominan el mercado, como Microsoft. En mi opinión, este tipo de interrupción hará que muchas organizaciones se cuestionen si vale la pena implementar soluciones alternativas… y a qué costo. Las alternativas no son numerosas.
Tomemos el ejemplo de Delta Air Lines, que amenaza con demandar a CrowdStrike por las pérdidas ocasionadas. Un gran porcentaje de sus vuelos tuvo que retrasarse, y muchos otros fueron cancelados.* Entendemos su pérdida, pero esto plantea una pregunta contraintuitiva: ¿a qué otro proveedor podrían acudir?
Delta probablemente seguirá trabajando con Microsoft, un actor clave en sus operaciones.
Microsoft, a su vez, seguirá colaborando con CrowdStrike, dada la robustez y reputación de sus soluciones de ciberseguridad.
Por lo tanto, incluso si Delta demanda a CrowdStrike, seguirán indirectamente vinculados a ellos a través de Microsoft. Esto demuestra la complejidad e interconexión de los ecosistemas tecnológicos actuales, donde las opciones son limitadas y las dependencias mutuas son inevitables.
Fuente: CNBC. "Delta hires David Boies to seek damages from CrowdStrike, Microsoft after outage," published on July 29, 2024, https://www.cnbc.com/2024/07/29/delta-hires-david-boies-to-seek-damages-from-crowdstrike-microsoft-.html
4. ¿Qué deberían hacer las organizaciones tras el incidente de CrowdStrike o la interrupción del servicio Microsoft Azure?
Una lección importante es tomar conciencia de la confianza ciega que depositamos en estas multinacionales. En el caso de los clientes, la actualización de CrowdStrike se descargó automáticamente y no siempre fue probada por las organizaciones antes de instalarse.
Este evento debería motivar a las empresas a ser más eficientes y más vigilantes con respecto al proceso de actualización de sus sistemas críticos.
Algunas compañías probaron la actualización de CrowdStrike antes de instalarla, lo que les permitió evitar impactos en sus operaciones. En este sentido, las grandes organizaciones deberían evaluar —o al menos probar— las actualizaciones siempre que sea posible, antes de instalarlas.
Evidentemente, las pequeñas y medianas empresas no pueden revisar cada actualización, pero siempre es recomendable volver a analizar sus sistemas y dependencias para reevaluar los riesgos. Y aunque los riesgos eran relativamente bajos, debemos recordar que nuestros sistemas son cada vez más interdependientes.
Puedes consultar este artículo para obtener más información sobre la interrupción del servicio Microsoft Azure.
5. ¿Cómo puede el desarrollo de la resiliencia organizacional ayudar a las empresas a manejar este tipo de disrupción?
La resiliencia organizacional es la capacidad de una organización para absorber impactos y adaptarse a un entorno cambiante. Desarrollar esta capacidad puede ayudar especialmente a fortalecer la ciberresiliencia y a prepararse mejor para interrupciones tecnológicas.
- El incidente de CrowdStrike puso de manifiesto la mayor vulnerabilidad de las organizaciones frente a los ciberataques. Durante la crisis, la vigilancia disciplinada fue esencial, ya que una brecha de seguridad brindaba una oportunidad de oro para los ciberdelincuentes. Trabajar en el aumento de la resiliencia organizacional permite que las organizaciones se mantengan vigilantes y listas para responder rápidamente ante cualquier disrupción.
- Además, cuando se trabaja en resiliencia organizacional, se implementan copias de seguridad, estrategias de recuperación y soluciones alternativas para las actividades prioritarias o los servicios empresariales críticos. Esto permite a las organizaciones tomarse el tiempo para recaracterizar sus infraestructuras críticas.
En otras palabras, es necesario preguntarse:
“¿Tengo puntos únicos de falla que no había identificado o considerado relevantes?”
Puede que no siempre existan soluciones, pero al reconocer que este tipo de interrupciones de TI son más probables de lo que se pensaba, los equipos de continuidad y resiliencia pueden desarrollar soluciones alternativas seguras para gestionar situaciones similares en el futuro.
6. ¿Cómo podríamos mejorar nuestra preparación para otra interrupción de TI de esta magnitud?
Creo que la preparación implica sensibilización, formación y la realización de ejercicios de continuidad y resiliencia.
Debemos asegurarnos de que todos los miembros de la organización comprendan su rol en una crisis, y es fundamental enfocarse en desarrollar las habilidades del equipo de gestión de crisis mediante formación continua y ejercicios regulares.
Un ejemplo que me gusta utilizar es el siguiente: ya sea en los planes de recuperación de TI o durante un ejercicio de ciberseguridad, es importante especificar el tipo de incidente cibernético del que se trata.
¿Es un ciberataque o es una pérdida de acceso al sistema?
Ambas situaciones pueden afectar los medios principales de comunicación de una organización, pero no se pueden gestionar de la misma manera.
Es absolutamente necesario diseñar medidas y estrategias paralelas para una respuesta adecuada y practicar su implementación de forma eficaz con el equipo de gestión de crisis.
Hoy en día, prepararse para un ciberataque es una muy buena práctica. Es, con diferencia, el riesgo o amenaza más probable.
7. ¿Cree que esta interrupción de Microsoft se convertirá en un caso de estudio en el futuro?
La interrupción de Microsoft causada por CrowdStrike es un incidente de TI, y el sector tecnológico tiende a adaptarse mejor que muchos otros sectores. Dicho esto, no sería sorprendente que las lecciones aprendidas de este evento se conviertan rápidamente en mejores prácticas.
Espero que, tras este incidente, las organizaciones dediquen más tiempo a realizar verificaciones previas antes de instalar actualizaciones. Sin embargo, reitero que esta no es una tarea sencilla. Requiere tener buenos sistemas en funcionamiento y las herramientas adecuadas, algo que no todas las empresas pueden permitirse.
Aun así, muchas organizaciones tienen sistemas obsoletos y, por lo tanto, son más vulnerables a este tipo de eventos. En mi opinión, estas organizaciones deberían ser más cautelosas, al igual que aquellas que prestan servicios esenciales, como los servicios de salud o de transporte.
A corto plazo, aconsejo a todas las organizaciones documentar los impactos de este incidente y cómo fue gestionado.
Analizar esta información permitirá identificar con mayor claridad oportunidades de mejora para futuras crisis.
En otras palabras, es esencial aprender de los errores para fortalecer la resiliencia y mejorar los planes de continuidad del negocio, de modo que las organizaciones estén mejor preparadas para enfrentar futuras disrupciones.
Para ir más lejos…
Con esto concluimos nuestra entrevista con Philippe Tassé-Gagné, Vicepresidente de Servicios de Consultoría y Desarrollo de Talento en Premier Continuum.
Agradecemos sinceramente al Sr. Tassé-Gagné por compartir con nosotros sus conocimientos y su experiencia sobre este tema.
Para obtener más información sobre esta interrupción de TI, te invitamos a leer nuestro artículo: “Incidente del 19 de julio de 2024: Cuando una actualización tiene impactos globales.”
Para más información sobre la gestión de la continuidad del negocio y la resiliencia organizacional, consulta ahora a nuestro equipo de expertos.





