Causas del colapso mundial de Microsoft.

Durante Julio de 2024, sistemas provistos por Microsoft en todo el mundo colapsaron generando interrupciones y problemáticas en servicios de empresas en diversos países que incluyeron aeropuertos y servicios de emergencia. En esta nota te explicamos la falla de seguridad de la empresa Crowdstrike y reflexionamos sobre lo sucedido.

Empresas, Mercados y Finanzas. Redacción MBA. Redacción MBA.
iStock-1408775753
Creditos: iStock

En el mes de julio de 2024 sucedió una de las más grandes interrupciones de la tecnología en la historia de la humanidad. Este evento afectó a millones de usuarios, empresas e instituciones a lo largo de todo el planeta. La falla inició exactamente el día 19 de julio y su detonante fue una falla con efecto en cadena generada por una actualización del software de CrowdStrike, una empresa de ciberseguridad que trabaja con Microsoft.

CrowdStrike es una empresa top en temas de ciberseguridad que fue fundada en el año 2011 por George Kurtz, quien venía de ser CTO de la compañía famosa por sus antivirus McAfee. Hoy CrowdStrike es una de las compañías más importantes del mundo en su materia y se estima que cuentan con una cifra cercana a los 30000 clientes. Desde su sede principal en Austin, Texas, se especializa principalmente en detectar y bloquear las innumerables amenazas generadas por ciberdelincuentes, piratas informáticos y todo tipo de atacantes. La compañía cuenta con una potente plataforma propia sostenida en la nube y entre sus laureles cuenta con el freno a un importante saqueo a la Sony Pictures por el año 2014 y los furiosos ciberataques contra el partido demócrata iniciados en el 2015.Vamos a adentrarnos en la causa de la falla, una actualización defectuosa.

Esta interrupción masiva fue generada por un defecto en una actualización de un sensor llamado Falcon de la empresa de ciberseguridad CrowdStrike, esto afectó nada más ni nada menos que a los sistemas operativos de Windows, que como se imaginaran, hay unos cuantos en todo el planeta. La actualización generó errores de la famosa "pantalla azul" en innumerables terminales y dispositivos convirtiéndose en uno de los colapsos tecnológicos más importantes de la historia y las funcionalidades de Microsoft 365 y varios servicios más relacionados.

En Microsoft, el mayor afectado, el impacto fue contundente y se pudo confirmar que la interrupción afectó a sus servicios alojados en la nube, principalmente en el centro de los Estados Unidos y gran cantidad de lugares del planeta. El colapso generó diversas problemáticas de acceso a aplicaciones fundamentales como Microsoft Teams, Microsoft Outlook y muchos servicios más de Microsoft 365, esto complicó millares de operaciones de empresas e instituciones en todo el planeta.Los efectos globales fueron muchos y podríamos realizar un detalle muy extenso pero elegimos algunos para que el lector tome dimensión de lo sucedido.

En el transporte aéreo el colapso afectó fuertemente a la industria de la aviación y aerolíneas como American Airlines, Delta Airlines y Lufthansa reportaron cancelaciones masivas de sus vuelos y como consecuencia miles de pasajeros varados en aeropuertos sin salir a destino. En algunos de estos aeropuertos como el famoso de JFK de la ciudad de Nueva York, los vuelos directamente fueron suspendidos por el colapso y la incapacidad de sus sistemas para procesar desde la información de los pasajeros a otros datos cruciales.En los servicios públicos y de salud los hospitales de muchos países en los que podemos incluir Alemania y Reino Unido, tuvieron cancelaciones de cirugías importantes y problemáticas para ingresar a sus sistemas de datos como las reservas.

En San Diego, Estados Unidos, su departamento de policía y hasta los servicios de emergencia echaron mano a sistemas manuales para no interrumpir las operaciones por lo delicado del sector.En los medios de comunicación varios canales de televisión y radio se encontraron obligados a cesar sus transmisiones por la falta de acceso a los sistemas digitales que día a día utilizan para operar sus estaciones. Esto generó una interrupción en los servicios de noticias en vivo lo que incluso impidió que se pueda explicar bien a la población lo que estaba pasando en las primeras horas.

CrowdStrike velozmente ubicó el problema y comenzó a trabajar en una solución para terminar con el colapso. Luego emitió una actualización de urgencia para revertir los cambios que había generado la falla. También publicó un comunicado que se fue actualizando respecto a su versión de los hechos que empieza con las siguientes palabras:


"CrowdStrike está trabajando activamente con clientes afectados por un defecto encontrado en una sola actualización de contenido para hosts de Windows. Los hosts de Mac y Linux no se ven afectados. Esto no fue un ciberataque."

CS_Blog-Update_02
Creditos: Sitio oficial de CrowdStrike.


Por su parte el CEO de CrowdStrike, George Kurtz por su parte reforzó el mensaje de que no se trataba de un ciberataque y confirmó que fue un error en la actualización.

En cuanto a la restauración de Servicios globales, Microsoft y CrowdStrike trabajaron en equipo para restaurar todos los servicios afectados. En ese punto muchos sistemas comenzaron a recuperarse de manera rápida, pero otros requirieron una compleja intervención manual de los equipos y técnicos de los clientes afectados lo que ramificó y volvió más lenta la resolución del problema de manera completa.

Es imposible pensar en todo este lío sin analizar el Impacto Económico cuya magnitud por culpa del colapso tuvo repercusiones económicas realmente significativas, afectando los ingresos de empresas de todo tipo desde las más pequeñas hasta multinacionales. Quizás las más afectadas sin dudas fueron las aerolíneas que sufrieron cantidad de demoras y cancelaciones generando pérdidas significativas.

Si tenemos que rescatar una reflexión de lo sucedido con este evento, es la importancia de contar con sistemas de respaldo alternativos, que aunque pueden generar un costo más en algunas empresas pueden en un futuro salvar mucho más que eso. El mundo actual está camino a estar completamente tecnificado, se debe dar un debate respecto a planes de contingencia para poder sobrevivir ante fallas tecnológicas. Aunque muchas empresas usan viejos métodos manuales para no dejar de funcionar, está claro que en muchos casos eso es imposible sin otro respaldo tecnológico alternativo.

Muchas empresas en el mundo cuentan con sus nubes propias y sistemas de energía de emergencia, incluso hay un caso modelo en Argentina donde una importante cadena de supermercados cooperativos llamada Cooperativa Obrera, generó su propio establecimiento de nube propia con incluso una segunda locación de respaldo.Este tipo de imponderables globales suelen llevar a repensar el funcionamiento de cosas que hasta el momento se pensaban como casi infalibles y en general llevan a una nueva revisión, en este caso de los sistemas de actualización de software que afectan principalmente a empresas tecnológicas. Todo esto con el horizonte en evitar nuevos errores y prevenirlos en el futuro.

La falla global y masiva de Microsoft originada por CrowdStrike y su problema de actualización generó sin dudas un impacto global contundente, afectando a todo tipo de sectores importantes para el funcionamiento del mundo y marcando la importancia de una mayor eficacia y seguridad en toda la infraestructura tecnológica. Sin exagerar en reiterativos, creemos que las empresas e instituciones dependientes de los sistemas tecnológicos, tienen que tomar nota de este suceso para que sus sistemas estén más preparados para encarar este tipo de contingencias ya que no solo implican pérdidas económicas sino que también en algunos casos podrían afectar infraestructura crítica y servicios de los cuales depende la vida de muchas personas.

Te puede interesar

Visitá nuestro diccionario tecnológico.

Ayudanos a seguir generando contenido. Suscribite gratis y recibí todas las noticias tecnológicas. También participa de sorteos mensuales. 🚀