¿Qué lecciones nos deja la crisis de British Airways?

Ahorrar costes y externalizar servicios puede ser un talón de Aquiles en grandes compañías

Pasajeros afectados por la cancelación de vuelos de British Airways en el aeropuerto de Heathrow.
Pasajeros afectados por la cancelación de vuelos de British Airways en el aeropuerto de Heathrow.

Durante los últimos tres días, miles de personas abandonadas en los pasillos de uno de los mayores aeropuertos del mundo se han hecho las mismas preguntas: ¿qué está pasando?, ¿por qué no funciona nada? Ante el silencio de la compañía British Airways, la red se ha llenado de palabras como ataques cibernéticos o terroristas.

Los sistemas informáticos de una compañía como British Airways no son un juguete. La única información filtrada a medios públicos hacía referencia a un fallo eléctrico. Seamos serios, todos sabemos que a un sistema informático complejo no se le puede matar tirando del cable. Hace falta más que eso para tumbar una infraestructura millonaria y que habrá costado el esfuerzo de cientos de expertos. Pero por más que uno busca en la red, no aparecen noticias acerca de un ataque malicioso ni nada similar. De hecho, solo hay notas escuetas y calculadas al milímetro para no meter –aún más– la pata.

En ingeniería hay un principio para resolver problemas complejos: de todas las posibles respuestas, la más sencilla suele ser la correcta. Álex Cruz es conocido en la industria por sus estrategias de ahorro de costes, por lo tanto, lo más simple es asumir que los cientos de millones que se está ahorrando British Airways subcontratando los servicios de atención al cliente, soporte de sistemas y otras áreas están pasando factura. El sindicato GMB así lo afirma. La dirección de British Airways lo desmiente, negando que ninguno de los servicios críticos esté subcontratado fuera del país.

Yo imagino una organización tan competitiva como British Airways como un cohete de la NASA. Esto es lo que ocurre cuando el mantenimiento de algo tan complejo lo realiza gente que no está preparada, y que tampoco tiene una correcta supervisión. ¿Se imaginan a un cualquiera pasando la revisión al motor criogénico de combustible líquido de un cohete de la NASA?

Quizás no estén subcontratando directamente los servicios a países fuera de la UE, pero ¿quién controla que esas nuevas empresas que bajo la bandera de Reino Unido ofrecen servicios mucho más baratos no lo estén haciendo? ¿Hasta dónde se extienden las cadenas de responsabilidades?, ¿cuántas contratas están a su vez subcontratando a países al otro lado del planeta? Todos esos acuerdos tienen asociados niveles de servicios, pero ¿cómo controlan que esos acuerdos se cumplen?

Lo peor no es que subcontraten a equipos fuera de Reino Unido, con diferencias horarias de más de diez horas, lo peor es que no controlen de forma constante la calidad de esos servicios. Ante un gran ahorro debe ir aparejado una gran responsabilidad, no vale con sumar unas celdas a la hoja Excel y esperar que la calidad del servicio no se resienta.

Se habla de un fallo eléctrico que afectó a las comunicaciones internas y a los sistemas de facturación y gestión de equipajes. En suma, uno de los centros críticos de la compañía. Se empieza a oír que los sistemas de respaldo no funcionaron o que no aguantaron la carga: esos sistemas que existen solo para que, si algo sucede, el funcionamiento de la compañía no se resienta. Es como que el gerente de un hospital explique a los parientes de un enfermo que ha muerto en la sala de operaciones, que la luz se fue y el generador de emergencia no funcionó.

El negocio de un hospital es curar personas, no matarlas. El negocio de una compañía aérea es hacer que la gente llegue a su destino, no arruinar sus vacaciones. Los sistemas de respaldo, como los generadores de emergencia o los backups, como hemos visto con el ransomware WannyCry (el virus que afectó recientemente a medio mundo), son lo que permite que un problema no se convierta en una catástrofe. Cuando ahorras quitándole paracaídas al piloto, el depósito de reserva al avión y los sistemas redundantes de energía y comunicaciones a tus sistemas informáticos, te puede ocurrir esto.

Una de las funciones de la monitorización consiste en verificar que los sistemas de respaldo, esos que le fallaron a BA, funcionen en todo momento. También sirve para verificar que las respuestas de los técnicos, estén en Londres o en Vietnam, sean satisfactorias y a tiempo.

La monitorización también sirve para saber si la infraestructura está al límite de su capacidad. La monitorización también es vital para medir los acuerdos de servicio con proveedores.

De nada sirve decir, como ha dicho Álex Cruz, que los sistemas se vieron superados por la demanda. Es como decir que no se frenó a tiempo. Los sistemas de monitorización advierten de que algo está ocurriendo, y permiten tomar decisiones antes.

Durante todo el fin de semana, la web de British Airways ha estado caída, no respondían al teléfono ni en las redes sociales. La red arde de indignación y en British Airways han emprendido la estrategia del avestruz, quizás porque ni ellos mismos saben qué ha ocurrido. Quieren investigar para saber por qué ha ocurrido, para que no vuelva a pasar.

Yo les daría un consejo: si buscan ahorro adelgazando su infraestructura y externalizando los servicios, necesitarán ponerle un buen collar al perro. Eso solo se consigue con una monitorización a todos los niveles.

Sancho Larena es experto en control de sistemas y CEO de Ártica.

Normas