vicepresidente de estrategia empresarial de Veeam
En la economía digital, la continuidad de las operaciones va estrechamente ligada a la tecnología. Desde el retail a los viajes, pasando por el mercado financiero y el sector público, los servicios se comercializan online y los empleados teletrabajan, por lo que las empresas dependen más que nunca de su infraestructura digital.
Aunque las empresas pueden tomar medidas para proteger sus servicios digitales de las incidencias provocadas por un error de usuario, un fallo del sistema o un ciberataque, algunos eventos se escapan al control de cualquier compañía. Fenómenos meteorológicos extremos, desastres naturales o apagones en las distintas regiones pueden ocasionar tiempo de inactividad y pérdida de servicios.
Cuando esto sucede, conseguir que los servicios y empleados vuelvan a estar operativos online de forma rápida es de vital importancia. Por esta razón las empresas tienen que contar con un plan robusto, bien documentado y que haya sido puesto a prueba.
Es necesario que quede claro quiénes son las personas que se tienen que ocupar de su activación, cuáles son los papeles que desempeña cada una y las responsabilidades asociadas, así como los datos de contacto relevantes en caso de emergencia y las acciones prioritarias. Además de tener un plan, las empresas deben disponer de la capacidad técnica para recuperarse y volver al estado en el que se encontraban antes de la incidencia.
Esto implica la plena recuperación de datos, aplicaciones y servicios dentro de un plazo definido que permita minimizar el impacto en la situación económica de la empresa. Una empresa debe pasar por todo este proceso si quiere estar segura de que está completamente preparada antes de que se produzca un desastre que afecte tanto a la continuidad de las operaciones como a la restauración tecnológica.
La preparación de los equipos
La capacidad para anticiparse y actuar es lo que distingue a los que tienen éxito de los que fracasan. Cuando se trata de preparar a una empresa para que se recupere de un desastre tecnológico imprevisto, resulta crucial la capacidad para anticipar exactamente cómo será la hora cero y cuáles serán los siguientes pasos que se necesiten en ese momento.
Los líderes TI deben imaginarse en esa situación para así entender de qué forma deben reaccionar, en lugar de esperar a que haya un desastre y que sea en ese momento en el que descubran qué es lo que van a hacer. Estas realidades pueden ser increíblemente diferentes, así que es importante simular este tipo de situaciones de forma exhaustiva antes de que tengan lugar.
En última instancia, la empresa depende de su capacidad para que la infraestructura y los sistemas de datos recuperen por completo las aplicaciones críticas para la misión comercial en un plazo de tiempo adecuado.
Antes de llegar a esta fase de la recuperación hay que preparar a los equipos de la empresa que se encargarán de las acciones clave para que puedan iniciar el proceso. Esto se puede dividir en fases dependiendo de las necesidades de la empresa.
Por regla general, lo primero es garantizar que hay un inventario completo y actualizado de las aplicaciones y servicios implantados en toda la empresa en ese momento. Una vez se ha registrado todo, es hora de establecer las principales prioridades, siempre en línea con las funciones más cruciales para la empresa.
Aquí es cuando pensamos en qué aplicaciones son las primeras que tienen que estar operativas online. Por ejemplo, un retailer con canal online puede dar prioridad a la recuperación de las funciones de cadena de suministro e inventario antes de que la plataforma de comercio electrónico vuelva a funcionar.
Por otra parte, para empresas basadas en servicios, como un bufete de abogados o una firma de marketing, pueden primar las aplicaciones de colaboración y el correo electrónico porque permiten la comunicación entre departamentos.
Una vez tenemos claro cuáles son las aplicaciones que necesitamos que funcionen online primero, podemos pensar en cómo crear un plan de acción, que quede por escrito, se almacene de forma centralizada y del que se haga backup en al menos otros dos medios, uno off-site y otro offline.
Estos planes de acción deben ser detallados y específicos. También deben prepararse para el peor de los casos: imaginemos que el principal administrador de sistemas está de vacaciones o de baja médica y su equipo tiene que restaurar los sistemas de datos sin su liderazgo.
Además de acciones e instrucciones clave, el plan debería indicar los datos de contacto necesarios para reactivar la comunicación dentro de la empresa. ¿A quién hay que informar de inmediato? ¿Cuál es el equipo TI al que es necesario llamar para obtener información vital? Todo esto tiene que estar explicado en el plan. Hay que pensar en los aspectos prácticos. ¿Necesitamos que un equipo de administradores trabaje toda la noche restaurando los servidores en un data center? ¿Qué van a comer? ¿Necesitarán un sitio para dormir?
Los planes más detallados de recuperación en caso de desastre (DR) no dejan nada al azar, incluyen información que va desde las empresas de repartidores de pizza a los taxis y hoteles.
La automatización de la recuperación
Además de preparar un plan de recuperación basado en las funciones fundamentales para el negocio que hay que restaurar antes, las empresas deben asegurarse de que sus sistemas de datos están completamente protegidos con backup y recuperación en caso de desastre en todas las opciones de almacenamiento.
Los backup de datos off-site y offline ayudan a mitigar los efectos de este tipo de desastres. Veeam promueve la regla del 3-2-1-1-0 en backup. Siempre debería haber al menos tres copias de los datos importantes en un mínimo de dos tipos de medios diferentes, siendo uno off-site y otro offline, con cero backups sin verificar o con backups que se completan sin errores.
Por supuesto, la recuperación en caso de desastre y el backup son soluciones intrínsecamente vinculadas pero no deberíamos fusionarlas. La recuperación en caso de desastre trata de un conjunto de iniciativas y procesos diseñados para garantizar la supervivencia de los datos, independientemente del alcance de la incidencia o crisis, siempre centrándose en volver a tener los servicios TI operativos lo antes posible.
Si se opta por utilizar la recuperación en caso de desastre como servicio (DRaaS) de un proveedor de DR externo, las empresas pueden poner a prueba, documentar y ejecutar los planes de DR de inmediato, basta con hacer un clic y recuperan todo desde una única aplicación a sitios enteros.
Volviendo al proceso de planificación, las empresas pueden elegir el mejor método de protección basándose en el contrato de nivel de servicio (SLA) que necesitan. La principal pregunta y el objetivo clave a la hora plantear un plan de recuperación en caso de desastre debería ser: ¿Cómo de rápido necesita la empresa recuperarse? Tanto si se trata de tener de nuevo operativas las aplicaciones cruciales para la misión comercial o recuperar todos los datos tal y como estaban antes de la incidencia.
Si emplean DRaaS los clientes pueden aprovechar las ventajas de disponer de un método seguro y completamente monitorizado para proteger los datos críticos, sin necesidad de mantener un repositorio off-site. En resumen, las mejores prácticas de recuperación en caso de desastre combinan una estrategia liderada por la empresa y centrada en el departamento TI para garantizar la continuidad de las operaciones en todo el negocio.
Una no funciona sin la otra y dado lo mucho que dependen las empresas de la infraestructura digital, necesitan también un plan sólido con soluciones de protección de datos moderna para proteger la totalidad del negocio.
vicepresidente de estrategia empresarial de Veeam