Planes de recuperación ante desastres
Los recientes incidentes provocados por los desastres naturales, especialmente el huracán Katrina, han puesto de manifiesto lo importante que resulta disponer de un buen plan de continuidad en las empresas cuyos procesos críticos reposan en sistemas de la información.
Es frecuente que muchas organizaciones, desde pequeñas cuentas a las más grandes corporaciones, no contemplen éste tipo de planes, o los eludan en su puesta al día por el simple hecho de que en las zonas de operación no sean frecuentes o sean poco probables eventos indeseables que pudieran tumbar nuestro despliegue informático, como podrían ser los desastres naturales o los ataques terroristas. Muchas veces, una copiosa lluvia puede dejarnos sin actividad, y en lo referente al factor humano, un boicot interno o la acción vandálica de un ladrón podrían ser suficientes para paralizar la actividad de nuestra empresa.
También se considera error pensar sólo en grandes desastres como fuentes de la ruptura de la continuidad: huracanes, tsunamis, terremotos, inundaciones … son sin duda aspectos a considerar, pero no menos importantes son otros problemas no naturales que podrían dejar en el dique seco nuestras operaciones. Incrementos de la tensión eléctrica, derrames químicos y/o tóxicos en entornos industriales, o la simple acción humana pueden poner en jaque nuestra capacidad de operar, tal y como explicábamos en el párrafo anterior.
En sistemas de la información, la estrategia más habitual de recuperación es aquella que implica el levantamiento de una réplica de la infraestructura en otro sitio, alejado del emplazamiento habitual, donde haya podido acontecer el desastre. Así hablamos de sitios calientes, templados, fríos y sitios espejo calientes. Hay otra estrategia importante, que es la relativa a la pérdida del personal, pero esa está vinculada a la gestión de recursos humanos, con lo que no entraremos en ella. Tampoco diferenciaremos entre sitios remotos, próximos o instalaciones de recuperación internas, quedando ésta elección a criterio de los responsables implicados.
Los sitios fríos son los indicados para sistemas con alta tolerancia a la indisponibilidad, cuando la recuperación se puede restablecer en dos o tres días. Los sitios templados están indicados para tolerancias de uno o dos días, y los calientes son aquellos emplazamientos cuya tolerancia ante la indisponibilidad es muy limitada, requiriéndose una recuperación total en el plazo de cuatro a 24 horas. Los sitios calientes tipo espejo son los indicados para tolerancia cero ante los tiempos de recuperación, y por tanto, funcionan de un modo paralelo entrando en acción inmediatamente después de que el centro de datos principal haya colapsado. Son por tanto, sistemas redundantes.
Recuperarse ante un desastre no es fácil. Una vez que hemos salvaguardado los datos, toca decidir en qué orden vuelven a la normalidad los procesos abatidos. Normalmente, los procesos que más rentabilidad ofrecen son los que deberían ser activados primero, si bien el orden de la recuperación varía sustancialmente en función de muchos parámetros.
Otra tarea común es la recuperación de las líneas de contacto y de servicio a los clientes, la cual obviamente es vital. La telefonía o los sistemas de atención online a la clientela deben ser rápidamente levantados, por motivos obvios.
Para elaborar un plan de recuperación no existe una metodología fija. Cada cuenta es independiente de las demás en cuanto a sus requisitos de recuperación y los impactos que la discontinuidad puede tener en sus operaciones. No obstante, es frecuente contemplar, al menos, éstos ocho pasos o fases de alto nivel a la hora de establecer una estrategia de recuperación ante desastres:
1) Inicialización del plan. Es el punto de comienzo, donde deberían definirse la meta del plan y los objetivos específicos que sean necesarios.
2) Gestión del riesgo y evaluación de los potenciales emergencias. La única manera de poder ordenar adecuadamente los procesos de recuperación es ordenando previamente los desastres que podemos sufrir, así como la evaluación de los mismos en términos de discontinuidad, así como su impacto técnico-económico en la organización.
3) Preparación para las posibles emergencias, identificado claramente los métodos de recuperación de copias de seguridad y otras técnicas de recuperación colaterales que pudieran ser necesarias.
4) Recuperación tras los desastres, donde deben quedar claramente definidos los pasos a seguir por los equipos de recuperación, especialmente en los casos donde haya riesgo de pérdida de vidas humanas.
5) Recuperación del negocio, ya que una vez aplicado el plan se pretende que el negocio como conjunto vuelva a la normalidad.
6) Pruebas del proceso de recuperación, en las que se pueden diagnosticar fallos y corregir deficiencias en las fases anteriores.
7) Entrenamiento del personal para el proceso de recuperación, ya que a fin de cuentas, el personal es el que ejecuta los planes.
8) Actualización constante del plan de recuperación, para mantener al día los procedimientos establecidos, así como la lista de emergencias potenciales y su valoración probabilística de riesgo.
Los planes de recuperación son un enfoque que corrige un error frecuente, que es aquel en el que caen muchas organizaciones que estiman que la recuperación consiste únicamente en levantar los backups y paliar los daños en infraestructura. Son sin duda factores importantes, pero no son los únicos.
Y para vencer las reticencias que provoca la inversión en consultoría y mantenimiento de un plan de recuperación, sólo hay que pensar que sucedería si usted perdiera todos sus activos de información y no tuviera posibilidad de recuperarlos, o si no los recuperase a tiempo, o si al recuperarlos los datos no fueran consistentes. ¿Merece la pena?