La importancia de conocer los desafíos de la recuperación de datos

Nicholas Green, director de la empresa Kroll Ontrack, aborda en este articulo los principales retos para la recuperación de datos en los sistemas de almacenamiento más comunes.

Pocos pondrán en duda que, así como los grandes avances tecnológicos de los últimos cinco años han aumentado la productividad, también han incrementado la dificultad asociada a la recuperación de datos. Un problema que, unido a las nuevas y robustas soluciones de almacenamiento empresarial, se agrava exponencialmente.

Hoy todas las organizaciones gestionan enormes cantidades de datos estructurados y desestructurados en bases de datos tradicionales, entornos virtuales y en la nube. Con el almacenamiento en distintas ubicaciones, y una gran disponibilidad, la información se mueve constantemente entre los usuarios, lo que dificulta a las empresas conocer dónde está su información en un momento dado. A esto se suma la posibilidad de que se produzcan errores humanos que eliminen la información accidentalmente. El conjunto de estos factores complica mucho la recuperación en caso de una pérdida de datos.

Hoy en día, los principales retos para la recuperación de datos en los sistemas de almacenamiento más comunes son los siguientes:

“Domando” la nube

Muchas organizaciones se han lanzado demasiado rápido a ceder el control de su información más crítica a proveedores en la nube. Desafortunadamente, muchos aún desconocen qué problemas pueden sufrir y cómo es el proceso de recuperación en caso de pérdida de datos.

Existen dos situaciones habituales que agravan claramente la recuperación de los datos en casos de pérdida. La primera viene dada porque pese a que la información de una compañía está aislada, muchos clientes acceden al mismo espacio de almacenamiento físico. Cuando se produce un fallo o pérdida de datos de un cliente específico, los proveedores del servicio a veces cortan el acceso al entorno, para tratar de proteger a otros clientes. La segunda se produce porque muchos proveedores usan sus equipos virtuales o de almacenamiento propietarios, y no comparten detalles sobre la configuración de sistema para proteger su propiedad intelectual, lo que impide investigar y desarrollar la solución correcta.

Es fundamental que las empresas entiendan la importancia de contratar un acuerdo de nivel de servicios (SLA) con su proveedor y conozcan sus límites antes de que ocurra la pérdida. La mejor garantía es que el proveedor de soluciones de almacenamiento en la nube trabaje con una compañía de recuperación de datos de confianza, que ofrezca servicios completos, y sea capaz de minimizar el tiempo de inactividad causado por fallos en el almacenamiento o incluso errores por parte del cliente como el borrado accidental de discos virtuales. De esta forma, los clientes sabrán dónde y cómo está almacenada su información, y cómo se recuperarla si ocurriera una pérdida.

El quebradero de cabeza de la virtualización

Fallos en los equipos, borrado de elementos o corrupción de archivos son algunos de los casos de pérdida de datos comunes. Pero hay  un verdadero desafío respecto a la recuperación de datos en entornos virtuales: al estar formado por un equipo físico unido a varios equipos virtuales, si falla el dispositivo físico puede provocar fallos de otros equipos, aumentando el impacto de la pérdida de datos. Además, encontrar las partes de la información y recomponerla es complicado, porque ésta está fragmentada en la plataforma de almacenamiento y en constante movimiento. Si a esto le añadimos que puede haber archivos pequeños, nos encontramos ante un verdadero puzzle de recuperación.

Los entornos virtuales contienen muchos grupos de datos, y la clave para no sobrecargar el almacenamiento está en equilibrar la capacidad de carga. El usuario tiene la oportunidad de colocar grandes cantidades de información en un solo entorno de almacenamiento pero el desafío surge a la hora de recuperar datos a esta escala, y tener las herramientas para recuperarlos totalmente y devolvérselos al cliente correctamente. Además de la cantidad de información, una menor fragmentación conlleva una mayor tasa de éxito. Grandes cantidades de datos dificultan encontrar los fragmentos individuales o los discos virtuales específicos necesarios para volver a montar los equipos virtuales dañados o borrados.

Discos duros de estado sólido

Los discos duros de estado sólido, SSD, basados en flash, ofrecen grandes beneficios como alta velocidad (baja latencia de lectura, acceso aleatorio, y tiempo de puesta en marcha), bajo consumo, ligereza, silenciosos, y muy resistentes a golpes. Esto, añadido a que el coste por gigabyte está disminuyendo rápidamente, ha disparado su  adopción y la cantidad y valor de los datos que almacenan, haciendo que una futura pérdida de datos sea catastrófica para los negocios o clientes involucrados.

Muchos creen que los SSD son inmunes a la pérdida de datos debido a la falta de partes móviles, comparados con los equipos tradicionales (HDD). Sin embargo, aunque es menos probable que se dañen  por una caída, pueden sufrir pérdidas de datos y sus características únicas hacen muy compleja la recuperación.

En el caso más extremo, la recuperación de datos de SSD puede llevar mucho tiempo debido a la necesidad de investigar qué algoritmos se usaron en un principio para almacenarlos. Con los SSD, la ubicación de los datos cambia cada vez que se reescribe, complicando mucho más la recuperación. Además, dependiendo de la complejidad del dispositivo y de las capacidades que tenga –  código de corrección de errores (ECC), recopilación de elementos no utilizados, técnicas de volumen dividido, compresión, encriptación,  etc. – la tarea de reordenar la información se complica, haciendo que el proceso pueda llevar desde unos pocos días a varias semanas.

Los discos SSD aún están en los primeros momentos de su ciclo de vida tecnológica y varían enormemente de un fabricante a otro y entre las distintas gamas del mismo fabricante. ¡Incluso a veces  pueden ser diferentes dentro del mismo modelo! Las variaciones se deben principalmente a cambios, mejoras, y puestas al día del firmware que los fabricantes llevan a cabo para mejorar la operatividad de los dispositivos y para cumplir con las demandas de los consumidores; sin embargo, este proceso añade dificultad y complejidad a la recuperación.

Es importante que, además de conocer los retos que presenta esta tecnología, se desarrollen normas y soluciones de recuperación en paralelo a la evolución del SSD con el objetivo de infundir confianza en los “integradores” de almacenamiento y clientes, para adoptar y mejorar la tecnología de discos duros de estado sólido.

¿Qué hay en tu base de datos?

La recuperación de una base de datos, ya sea por daños en equipos físicos, corrupción de bases de datos internas, o un borrado de datos, no es tan sencillo como se podría pensar. Cada base de datos es única y compleja, con una estructura interna distinta a otras, con diversas versiones y mejoras que aparecen constantemente. Los proveedores de recuperación de datos deben seguir todos estos formatos y mejoras para conseguir que la recuperación sea un éxito.

Además, los datos dañados, borrados o que faltan pueden crear una serie de problemas en la recuperación, ya que es necesario un análisis exhaustivo de la compleja estructura interna de la base de datos. Cuando un dispositivo de almacenamiento no está operativo, o un sistema de archivos necesita ser reparado, muchas empresas piensan que es imposible. Aunque no lo es, requiere que se reconstruyan los archivos de la base de datos a partir de fragmentos en bruto. Con todos estos escenarios posibles, el método de recuperación debe permitir a los consumidores el acceso a sus datos cuando hayan sido recuperados.

Otro desafío que se presenta es el de los datos físicos frente a los datos lógicos. Cuando falla el hardware, muchos proveedores de recuperación de datos intentan recuperar tan solo información a nivel físico, pero ignoran el nivel lógico. Los proveedores tienen que ser capaces de sacar los datos confidenciales útiles para los consumidores del nivel virtual, además de datos físicos de los distintos sistemas y configuraciones de archivos, para a una recuperación total y de calidad.

Conclusión

Cuando una organización tiene sus datos, ya estén estructurados o no, en muchas ubicaciones distintas la recuperación en caso de pérdida se hace más complicada. Ya estén alojados en una base de datos tradicional, un disco duro de estado sólido, un entorno virtual o en la nube, cada uno presenta una serie de desafíos al intentar la recuperación. Por tanto, es recomendable que tanto empresas como particulares, hablen abiertamente con sus proveedores de almacenamiento para saber dónde están sus datos en todo momento. Además, deben asegurarse de que en caso de pérdida de datos, conocen el protocolo del proceso de recuperación y los procedimientos a seguir para minimizar al máximo el impacto en el entorno empresarial y salvar los datos confidenciales de la empresa.