Prevención de la descomposición de los bits

La descomposición de los datos (a veces denominada «Data Rot») puede corromper sus .jpgs mientras permanecen en su disco duro. ¿Cuántos de tus preciados recuerdos se están deteriorando en tus medios de almacenamiento en este momento?

Me preocupa el deterioro de los datos. Mucho. Ya tengo unos cuantos cientos de .jpgs corruptos en mi disco duro que los programas estándar de comprobación del sistema de archivos como CHKDSK (utilizado en Microsoft Windows) han sido incapaces de encontrar o arreglar.

El problema tiene dos causas principales: 1) que el soporte físico pierda su orientación y fuerza magnética (este es el tipo de problema que CHKDSK y el sistema de archivos subyacente suelen encontrar y solucionar), y 2) la copia masiva con errores al transferir datos de un disco duro a otro, o de la cámara al ordenador. Por lo general, este tipo de copia no emplea comprobaciones de verificación.

Otro ejemplo más común de corrupción de .jpg: imagen y colores cambiados.

Los códigos de detección y corrección de errores (como los que se emplean a nivel de bits cada vez que su disco duro escribe algo en el disco) son excelentes para recuperar un error de un bit, pero no están diseñados para manejar errores de dos bits (que son estadísticamente mucho menos probables), por lo que es muy probable que nunca haya experimentado el problema.

La duplicación de discos (y las configuraciones RAID en general) no le ayudarán en este caso, ya que si hay un error en el archivo simplemente se copiará en el segundo disco.

¿Qué hacer? Bueno, ahora mismo no hay una solución automática de tipo «ponlo y olvídalo» (¡huelo una oportunidad de negocio!), sin embargo hay algunas herramientas disponibles para el archivero serio:

1) Hay herramientas de verificación de la integridad de los archivos. La forma en que funcionan es que usted hace que el programa escanee un directorio sano y generará lo que se conoce como un «hash» (que se puede considerar como una suma de comprobación compleja). A continuación, puedes ejecutar el mismo programa de escaneo en el futuro y éste volverá a calcular los hash y los comparará con los antiguos, indicándote si alguno de tus archivos originales ha cambiado. La herramienta no sólo mira los datos y la hora, sino la totalidad de los 1 y 0 del archivo. Una herramienta muy popular se llama ExactFile. La desventaja de estos programas es que una vez que se encuentra un problema, ¿qué se hace entonces? No está claro qué se puede hacer para recuperarse del error. El otro inconveniente es que cada vez que se accede o se modifica intencionadamente ese archivo hay que volver a generar el hash. (El TERCER inconveniente es que hay que tener la previsión de generar los hash antes de que empiece la putrefacción de los datos.)

2) Hay herramientas gratuitas que se pueden descargar y que buscan en todos los directorios tipos de archivos específicos (como archivos de imagen) y comprueban si están corruptos. (Algunas también funcionan con archivos de películas, y otros archivos de propósito especial. Pero no he visto ninguna herramienta que pueda trabajar en una multitud de tipos de archivos, incluyendo los archivos de Microsoft Office, por ejemplo). Aquí hay una que he utilizado personalmente para descubrir cientos de .jpgs corruptos en mi disco duro, y hay una versión para Mac y para PC:

De acuerdo, así que una vez que has encontrado algunos archivos de imagen corruptos, ¿cómo se pueden arreglar? En mi experiencia, los programas de reparación de archivos .JPG son tan eficaces y predecibles como los programas que intentan recuperar imágenes de tarjetas de memoria dañadas: es una mierda. He pasado unos días revisando innumerables reseñas de sitios web sobre programas de reparación de .jpg y no me ha impresionado la tasa de éxito o el método de prueba del autor del artículo. Así que en realidad no puedo recomendar nada porque no he tenido mucho éxito con los pocos que he probado. (Y si algo funcionó para mí, entonces no necesariamente va a funcionar para usted.)

Sin embargo, en mi investigación pude descubrir un sitio web extravagante que ofrece un servicio de recuperación de .jpg, y si su herramienta automática no puede hacerlo por usted, entonces dicen que tienen un personal experimentado que va a ir y arreglar el .jpg a mano mediante el análisis de la estructura y haciendo una edición a nivel de bytes. (Si realmente sabes lo que estás haciendo, este método promete la mayor tasa de recuperación posible. Aquí está su sitio web y su otro sitio web.

Prevención

Hay dos cosas que debería hacer AHORA para protegerse de la pérdida de datos en el futuro:

1) Recuerde que, EN PROMEDIO, incluso el medio de almacenamiento más duradero probablemente se desgastará después de 5 años. Además de las copias de seguridad diarias y regulares (y de mantener un tercer conjunto rotativo fuera del sitio para protegerlo contra incendios o robos), recomiendo encarecidamente implementar una Replicación / Actualización de datos cada 3 años aproximadamente. Esto significa esencialmente copiar todo su conjunto de datos a un disco duro nuevo cada cierto tiempo. Mientras que esto le ayudará a protegerse contra la pérdida magnética de ciertos bits, si usted ya tiene corruptos .jpgs debido a la copia descuidada entonces esos archivos corruptos se copiarán también.

2) Deje de copiar archivos usando el administrador de archivos de su computadora (Finder o el Explorador de Windows) y comience a usar un programa de copia y verificación de archivos como Teracopy (Windows) o Ultracopier (para OSX, Linux y Windows). Estos programas tardan el doble, pero habrían eliminado la fuente principal de mis .jpgs corruptos si los hubiera utilizado desde el primer día.

3) Usuarios avanzados: Los sistemas de archivos industriales como ZFS (Unix / Linux), MacZFS, o el prometedor ReFS de Microsoft (Windows Server 2012, Windows 8.1) prometen ser más resistentes y proactivos a la hora de abordar este tipo de problemas de pérdida de datos. Son el sistema de archivos del futuro (hasta que nuestros conjuntos de datos se vuelvan más grandes y viejos, es decir. 🙂 ).

Por cierto, las herramientas mencionadas casualmente arriba no son en absoluto exhaustivas. Si usted tiene una herramienta o método que aborda este problema, por favor, publicar en la sección de comentarios. Todo el mundo debería aprender de su experiencia.

=== PARTE 2 ===

¡Caramba, he recibido un montón de correos electrónicos del blog del mes pasado! La mayoría de la gente no tenía ni idea de que a pesar de que estaban haciendo copias de seguridad periódicas y que hicieron una comprobación del sistema de archivos sobre una base regular, sus valiosos archivos eran todavía vulnerables a la corrupción.

Así que he aprendido que cada vez que golpeo un nervio como este, tiene sentido para profundizar. Una de las mejores sugerencias que surgieron de los comentarios del blog fue el refuerzo de la idea de utilizar un sistema de archivos más avanzado como ZFS (Unix) o ReFS (Microsoft Windows 8.1, ¡una razón de peso para actualizar justo ahí!) que está diseñado para combatir este mismo problema. Una de las formas más rentables y sencillas de hacerlo para una persona con conocimientos técnicos es descargar e instalar FreeNAS en algún hardware de ordenador antiguo y hacer que actúe como servidor. Es gratis (excepto el hardware), y sus datos obtienen el nivel extra de protección que merecen sin tener que cambiar de ordenador o de sistema operativo.

Opciones de almacenamiento de archivo

Hablemos un poco más sobre el almacenamiento de archivo. Los CDs y DVDs NO son el camino a seguir, ya que tienen una vida media de datos de 3 a 5 años. Por eso es probable que tus CDs de los años 80 ya no se reproduzcan demasiado bien. Este tipo de impermanencia en el almacenamiento preocupa mucho a la Biblioteca del Congreso, que actualmente está investigando el problema; de hecho, están buscando activamente tus donaciones de CDs y DVDs que ya no se reproduzcan para realizar autopsias. He aquí una sucinta exposición del problema en la revista Atlantic.

Hace tiempo, la mejor opción que existía era un CD especial (ahora también un DVD) cuya capa reflectante estaba hecha de oro. Inicialmente fabricados por Kodak y ahora ofrecidos por Verbatim (entre otros), afirman una permanencia de 100 años, pero este artículo dice que podrían no ser legibles en todos los lectores de DVD porque la capa de oro no es tan reflectante como la plata, que se degrada fácilmente. ¿Qué es mejor? El DVD de Taiyo-Yuden / JVC Thermal-Lacquer que tiene la compatibilidad más alta y se dice que dura unos 80 años.

Luego está MDISC, la compañía que dice tener 1.000 años de vida de almacenamiento para los discos DVD y Blu-Ray y es legible en todas partes. Utiliza una grabadora especialmente modificada como ésta, y los platos cuestan unos 3 dólares cada uno para el DVD y 5 dólares para el Blu-Ray. No está mal.

Cualquiera que empiece a decir «Sí, pero ¿habrá lectores dentro de 1.000 años?» está haciendo la pregunta equivocada. Después de leer los relatos recientes sobre los niveles de esfuerzo necesarios para recuperar el arte digital de Andy Warhol a partir de sus viejos disquetes Amiga, o la empresa masiva para resucitar la imagen original de Earthrise a partir de viejas cintas de la NASA, uno se da cuenta rápidamente de que no hay que esperar 1.000 años (o incluso 50 años) para que las cosas se vuelvan ilegibles. Puede que invierta en esto porque tengo la ilusión de que mis cosas merecen ser conservadas. Además, mi padre también está muy preocupado por la longevidad de las películas familiares. (No sabe que el formato original de la película durará mucho, mucho más que la copia en VHS o la posterior encarnación en DVD. Oh, la ironía!)

Leave a Reply