Prevenire il Bit Rot

Il decadimento dei dati (a volte indicato come “Data Rot”) può corrompere i tuoi .jpgs mentre stanno oziosamente sul tuo disco rigido. Quanti dei TUOI preziosi ricordi si stanno deteriorando sui tuoi supporti di memorizzazione in questo momento?

Mi preoccupo del decadimento dei dati. Molto. Ho già alcune centinaia di .jpgs corrotti sul mio hard disk che i programmi standard di controllo del file system come CHKDSK (usato in Microsoft Windows) non sono stati in grado di trovare o riparare.

Il problema ha due cause principali: 1) supporti fisici che perdono l’orientamento e la forza magnetica (questo è il tipo di problema che CHKDSK e il file system sottostante di solito eccellono nel trovare e risolvere), e 2) la copia di massa soggetta a errori quando si trasferiscono i dati da un disco rigido all’altro, o dalla fotocamera al computer. Di solito tale copia non impiega alcun controllo di verifica.

Un altro, più comune esempio di corruzione .jpg – immagine e colori spostati.

I codici di rilevamento e correzione degli errori (come quelli impiegati a livello di bit ogni volta che il disco rigido scrive qualcosa sul disco) sono ottimi per recuperare un errore di un bit, ma non sono progettati per gestire errori di due bit (che sono statisticamente molto meno probabili) ed è per questo che c’è una buona probabilità che tu non abbia mai sperimentato il problema.

Il mirroring dei dischi (e le configurazioni RAID in generale) non vi aiuterà in questo caso, poiché se c’è un errore nel file sarà semplicemente copiato sul secondo disco.

Che fare? Beh, non c’è una soluzione automatica set-it-and-forget-it al momento (sento odore di opportunità di business!), tuttavia ci sono alcuni strumenti disponibili per l’archivista serio:

1) Ci sono strumenti di verifica dell’integrità dei file là fuori. Il modo in cui funzionano è che il programma esegue la scansione di una directory sana e genera quello che è noto come un “hash” (che si può pensare come un checksum complesso). È quindi possibile eseguire lo stesso programma di scansione in futuro e ricalcolerà gli hash e li confronterà con quelli vecchi, dicendovi se qualcuno dei vostri file originali è cambiato. Lo strumento non guarda solo i dati e il tempo, ma la totalità degli 1 e degli 0 nel file. Uno strumento popolare si chiama ExactFile. L’aspetto negativo di questi programmi è che una volta trovato un problema, cosa si fa dopo? Non è chiaro cosa si può fare per recuperare l’errore. L’altro lato negativo è che ogni volta che si accede intenzionalmente / modifica quel file si deve ri-generare l’hash. (Il TERZO aspetto negativo è che devi avere la lungimiranza di generare gli hash prima che i dati marciscano.)

2) Ci sono strumenti gratuiti che puoi scaricare che cercano in tutte le directory specifici tipi di file (come i file di immagine) e controllano se sono corrotti. (Alcuni funzionano anche su file di film e altri file speciali. Ma non ho visto NESSUNO strumento che possa lavorare su una moltitudine di tipi di file, compresi i file di Microsoft Office per esempio). Ecco uno che ho usato personalmente per scoprire centinaia di .jpgs corrotti sul mio disco rigido, e c’è una versione per Mac e PC:

Ok, quindi una volta trovati alcuni file immagine corrotti, come possono essere riparati? Nella mia esperienza, i programmi di riparazione .JPG sono efficaci e prevedibili quanto quei programmi che cercano di recuperare le immagini da schede di memoria corrotte – è un disastro. Ho passato alcuni giorni a esaminare innumerevoli recensioni di siti web di programmi di riparazione .jpg e non sono rimasto impressionato dalla percentuale di successo o dal metodo di test dell’autore dell’articolo. Quindi non posso raccomandare nulla perché non ho avuto molto successo con i pochi che ho provato. (E se qualcosa ha funzionato per me, allora non funzionerà necessariamente per voi.)

Tuttavia, nella mia ricerca sono stato in grado di scoprire un bizzarro sito web che offre un servizio di recupero .jpg, e se il loro strumento automatico non può farlo per voi, allora dicono di avere uno staff esperto che andrà a sistemare il .JPG a mano, analizzando la struttura e facendo una modifica a livello di byte. (Non c’è niente di meglio della vecchia maniera!) Se sapete davvero cosa state facendo questo metodo promette il più alto tasso di recupero possibile. Ecco il loro sito web e l’altro loro sito web.

Prevenzione

Ci sono due cose che dovresti fare ORA per proteggerti dalla futura putrefazione dei dati:

1) Ricorda che IN MEDIA anche il supporto di memorizzazione più resistente probabilmente si consumerà dopo 5 anni. Oltre ai regolari backup giornalieri (e mantenendo un terzo set a rotazione fuori sede per proteggersi da incendi o furti), consiglio vivamente di implementare una replica / aggiornamento dei dati ogni 3 anni circa. Questo significa essenzialmente copiare l’intero set di dati su un nuovo disco rigido ogni tanto. Mentre questo vi aiuterà a proteggervi contro la perdita magnetica di alcuni bit, se avete già dei .jpgs corrotti a causa di una copia sciatta, allora anche quei file corrotti verranno copiati.

2) Smettete di copiare i file usando il file manager del vostro computer (Finder o Windows Explorer) e iniziate a usare un programma di copia e verifica dei file come Teracopy (Windows) o Ultracopier (per OSX, Linux e Windows). Questi programmi richiedono il doppio del tempo ma avrebbero eliminato la fonte primaria dei miei .jpgs corrotti se li avessi usati dal giorno 1.

3) Utenti avanzati: I file system industriali come ZFS (Unix / Linux), MacZFS, o l’emergente ReFS di Microsoft (Windows Server 2012, Windows 8.1) promettono di essere più resistenti e proattivi nell’affrontare questi tipi di problemi di rotazione dei dati. Sono il file system del futuro (finché i nostri set di dati non diventano più grandi e vecchi, cioè 🙂 ).

A proposito, gli strumenti menzionati sopra non sono affatto esaustivi. Se avete uno strumento o un metodo che affronta questo problema, per favore postatelo nella sezione commenti. Tutti dovrebbero imparare dalla vostra esperienza.

=== PARTE 2 ===

Accidenti, ho ricevuto molte e-mail dal blog del mese scorso! La maggior parte delle persone non aveva idea che anche se facevano backup regolari e controllavano regolarmente il file system, i loro preziosi file erano ancora vulnerabili alla corruzione.

Così ho imparato che ogni volta che colpisco un nervo scoperto come questo, ha senso scavare più a fondo. Uno dei migliori suggerimenti usciti dai commenti del blog è stato il rafforzamento dell’idea di usare un file system più avanzato come ZFS (Unix) o ReFS (Microsoft Windows 8.1, una ragione convincente per aggiornare proprio lì! Uno dei modi più convenienti e più facili per una persona tecnicamente incline a farlo è quello di scaricare e installare FreeNAS su qualche vecchio computer e farlo agire come server. È gratuito (tranne che per l’hardware), e i tuoi dati ottengono il livello extra di protezione che meritano senza che tu debba cambiare computer o sistema operativo.

Opzioni di archiviazione

Parliamo un po’ di più sull’archiviazione. I CD e i DVD NON sono la strada da percorrere, poiché hanno una vita media dei dati di 3-5 anni. Ecco perché i vostri CD degli anni ’80 probabilmente non suonano più troppo bene. Questo tipo di impermanenza di memorizzazione preoccupa molto la Biblioteca del Congresso, che attualmente sta facendo ricerche sul problema – infatti, stanno cercando attivamente le vostre donazioni di CD e DVD che non suonano più per le autopsie. Ecco una succinta dichiarazione del problema dalla rivista Atlantic.

C’era una volta la migliore opzione là fuori, un CD speciale (ora anche DVD) il cui strato riflettente era fatto d’oro. Inizialmente prodotti da Kodak e ora offerti da Verbatim (tra gli altri), dichiarano una permanenza di 100 anni ma questo articolo dice che potrebbero non essere leggibili in ogni lettore DVD perché lo strato d’oro non è così riflettente come l’argento che si degrada facilmente. Cos’è meglio? Il Taiyo-Yuden / JVC Thermal-Lacquer DVD che ha la massima compatibilità e si dice che duri circa 80 anni.

Poi c’è MDISC, l’azienda che sostiene di avere 1.000 anni di durata per i dischi DVD e Blu-Ray ed è leggibile ovunque. Usa un masterizzatore appositamente modificato come questo, e i piatti costano circa 3 dollari l’uno per il DVD e 5 dollari l’uno per il Blu-Ray. Non male.

Chiunque inizi a blaterare su “Sì, ma ci saranno lettori in giro tra 1000 anni?” sta facendo la domanda sbagliata. Dopo aver letto i recenti resoconti dei livelli di sforzo richiesti per recuperare l’arte digitale di Andy Warhol dai suoi vecchi floppy disk Amiga, o la massiccia impresa di resuscitare l’immagine originale di Earthrise dai vecchi nastri della NASA, ci si rende subito conto che non è necessario aspettare 1.000 anni (o anche 50 anni) perché le cose diventino illeggibili. Potrei effettivamente investire in questo perché mi illudo che la mia roba valga la pena di essere conservata. Inoltre, mio padre è anche molto preoccupato per la longevità dei film di famiglia. (Non sa che il formato originale della pellicola durerà molto, molto più a lungo della copia VHS o della successiva incarnazione DVD. Oh, l’ironia!)

.

Leave a Reply