Latest evidence-based health information
Airpods

徹底的なデータ保存:データをアーカイブするための最適なメディアと方法

徹底的なデータ保存:データをアーカイブするための最適なメディアと方法
徹底的なデータ保存:データをアーカイブするための最適なメディアと方法

データのバックアップの重要性については多くのことが書かれていますが、提案されているメディアや方法は、一般的にアーカイブには適していません。 後世のためにデータを保護する、つまりアーカイブするには、異なるアプローチが必要です。メディアの保管期間や将来のファイル互換性は、一般ユーザーにとってバックアップの利便性とスピードよりも優先されます。

方法については後ほど説明しますが、ここではバックアップとアーカイブの目的で使用できるメディアの種類について説明します。

 外付けハードドライブ

AData HV620 ポータブルハードドライブ

ポータブル ハード ドライブは使いやすく、光学式よりも高速ですが、数年ごとにデータを更新する必要がある場合があります。

消費者がバックアップメディアとして最も多く利用しているのは、圧倒的に外付けハードドライブです。テープや光学式ドライブに比べて高速なハードドライブは、一般的に短期的には信頼性が高く、使用を中止して安全に保管すれば、磁気特性が低下して回復不可能なエラーが発生するまで10~20年は持ちます。しかし、継続的に使用すると、機械的なストレスによってドライブの寿命は3~5年に短縮されます。長期的には、棚に置いてあるハードドライブでも問題なく使用できますが、定期的なメンテナンスが必要なため、理想的とは言えません。

この10年か20年の寿命という数字は、現在のGMR(巨大磁気抵抗)およびSMR(瓦礫磁気抵抗)記録技術、そして最新のプラッターコーティングにおける保磁力と残留磁気に関する公表値に基づいています。磁力/信号損失は年間1%から10年間1%の範囲と推定されます。

動作していないドライブについては、2~3年ごとにリフレッシュ(データの書き換え)を行うのが業界の慣例です。ユーザーはDiskFreshという無料ソフトウェアを使ってこれを実行できます。 

環境も重要です。熱、振動、湿度、そして磁場(ハードディスクの消去には強力な磁場が使用されます)は、動作寿命や保管寿命を著しく縮める可能性があります。ハードディスクは衝撃に弱い機械装置でもあります。ドライブの取り扱いには万全を期しても、貸金庫から取り出す際に硬い床に落としてしまったら、復旧サービスに頼るしかありません。

アドバイス:アーカイブにハードドライブを使用する場合は、2台または3台で使用し、それぞれに同じデータのコピーを保存してください。保管前に書き込み保護(「方法」セクションを参照)を設定し、数年ごとにデータを書き換えてください。

外付けSSD

サムスン外付けSSD サムスン

Samsung の Portable SSD T1 は超高速で、USB 3.0 より最大 350MBps 高速ですが、ほとんどの NAND ベースのストレージは約 10 年程度しか持ちません。

外付けSSDは頑丈で、ほぼ耐衝撃性を備えていますが、使用されているNANDメモリはデータを永久に保持できるわけではありません。電子トラップであるセルは、時間の経過とともにリークが発生します。また、この技術は比較的新しいため、電源を入れずに保管した場合、SSDがどれくらいの期間データを保持できるかは定かではありませんが、長期バックアップを謳う企業は見当たりません。最良のケースとしては10年程度を想定していますが、それに頼るべきではありません。

アドバイス: SSD を使用する場合は、1 ~ 2 年ごとにデータを更新し、10 年ごとに交換してください。さらに良いのは、他のものを使用することです。

テープ

富士 LTO6M

LTO 6 2.5TB テープカートリッジ。

磁気テープは、企業向けとして依然として議論の的となっています。非常に大容量の製品があり、ソニー製の新型は最大185TBの容量を誇ります。また、リムーバブルメディアであるため、保管や大量処理が容易です。しかし、テープは伸びたり破れたり、磁場によって消去されたりする恐れがあります。また、高価で、取り扱いが難しく、データが順次保存されるため、ランダム検索は非常に遅くなります。さらに、経年劣化(磁気的および物理的劣化)も生じますが、その速度は使用されている材料に大きく依存します。

アドバイス:消費者の皆様、テープは使わないでください。高価ですし、もっと簡単な代替品があります。

光学

m デ​​ィスク mdbd

Milleniatta の M-Disc DVD および Blu-ray 記録可能ディスクの耐久性は 1,000 年です。

光学式ディスク(CD/DVD/Blu-ray)を映画やソフトウェアの配信手段としてのみ捉えているなら、時代遅れに思えるかもしれません。また、一般的なCD、DVD、BD-R(LTH)といった記録型・書き換え型ディスクも、アーカイブメディアとしては不適切だと思われがちです。その通りです。これらのディスクは、本質的に不安定な有機色素ベースのデータ層を使用しているからです。

しかし、消費者が利用できるアーカイブメディアの中で、間違いなく最も耐久性があり、最も便利な光ディスクがあります。ライトワンスBD-R HTL(High To Low)は、比較的穏やかな環境(フェニックスのダッシュボードなどではない)であれば、100年から150年保存できます。MilleniattaのライトワンスM-Disc BD-RおよびDVD+Rは、さらに安定したデータ層を採用しており、10,000年の耐久性を備えています。ポリカーボネートの外層によって、この耐久性はわずか1,000年に短縮されます。これはすべて理論上の話ですが、テストMOはフランス政府(BD-R)と海軍(M-Disc DVD)によって厳格に実施されました。

BD-Rは25GB、50GB、そして100GB(現在非常に高価)の容量が用意されており、長期バックアップやアーカイブにも十分な容量を備えています。欠点は、書き込み速度が最高21MBpsと比較的遅いことです。これはUSB 3.0対応のハードドライブやSSDよりも大幅に遅いです。

光学ドライブが消えてしまうのではないかと心配しているのであれば、光学ドライブは企業だけでなくアーカイブ コミュニティでも非常に強い存在感を保っていることを知っておくと安心できるでしょう。

アドバイス: 速度は遅いですが、光学式は最も重要なデータをアーカイブするのに最適です。

オンラインストレージ

CERN サーバー 100606241 オリジナル

CERN サーバーファーム

もし私が盲目的に信じるタイプなら、オンラインストレージを選んでそれで終わりにすると言いたいところです。とても簡単で便利ですし、AmazonのGlacier、BackBlaze、Google Drive、OneDriveなど、非常に安価なオンラインストレージサービスもあります。Glacierは、少なくともデータの取得が必要になるまでは、非常に安価です。

しかし、欠点もあります。まず、配信方法は魔法のように見えるかもしれませんし、データは「クラウド」に安全に保管されているとよく言われますが、実際には、データは他人のハードドライブやその他のメディアに保存されています。そのサービスが安全だと謳っている限り、それは変わりません。

さらに、月額料金や場合によっては転送料金といった継続的なコストも発生します。また、速度と可用性はオンライン接続によって制限されます(DSLはアップロード速度が非常に遅い場合が多い)。また、サービスがダウンするとアーカイブは利用できなくなります。プライバシーとセキュリティに関する懸念もあります。これらは些細な問題だとは思いますが、参考までにお伝えすると、NSAはほぼすべてのオープンソース暗号化プロジェクトに資金提供を行っていました。

注意点はさておき、データのオフサイトコピーを持つことは、バックアップとアーカイブの専門家たちが唱えるマントラの一つです。洪水、ハリケーン、火災、あるいは元配偶者の死などでローカルバックアップが破損した場合でも、別のバックアップに頼ることができます。

アドバイス:オンラインストレージを使用する場合は、ローカルバックアップのパートナーとして活用してください。とはいえ、アーカイブを全く行わないよりははるかに良いでしょう。

アクティブアーカイブ

ハードドライブの販売資料で説明なしに「アクティブアーカイブ」という言葉が飛び交わなければ、私は「アクティブアーカイブ」について言及することはなかったでしょう。アクティブアーカイブはハードドライブとは全く関係がありません。これは、ストレージエリアネットワーク(SAN)内のメディア間でデータをやり取りする単純な動作で、アクセス頻度の高いデータは最高速のメディア(RAMまたはSSD)に、アクセス頻度の低いデータは低速のテープや光学式メディアに保存し、ハードドライブはその中間の速度で保存することを目的としています。  

方法論

プロやエンタープライズ環境では、無数のバックアップ戦略が用いられています。ここでは、一般ユーザー(私のような)には時間も忍耐力もないため、複雑な戦略は避け、基本的な戦略に絞って説明します。

1. 3 つのルールでは、データのコピーを常に 3 つ (作業用コピー、バックアップ、バックアップのバックアップ) 保持することを規定しています。バックアップは別の場所 (業界ではオフサイトと呼ばれます) に保持することが望ましいとされています。

インターネットアーカイブ火災

オフサイト バックアップが必要な理由: この火災は、インターネット アーカイブのスキャン施設で発生しました。

アーカイブでは、前述の最初のコピーで作業しない場合がありますが、とにかく 3 つ (またはそれ以上) のルールに従ってください。

2. 些細なデータや未完成のデータは気にしない。法的文書や財務文書、大切な思い出の品、創作活動など、最終的な形になったかけがえのないデータだけをアーカイブしましょう。再ダウンロードや再インストールが可能だったり、まだ作業中だったりする場合は、アーカイブする必要はありません。時間と容量の無駄になるだけです。毎日のバックアップに任せましょう。また、アーカイブする前に、データの重複排除と整理を行ってください。

3. ライトワンスメディアを使用するか、書き換え可能なメディアを書き込み禁止にして、誤って上書きされる可能性を軽減してください。WindowsのDiskpartユーティリティを使用し、適切なドライブとパーティションを選択した後、「att vol set readonly」コマンドを実行することで、ハードドライブを書き込み禁止にすることができます。「set」を「clear」に置き換えると、再び書き込み可能になります。

4. 多くのバックアッププログラムが作成する独自のファイルコンテナ(小さなファイルを含む大きなファイル)や、可能であれば圧縮は使用しないでください。将来的にも読み取り可能であることが確実なファイルシステムまたはフォーマットを使用し、データをプレーンファイルとして保存してください。FAT、NTFS、HFS、EXT、ISO 9660、UDFなど、あるいはそれらの派生形式は、ある程度の期間読み取り可能であるはずです。どうしても圧縮が必要な場合は、ZIPなどの汎用的な圧縮形式を使用してください。

5. 可能な限り、独自のファイル形式は避けましょう。PDF/A、RTF、JPG、MPEGなど、将来的にも読み取り可能な形式を使用してください。今では、標準ファイル形式でデータをエクスポートしないプログラムはほとんどありませんが、もし使用する場合は、そのプログラムのインストールファイルをアーカイブしてください。特定のオペレーティングシステムやそのバージョンに依存している場合は、そのオペレーティングシステムにソフトウェアをインストールした仮想ハー​​ドドライブまたは仮想マシンを作成し、全体をアーカイブしてください。オペレーティングシステムのインストールファイルを保存することは可能ですが、ハードウェアの進化に伴い、ドライバが問題となる可能性があります。

6. 本当に機密性の高いデータ以外では暗号化を使用しないでください。パスワードは紛失したり忘れたりする可能性があります。これは長期的な問題であることを忘れないでください。

7. アーカイブに日付と記録を残します。メディアにはできるだけ詳細かつ具体的な名前を付けます。他に何もない場合は、マスキングテープとシャーピーを使いましょう。次回同じデータを再度アーカイブしても意味がありません。

IRSアーカイブ写真 国立公文書館

昔のIBMデータセンター。テープドライブ、データ入力技術者、ITスタッフ。

8. 技術の変化を尊重する。メディアが100年も持つからといって、それを読み取る技術も100年持つとは限りません。パンチカードが登場してからまだ50年ほどしか経っていないので、陳腐化のスピードは速いものの、予測は困難です。もし自分が使っていた技術が別の技術に完全に置き換えられていくのを感じたら、再アーカイブしましょう。とはいえ、ATAハードドライブを読み取る手段は今でも見つかりますし、ATAハードドライブは30年以上も前から存在しています。探せば、カリフォルニア州マウンテンビューのコンピュータ博物館にでも、パンチカードを読み取る手段が見つかるかもしれません。

やってみよう!

大きな赤いボタン 100263181 large.idge

世の中のどんな計画も、実行されなければ意味がありません。

アーカイブに関しては、必要に応じていくらでも増やしたり減らしたりできます。正直なところ、アーカイブコピーを1つ保存しておけば、おそらく何とかなるでしょう。しかし、本当に「おそらく」ということを考え続けたいと思うでしょうか?

背景の議論全体を飛ばして、簡単なアドバイスだけが欲しい人のために…

方法1:BD XLとM-Discに対応したBlu-rayバーナーを使用して、BD-R HTLまたはM-Disc BD-R/DVD+Rディスクにバックアップします。通常のCD/DVD記録/書き換え可能メディアや、相変化メディアであるBD-R LTHは避けてください。2~3部コピーし、少なくとも1部は信頼できる家族に送るか、貸金庫などに保管してください。データの追加頻度が比較的少ない場合は、M-Disc DVDを使用して既存のアーカイブに追加してください。

方法2:USB 3.0外付けハードドライブを2~3台用意し、重要なデータをバックアップして書き込み禁止に設定し、1台はローカルに保管し、もう1台は貸金庫に預けるか、信頼できる親戚に預けます。数年ごとにアーカイブを更新(コピーして、再度コピーし直す)してください。または、前述のDiskFreshを使用するのも良いでしょう。

上記の方法の 1 つまたは両方をオンライン ストレージで補強します。

これらすべてを少なくとも年に一度(数年ごとにハードドライブをリフレッシュするなど)、新しいプロジェクトが完了した時などに実行してください。個人的には、確定申告を済ませたらすぐにアーカイブします。それほど重要なのですが、残念ながら、楽しさもほぼ同じです。それより劣るものがあると思いますか?

データが失われます。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.