IT用語集

アーカイブとバックアップの違いとは?

水色の背景に六角形が2つあるイラスト 水色の背景に六角形が2つあるイラスト
アイキャッチ
目次

データの大容量化が進む中、企業のデータ管理で意識しておきたいのが「アーカイブ」と「バックアップ」の違いです。どちらも「データを保存する」点では似ていますが、目的保存の考え方も別物です。両者を混同すると、コストが増えるだけでなく、障害対応や監査対応で困る原因にもなります。

この記事では、アーカイブとバックアップの概要、違い、区別すべき理由、運用のポイントまで整理します。読み終えるころには、「どのデータをアーカイブに回し、どのデータをバックアップで守るべきか」を判断しやすくなることを目指します。

アーカイブとは

この章では、アーカイブの目的と、長期保管で重要になる要件(原本性・保持・検索)を整理します。

アーカイブとは、長期保管が必要なデータや、利用頻度が下がったデータ(コールドデータ)を、改ざんされにくい形で安全に保管する考え方・方式です。言葉としてのアーカイブには「保管所」「記録」「公文書」「保存文書」「書庫」といった意味があります。

アーカイブの目的

アーカイブの目的は、今すぐ頻繁には使わないが、失うと困るデータを長期にわたり保持することです。特に「いつ作られ、誰が関与し、保存後に改ざんされていないこと」を説明できる状態が求められるデータと相性が良くなります。具体的には、次のようなデータが対象になりやすいです。

  • コンプライアンス・監査対応で保存が求められる記録(例:契約関連、証憑、ログ)
  • コーポレートガバナンスの観点で原本性や証跡が重要なデータ
  • 研究・開発データ、過去の設計資産など「後から価値が出る」情報資産
  • 長期の傾向分析に必要なログ、映像、センサーなどの大量データ

アーカイブの保存方法

アーカイブしたデータは、稼働中のシステムやファイルサーバーなどのストレージから切り離し、用途に適したメディアや保管層へ移します。たとえば、光ディスク、磁気テープ、クラウドストレージのアーカイブ階層やコールド階層などです。

運用としては、「上書きして更新する」というより、一定の単位で保管し続ける(蓄積する)形になりがちです。あわせて、長期保管では改ざん防止(WORM相当、不変性、保持期間の統制、証跡)や、検索・取り出し(監査対応、eDiscovery等)も重要になります。

アーカイブで意識したいポイント

  • 保持期間(Retention):何年保存するのか、期限後にどう廃棄するのか
  • 原本性・改ざん対策:保存後に書き換えられない状態をどう担保するか
  • 取り出し要件:必要なときに、誰が、どのくらいの時間で取り出せるべきか

運用で詰まりやすいポイント

アーカイブは「置いておけばよい」わけではありません。代表的な詰まりどころは、保存対象の線引き検索性です。保存ルールが曖昧だと、重要な記録が抜けたり、逆に不要なデータまで溜まり続けてコストが膨らみます。また、必要時に見つけられないと監査対応が破綻します。どの属性(期間、部署、案件、文書種別、ログ種別など)で探せるべきかを先に定義し、メタデータ設計と合わせて運用することが重要です。

バックアップとは

この章では、バックアップの目的(復旧)と、RPO/RTOや世代管理など「戻すための設計」を整理します。

バックアップとは、システムやデータが障害・誤操作・ランサムウェアなどで失われたときに備え、復旧のためにデータを複製して保存しておく考え方・方式です。言葉としてのバックアップには「予備」「代替」「後援」などの意味があります。

バックアップの目的

バックアップの目的は、万一のときに速やかに復旧(リストア)できる状態を作ることです。対象は「ホットデータ」に限られず、業務に必要なデータやシステム全般が該当します。

たとえば、次のようなケースでバックアップは必要になります。

  • ストレージ障害・サーバー障害でデータが破損した
  • 誤操作でファイルやDBを削除した
  • 更新ミスでデータが壊れたので元に戻したい
  • ランサムウェアで暗号化されたため、正常な状態へ戻したい

バックアップの保存方法

バックアップの基本は、同一データを複数の別の場所や媒体へコピーし、復旧手段を確保することです。一般的に、フル(完全)バックアップに加えて、差分・増分バックアップ、スナップショットなどを組み合わせます。

運用面では「上書きしていく」イメージが強いものの、実際には世代管理(一定期間の履歴を残す)が重要です。特にランサムウェア対策では、感染後でも戻れる世代を残しておくことが実務上の生命線になります。

バックアップで意識したいポイント

  • RPO:どこまでのデータ損失を許容するか(復旧時点)
  • RTO:どのくらいの時間で復旧すべきか
  • 復旧テスト:バックアップがあるだけでなく戻せることの確認
  • 不変性(イミュータブル):バックアップ自体が改ざん・削除されない設計

運用で詰まりやすいポイント

バックアップは「取っているのに戻せない」が最も危険です。典型例は、復旧手順が属人化している、必要な権限やキーが揃っていない、復旧対象の優先順位(何を先に戻すか)が決まっていない、といった状況です。RPO/RTOは数値として決めるだけでなく、復旧の段取り(順序・責任者・手順・所要時間)まで落とし込むことが重要になります。

アーカイブとバックアップの違い

両者の違いを、項目別に整理します。

目的

アーカイブ:利用頻度は低いが重要なデータを、証跡性も含めて長期保管する。

バックアップ:障害・誤操作・攻撃などから、システムやデータを復旧する。

対象データ

アーカイブ:コンプライアンスや監査対象データ、研究・開発データ、アクセスログ、過去の映像・計測データなど、長期価値がある・保存義務があるデータ。

バックアップ:受発注、顧客、経理・財務、人事、商品、各種業務DB、共有ファイルなど、業務継続に必要なデータやシステム。

なお、バックアップ対象の中でも利用頻度が下がり、かつ長期保管要件が強いものは、アーカイブへ移す(切り分ける)運用が現実的です。

保存の考え方

アーカイブ:保持期間や原本性を意識し、改ざん防止・証跡・検索性を重視する。運用としては「蓄積」寄りになりやすい。

バックアップ:復旧のために、一定期間の世代(履歴)を確保しつつ運用する。目的はあくまで「復旧可能性」である。

利用機会

アーカイブ:必要に応じて参照・提出・検索して利用する(頻度は低いが、必要時は正確さが重要)。

バックアップ:障害や事故、攻撃が起きたときに復旧手段として利用する(迅速性が重要)。

考慮すべき指標

アーカイブ:保持期間、原本性、不変性、検索性、取り出し時間、廃棄手順など。

バックアップ:RPO、RTO、世代数、バックアップウィンドウ(取得にかけられる時間)、復旧テストの頻度など。

アーカイブとバックアップを区別すべき理由

企業データが増え続ける中で、両者を区別することには大きな意味があります。

ストレージの容量とコストを最適化できる

ファイルサーバーや業務システムに残しっぱなしになっているデータの中には、日常業務ではほとんど参照されないものも少なくありません。長期保管が目的のデータをアーカイブへ切り分けることで、稼働系ストレージの容量を圧迫しにくくなり、性能や運用の見通しも良くなります。

バックアップ運用が軽くなる

バックアップ対象が肥大化すると、バックアップ時間・保管容量・復旧時間が増えやすくなります。アーカイブを適切に切り分けることで、バックアップが「復旧に必要なもの」に集中でき、結果として復旧の確実性を高めやすくなります。

セキュリティと監査対応が整理しやすくなる

長期保管が必要な重要データは、改ざんや漏えいを防ぐために、保持期間・アクセス権・証跡管理などを明確にしておく必要があります。アーカイブはこうした要件と相性がよく、バックアップとは別枠で管理したほうが統制が取りやすいケースが多いでしょう。

ランサムウェア対策としての設計がしやすくなる

近年はバックアップが削除される、暗号化される被害も現実的です。バックアップの不変性(イミュータブル化)や世代管理を強化しつつ、アーカイブ側も保持・改ざん耐性を意識して設計することで、復旧と証跡の両面でリスクを下げやすくなります。

まとめ

アーカイブは長期保管(原本性・保持・検索)、バックアップは復旧(RPO/RTO・復元性)が主目的です。似ているようで役割が違うため、両者を混同せず、データの性質(頻度・重要度・保持義務)に応じて切り分けて運用することが重要です。

増え続けるデータを無理なく管理するためにも、まずは「どれが復旧のためのデータで、どれが長期保管のためのデータか」を棚卸しし、アーカイブとバックアップを分けて設計・運用していくことをおすすめします。

アーカイブとバックアップの一番の違いは何ですか?

アーカイブは長期保管を目的とし、バックアップは障害や事故からの復旧を目的とします。

アーカイブは永久保存しないといけませんか?

必ずしも永久ではありません。法令や規程、監査要件に沿って保持期間を決め、期限後は適切に廃棄します。

バックアップはホットデータだけが対象ですか?

いいえ。業務継続に必要なデータやシステムであれば対象になります。重要なのは復旧が必要かどうかです。

アーカイブしたデータはすぐ取り出せますか?

保存先によって取り出し時間や手順が変わります。要件としてどのくらいの時間で取り出せればよいかを決めて設計することが重要です。

バックアップがあればアーカイブは不要ですか?

目的が異なるため、バックアップだけでは不足することがあります。長期保管や証跡性、検索性が求められるデータはアーカイブで管理したほうが運用しやすい場合があります。

アーカイブで重要なセキュリティ対策は何ですか?

保持期間の統制、アクセス権管理、改ざん防止、不変性、暗号化、取り出し手続きの整備などが重要です。

バックアップで重要なセキュリティ対策は何ですか?

世代管理、不変性、権限分離、別環境への保管、定期的な復旧テストが重要です。

世代管理とは何ですか?

一定期間、複数の過去時点のバックアップを残す運用です。誤操作やランサムウェアなど、いつ壊れたか分からないケースで役立ちます。

アーカイブとバックアップは同じ保存先に置いてもいいですか?

要件次第ですが、同一障害や同一攻撃で同時に失うリスクが高まるため、分離を意識した設計が推奨されます。

まず何から見直すのが現実的ですか?

データの棚卸しを行い、復旧が必要なものと長期保管が必要なものを切り分けるところから始めるのが現実的です。

記事を書いた人

ソリトンシステムズ・マーケティングチーム