IT用語集

ネットワークの冗長化とは? メリットや方法など

水色の背景に六角形が2つあるイラスト 水色の背景に六角形が2つあるイラスト
アイキャッチ
目次

ネットワークの冗長化とは、回線、経路、機器、電源、周辺サービスをあらかじめ複数系統で設計し、一部に障害が起きても通信を継続しやすくする考え方です。通信断の発生確率と停止時間の両方を抑えやすくなる一方、構成は複雑になり、切替条件や監視、復旧手順まで設計しないと期待どおりに機能しないことがあります。

ネットワークは、メール、Web会議、SaaS、業務アプリ、顧客向けWebサービスなど、多くの業務の前提になっています。そのため、ネットワーク障害が起きたときに、どこまで通信を維持したいのかを先に決め、その目標に合わせて冗長化の範囲と方式を選ぶ必要があります。

冗長化とは

冗長化とは、必要な設備や機能を複数用意し、一部が故障してもシステムやサービスを継続しやすくする設計です。IT分野では、サーバー、ストレージ、ネットワーク機器、回線、電源、監視、手順書まで含めて、単一障害点を減らすために使われます。

ここで見るべきなのは「機器が二台あるか」ではありません。障害時にどう切り替わるか、どれだけ瞬断するか、通信セッションを維持できるか、誰がどの手順で復旧するかまで含めて初めて設計として成立します。

可用性の目標を先に決める

ネットワーク冗長化は、どこまで止められないかを決めずに始めると、過剰投資か設計不足のどちらかに寄りやすくなります。先に整理しておきたい項目は次のとおりです。

  • 許容できる停止時間
  • 切替時の瞬断をどこまで許容できるか
  • VPNやWeb会議のようにセッション維持が必要か
  • 対象範囲は拠点LAN、拠点間、インターネット出口、重要システムのどこか

この整理は、一般にRTORPOの考え方とも関係しますが、ネットワークでは特に停止時間、瞬断、セッション維持の扱いが方式選定を左右します。

ネットワークの冗長化とは

ネットワークの冗長化は、ある経路や装置に障害が起きても、別の経路や装置へ切り替えて通信を継続しやすくする設計です。対象は回線やルーターだけではありません。スイッチ、ファイアウォール、名前解決、アドレス配布、電源、配線経路、監視運用まで含めて見ないと、表面上は二重化されていても単一障害点が残ることがあります。

対象は「経路」だけではない

ネットワーク冗長化で確認すべき対象は、少なくとも次の五つに分けて考えると整理しやすくなります。

  • 通信経路:回線、上位回線、経路制御
  • 中継機器:ルーター、スイッチ、無線AP、ファイアウォール、負荷分散装置
  • 周辺基盤:電源、配線、ラック、空調、設置場所
  • 周辺サービス:DNS、DHCP、認証基盤
  • 運用:監視、切替手順、変更管理、定期テスト

たとえばルーターを二台にしても、両方が同じ電源系統、同じラック、同じ上位回線に依存していれば、障害の集中点は消えていません。設計段階では「どこでまとめて止まるか」を洗い出す必要があります。

ネットワーク冗長化で得られる主な効果

通信断による業務停止を起こしにくくできる

最大の効果は、障害が起きても通信が全面停止しにくくなることです。クラウド利用が増えた環境では、社内ネットワークやインターネット出口の停止が、そのまま業務停止につながりやすくなっています。可用性を高める設計として冗長化が選ばれるのはこのためです。

計画メンテナンスの自由度を上げやすい

片系を止めて機器交換や設定変更を行い、もう片系で通信を維持する構成を取れれば、夜間作業や計画停止の影響範囲を小さくしやすくなります。ただし、構成によっては切替時に瞬断が発生したり、メンテナンス中に性能が下がったりするため、事前検証は欠かせません。

負荷分散と組み合わせやすい場合がある

冗長化は可用性向上が主目的ですが、構成によっては通常時からトラフィックを分散させ、混雑や装置過負荷を抑えやすくなる場合があります。一方、Active/Standbyのように待機系が通常時には処理しない構成では、性能向上は限定的です。可用性を優先するのか、通常時の処理分散も狙うのかを分けて考える必要があります。

代表的な冗長化の方式

ネットワーク冗長化は、物理的な冗長化と論理的な冗長化に分けて考えると整理しやすくなります。論理的な冗長化は、OSI基本参照モデルのどの層で実現するかによって方式が変わります。

第1層:物理層の冗長化

物理層では、装置、配線、回線、電源、設置場所を物理的に複線化します。回線や機器を二重化していても、同じ配線ダクト、同じ電源、同じラックに依存していれば、工事や停電でまとめて影響を受けることがあります。

物理層で確認したい項目

  • 電源系統を分離できているか
  • ケーブルや回線の通過ルートが重なっていないか
  • 機器を同じ設置場所に集中させていないか
  • 予備機、予備部材、交換手順を確保しているか

第2層:データリンク層の冗長化

第2層では、リンク冗長とループ回避を同時に考えます。複数経路を作るだけではレイヤ2ループが発生するため、経路制御の仕組みが必要になります。

NICチーミング/ボンディング

NICチーミングやボンディングは、複数のNICを束ねて、片方の障害時でも通信を継続しやすくする方式です。サーバー側の冗長化で使われることが多く、スイッチ側設定との整合も確認する必要があります。

LACPを使ったリンクアグリゲーション

LACPを使うリンクアグリゲーションは、複数の物理ポートを一つの論理リンクとして扱う方式です。冗長化に加えて帯域確保にも使われますが、トラフィックの性質やハッシュ方式によっては、期待どおりに均等分散しないことがあります。

STP

STPは、複数経路があるレイヤ2ネットワークでループを避けるための仕組みです。冗長経路を用意していても、ループ制御を考えずに構成すると、ブロードキャストストームや経路不安定化を招くことがあります。どの経路を通常時に使い、どの経路を待機させるかを設計しておく必要があります。

第3層:ネットワーク層の冗長化

第3層では、ルーティング、デフォルトゲートウェイ、外部回線の冗長化が中心になります。拠点間通信やインターネット出口の継続性は、この層の設計に左右されやすくなります。

VRRP/HSRP

VRRPは、同一セグメント上の複数ルーターで仮想ルーターを構成し、デフォルトゲートウェイの役割を引き継げるようにする方式です。HSRPはCisco系機器で使われる代表的な同種の方式です。どちらも端末側のデフォルトゲートウェイ設定を固定したまま、障害時の切替を行いやすくします。

ただし、ゲートウェイ冗長だけでは十分ではありません。上流回線の断や、片系だけ外部到達性を失った状態まで検知できるようにしないと、機器は生きていても通信が成立しないままになることがあります。

マルチホーミング

マルチホーミングは、複数の外部回線や複数の接続先を持ち、回線断や上流障害の影響を受けにくくする考え方です。回線事業者の分離、引き込み経路の分離、経路制御の設計まで含めて考える必要があります。

第4層以降:装置HAとセッションの扱い

ファイアウォールや負荷分散装置では、HA構成を使って稼働系と待機系を組み、障害時に切り替える設計がよく使われます。ここで確認すべきなのは、切替時間だけではありません。セッション同期の有無、再接続の必要性、片系運転時の性能低下まで含めて見ておかないと、業務影響の見積もりがずれます。

設計で見落としやすい注意点

冗長化しても無停止が保証されるわけではない

冗長化は停止確率と停止時間を抑える設計であって、無停止を保証する仕組みではありません。切替時には瞬断が起きることがあり、アプリケーションによっては再接続が必要になります。VPN、Web会議、長時間転送のようにセッションの継続性が効く通信では、この差が利用者影響として表れやすくなります。

単一障害点は機器以外にも残る

機器を二重化しても、上流回線、電源、配線、DNS、DHCP、監視、変更手順が一系統のままなら、障害の集中点は残ります。設計レビューでは「どの障害でまとめて止まるか」を一覧化して確認するほうが確実です。

複雑化で運用事故が増えることがある

冗長構成は、切替条件、タイマー、ループ制御、経路制御、状態同期など、考慮項目が増えます。平常時には安定していても、設定変更時や障害時に想定外の挙動が出ることは珍しくありません。監視項目、アラートの閾値、一次対応手順、切替後の戻し方まで文書化しておく必要があります。

切替テストを省くと設計の成立性を確認できない

冗長化は、平常時の疎通確認だけでは成立性を判断できません。実際に片系停止、上流断、電源断、経路断などを模擬し、想定した順序で切り替わるか、性能とアプリ影響が許容範囲かを確認する必要があります。導入時だけでなく、構成変更後にも再確認したほうが安全です。

ネットワーク冗長化の進め方

1. 重要通信を棚卸しする

まず、止まると影響が大きい通信を洗い出します。拠点内LANだけでなく、インターネット出口、拠点間通信、クラウド接続、リモートアクセス、公開サービスまで、業務の流れに沿って整理します。

2. 許容停止時間と瞬断許容を決める

停止時間をどこまで許容できるか、数秒の瞬断が許されるか、セッション維持が必要かを決めます。ここが曖昧だと、方式選定とコスト評価がぶれやすくなります。

3. 単一障害点を洗い出して優先順位を付ける

機器、回線、電源、配線、周辺サービス、運用の各観点で障害の集中点を洗い出し、影響が大きい箇所から対処します。すべてを一度に二重化するより、停止時の影響が大きい部分から段階的に進めるほうが実行しやすくなります。

4. 監視、手順、切替テストまで含めて運用へ組み込む

冗長化は、障害を検知し、切り替え、復旧後に正常系へ戻せて初めて効果が出ます。監視項目、通知先、一次対応、エスカレーション、復旧確認、定期テストまで含めて運用設計を作る必要があります。

まとめ

ネットワークの冗長化は、回線や機器を増やすこと自体が目的ではありません。障害が起きたときに、どこまで通信を維持し、どの程度の停止や瞬断を許容し、誰がどの手順で復旧するかを事前に決め、その条件に合う方式を選ぶ設計です。

物理層では電源や配線経路の分離、第2層ではLACPやSTP、第3層ではVRRPやHSRP、外部接続ではマルチホーミング、装置側ではHA構成が代表的な選択肢になります。どの方式を選ぶ場合でも、単一障害点の洗い出し、切替条件の設計、監視、定期テストを省くと、障害時に想定どおり動かない可能性が残ります。

Q.ネットワークの冗長化とは何ですか?

A.回線、経路、機器、電源などを複数系統で設計し、一部に障害が起きても通信を継続しやすくする考え方です。

Q.冗長化と負荷分散は同じ意味ですか?

A.同じではありません。冗長化は可用性向上を主目的とし、負荷分散は通常時の処理分散や性能安定化を主目的とします。

Q.冗長化すればネットワークは絶対に止まりませんか?

A.絶対に止まらないとは言い切れません。切替時の瞬断や、電源、上流回線、設定ミスなど別の単一障害点で停止することがあります。

Q.物理的な冗長化とは何を指しますか?

A.機器、ケーブル、電源、回線引き込み経路、設置場所などを物理的に分離し、一つの故障が全体停止につながりにくいようにする対策です。

Q.第2層の冗長化で代表的な方式は何ですか?

A.NICチーミング、LACPを使ったリンクアグリゲーション、STPによるループ回避が代表例です。

Q.VRRPは何の冗長化に使いますか?

A.主にデフォルトゲートウェイの冗長化に使います。複数ルーターで仮想ルーターを構成し、障害時に引き継げるようにします。

Q.HA構成とは何ですか?

A.稼働系と待機系を用意し、稼働系の障害時に待機系へ切り替える構成です。切替時間やセッション維持の可否まで確認しておく必要があります。

Q.冗長化はセキュリティ対策になりますか?

A.冗長化そのものは可用性を高める設計であり、アクセス制御や攻撃遮断の機能ではありません。ただし障害時の影響範囲を抑える設計としては役立ちます。

Q.冗長化設計で先に決めるべきことは何ですか?

A.どれだけの停止時間を許容できるか、瞬断を許せるか、セッション維持が必要か、対象範囲はどこかを先に決めます。

Q.冗長化設計で外せない運用項目は何ですか?

A.監視、通知、切替手順、復旧手順、定期的な切替テストです。これらが整っていないと、障害時に設計どおり動かないことがあります。

記事を書いた人

ソリトンシステムズ・マーケティングチーム