♦ 冗長設計とは
冗長とは、重複していたり不必要に長かったりするなど無駄が多いという、普段はネガティブな意味で使われることが多いワードです。一方、コンピュータシステムなどでは、耐障害性を高めるためにネットワークを含むシステム全体を二重化して予備システムを準備することを指し、信頼性と安全性を確保した状態であるというポジティブな意味で使われます。
冗長設計を理解するには、まずエラープルーフ ( Error Proof)との関係性を理解する必要があります。故障や不具合が発生しないように、あるいは発生しても通常の機能や安全性を維持できるように予め設計する概念をエラープルーフといい、冗長設計とはエラープルーフの対策の一つといえます。
1.エラープルーフ化の原理
- 排除: 作業や注意を不要にする
- 代替化: ヒトが作業しなくても良いようにする
- 容易化: 作業を易しくし、エラーを発生しにくくする
- 異常検出: エラーに気付くようにする
- 影響緩和: エラーの影響を致命的なものにならないようにする
1~3はエラーが発生しないようにする「発生防止」の設計で、4と5はエラーが発生した場合の「波及の防止」設計です。5の影響緩和の基本的な考え方も「波及の防止」であり、エラーが発生してもその影響が小さく、他へ波及することを防ぐ工夫であってその中に冗長化、フェイルセーフ、保護などがあります。
ここまでの説明が長くなりましたが冗長化、冗長設計はスタートではなく、故障や不具合が発生しないように、あるいは発生しても通常の機能や安全性を維持できるようにという思想のもと、1~4の対策を実施した上で、または実施ができない場合、その先にあるものという理解をしていただきたいと思います。
図1 エラープルーフと冗長化の関係性
2.冗長システムの方式と冗長設計の具体例
1) 並列冗長(parallel redundancy)
ホットスタンバイとも呼ばれており、機器の故障に対してもシステムに影響がないように機器を並列に多重化する方式です。平常時から待機系の電源を入れてあります。例えば、分析機器のデータを保管するハードディスクは本来、1台でも問題ありませんが稼動しているハードディスクと常に同じ動作を行ういわゆるミラーリングの状態にしておくことでデータを失わずに済みます。稼動系とミラーリング状態になっていれば、故障が発生しても即座に待機系に切り替えられ、故障の発生前と変わらずシステムの稼働が継続できます。このような仕組みはフォールトトレラントシステムと呼ばれるものの一種です。
医薬品の安全性のために、データが完全で一貫性があり、正確であることは製薬業界において必須事項です。一方で、医薬品申請の電子化に伴い欧米の場合、当局が発信する査察指摘事項(Warning Letter)の過半数がデータ管理不備を指摘するものです。国際標準化が進む製薬業界において、グローバル化・電子化に対応するためには、ハードディスクの冗長化の取り組みが急務となっております。
2) m/n 冗長(m-out-of-n system)
n個の同じ機能で構成された機器のうちm個以上の機器が正常に作動していれば、システムの状態は正常であるという方式です。重要な測定機器をすべて信用しないで、二重三重の体制を整えておくというもので、例えば3個の回路のうち2個以上が動作すれば原子炉を停止させる2 out of 3同時回路方式や、工程能力指数の著しく低いものの検査で、検査結果の誤りを防止するために一つのサンプルを3人の検査員に分析させ、2つの結果が一致した場合に正しいと判定するなどがあります。
3) 待機冗長(stand-by redundancy)
コールドスタンバイとも呼ばれ、機器が故障した場合、その機器に代わる機器を待機(スタンバイ)しておき故障が起こった際、機器に切り替える方式です。通常は待機系に電源が投入されておらず故障などが発生した時、手動または自動で待機系を起動します。システム...