PR

 MTBFとMTTRは、システムの信頼度を総合的に評価するときに使う指標である。システムの信頼度は、信頼性(Reliability)や可用性(Availability)、保守性(Serviceability)などで評価される。MTBFは信頼性、MTTRは保守性を示す指標で、MTBFとMTTRから可用性を示す指標の「稼働率」を算出できる。

 MTBFは、Mean Time Between Failuresの略で、平均故障間隔と訳される。システムが稼働し続けた時間の平均を表す。システムが期間中に稼働した時間の合計を、障害が発生した回数で割って求める。MTBFが大きければ大きいほど、故障しにくいシステムだといえる。

 一方のMTTRは、Mean Time To Repairの略で、平均修復時間と訳される。システムに障害が発生してから復旧するまでにかかった時間の平均を表す。期間中に修復にかかった時間の合計を、障害の発生回数で割って求める。MTTRが小さければ小さいほど、復旧しやすいシステムだといえる。

 もう一つ挙げた稼働率は、システムが稼働している確率を指す。具体的には、期間中に稼働した時間の合計を全体の時間で割って求める。既にMTBFとMTTRがわかっている場合は、MTBFを、MTBFとMTTRの和で割っても同じ値が求められる。

並列システムの稼働率を計算する

 冗長な構成で信頼度を上げる手法として、並列システムがある。二つのシステムを並べて稼働させて、もし一方のシステムがダウンしても、もう一方が稼働していれば処理を継続できるシステムだ。それぞれのシステムの稼働率がわかれば、並列システムの稼働率を計算できる。

 図で示したシステムの稼働率は0.985である。このシステムを並列化したときの稼働率は、1-(1-0.985)の2乗=0.999775となる。「1-0.985」は一方のシステムが故障する確率であり、「(1-0.985)の2乗」は両方が同時に故障する確率である。両方が同時に故障しなければ処理を継続できるので、1から両方が同時に故障する確率を引けば、並列システムの稼働率になる。

●システムの稼働例
●システムの稼働例
[画像のクリックで拡大表示]