2012年2月2日木曜日

世界一のスパコン「京」のすごさ その2


変数が多ければ当然、解き終わるまでの時間もかかる。
数学の時間、連立方程式を解くとき、2元1次方程式ならササッと解けても、3元1次方程式になると手こずった経験があるだろう。
計算時間はほぼ変数の数の3乗に比例している。
11,870,208元の連立一次方程式を解くのに、「京」は29時間28分動き続けた。

現在のスパコンは超並列システムであり、多数のコンピュータをつないでいる。
たとえ1台あたりの故障確率が10年に一度だとしても、1000台並列したものでは3~4日に1度はどこかが故障する計算になる。
「京」は82,944個ものCPUを並列した計算機である。
CPU1個あたりの故障確率がもし10年に1度だとしたら、1時間に1回はどこかのCPUが壊れているという計算になってしまう。

東京工業大学の松岡教授によると、中国の世界2位であるスパコン天河1AのMTBF(MeanTime Between Failure:平均故障間隔)は6時間とのことである。
つまり、天河1Aは6時間に1ヶ所が故障しているわけである。
それに比べるとより大規模である「京」が30時間近く無故障で動いたというのはすごいことであることが分かるであろう。

天河1AのLINPACK測定時間は4時間程度だったと推定されている。
なぜなら6時間に1度故障してしまうので、連続運転時間は6時間以内に限られる。
安全率を見込んで4時間程度で解き終わる変数の数に抑えたのだろう。
天河1Aの解いた変数は3,600,000変数だったそうである。
「京」の1/3にすぎない。

0 件のコメント: