全4851文字
PR
富士通のコンピューティング事業本部計算科学事業部の末安史親氏
富士通のコンピューティング事業本部計算科学事業部の末安史親氏
2012年に新卒で富士通入社。スーパーコンピューターの運用SE。「富岳」の運用担当として、利用者の実行したい処理について、富岳を構成する15万以上のノードに割り当てる「ジョブスケジューリング」が主な仕事。「京」時代も運用を担当した経験を持ち、富岳の運用ソフトウエア開発にも携わった。休日は2歳の子どもを公園に連れて行くことで息抜きしている(画像提供:富士通)
[画像のクリックで拡大表示]

 理化学研究所(理研)と富士通が共同開発したスーパーコンピューター(スパコン)「富岳」。2021年3月9日から学術・産業向けに、共同で利用する「共用」を始めた。スパコンの共用計算環境基盤であるHPCI(High Performance Computing Infrastructure)を通じてサービス提供する。

 ウイルスの飛沫シミュレーションや防災・減災、創薬などに活用されている「富岳」。そんな富岳には、運用SE(システムエンジニア)の存在が欠かせない。運用面から支えている運用SEの1人が、富士通コンピューティング事業本部計算科学事業部の末安史親だ。

 富岳は15万8976ノード(CPU)を接続する超並列計算機である。富士通によれば、富岳の性能は理研の先代スパコン「京」の最大100倍のアプリケーション実効性能を持つ。京と比較すると、「富岳では処理能力や計算のスピードが飛躍的に改善した」(富士通)。処理能力は京では10PFLOPS(ペタフロップス)だったのに対し、富岳ではその約50倍の537PFLOPSにもなる。

富岳と一緒に撮影(飛沫防止のため、フェースシールド着用)
富岳と一緒に撮影(飛沫防止のため、フェースシールド着用)
出所:富士通
[画像のクリックで拡大表示]

 FLOPSはコンピューターの処理能力の単位であり、1秒間に浮動小数点演算(コンピューターの数値演算方式の1つで、数値を仮数部と指数部に分けて表現する)が何回できるかの能力を表す。1P(ペタ)は10の15乗だ。計算スピードは、一例では京だと約24時間かかっていた計算が、富岳だと100分の1の10分ほどでできる。

 2020年6月には、スパコン性能ランキングの「TOP500」(LINPACKの演算性能)をはじめ、「HPCG」(産業利用などのアプリケーションでよく用いられる性能)、「Graph500」(多数の頂点と枝から成る大規模なグラフを解析する性能)、「HPL-AI」(AI関連でよく用いられる半精度演算の性能)のそれぞれで1位を獲得し、世界ランキング4冠を達成した。

 同時4冠達成は世界初のことで、日の丸ITベンダーの底力を世界に知ってもらうきっかけとなった。

富岳の筐体(きょうたい)。総ラック数は432ラック、1ラックあたり8台または4台のシェルフを搭載する。内蔵するCPUは富士通が開発した「A64FX」。英Arm(アーム)の命令セットアーキテクチャーを使い、1CPUあたり32ギビバイト(GiB)のメモリーを搭載する
富岳の筐体(きょうたい)。総ラック数は432ラック、1ラックあたり8台または4台のシェルフを搭載する。内蔵するCPUは富士通が開発した「A64FX」。英Arm(アーム)の命令セットアーキテクチャーを使い、1CPUあたり32ギビバイト(GiB)のメモリーを搭載する
出所:富士通
[画像のクリックで拡大表示]

スパコン上で実行される「ジョブ」を管理

 富岳の運用SEとはどのような仕事なのだろうか。主な仕事内容は大きく3つ。1つは研究者など利用者の管理作業。利用者やそれぞれの利用実績を管理する。2つめはハードウエア故障に備えた保守だ。富岳は数多くの部品から成り立っており、一部の部品が故障することもある。そのような場合でも、システム全体では運用を継続できるように管理する。

 3つめは、ジョブ運用設定(ジョブスケジューリング)だ。スパコン上で動かす利用者の計算処理の単位を「ジョブ」と呼んでおり、スパコン上でジョブを実行する上で管理が必要となる。さらにジョブをどのノードで実行するか、リソースを管理する。ノードは演算処理を実行する最小単位だ。富岳は1日あたり最大で数万件のジョブをこなすこともある。

 末安は主にジョブスケジューリングを担当している。富岳に携わる人数は1000人以上いる。そのうち、運用SEと構築メンバーは富士通で30人から40人ほどだという。