全2200文字
PR

 日立製作所と日本IBMがデータサイエンティストの技術交流会を開いた。2社がデータサイエンス領域で交流するのも、両社の間で技術コンペを開くのも初めてという。あらゆる業界でデータ活用への関心が高まる中、データサイエンティストは引っ張りだこの状況。多忙な彼ら彼女らを1日とはいえ通常業務から離れさせ、あまつさえ競合でもある企業同士で交流させる狙いはどこにあるのか。

 2023年3月8日、東京都国分寺市の日立製作所中央研究所。構内では数万本の木々が若草色に装いを変え始め、さまざまな鳥のさえずりが響く。技術交流会は、日立が「協創の森」と位置付ける同研究所内の一角で開かれた。

 テーマはサイバー攻撃の判別だった。学習用とテスト用、本番用の3種類のデータセットを用いる。学習用のデータを基に、サイバー攻撃があったか否か、どんな攻撃かを見分けるAI(人工知能)を作成し、その性能を競うコンペ形式の交流会だ。日立と日本IBMから各6人のデータサイエンティストが参加した。双方の参加者が2人ずつ入った合計4人の混成チームを結成し、3チームが腕を競った。

日立製作所と日本IBMのデータサイエンティストが混成チームを組み腕を競った
日立製作所と日本IBMのデータサイエンティストが混成チームを組み腕を競った
(撮影:日経クロステック)
[画像のクリックで拡大表示]

 午前10時30分から午後5時までの作業時間中に、チーム全体で42回までテスト用データセットを使ってAIの性能をテストできる。会場のパネルでは各チームが何回テストしたか、最高性能はどれだけだったかをリアルタイムに表示する。本番用データセットはテスト用とは異なるデータのため、テストで高いスコアを目指しつつ、テスト用に特化し過ぎないことも重要なポイントだという。

 この日は86.96%の精度で攻撃を見抜いたチームが優勝を収めた。優勝チームは表彰式で工夫点などを解説し、他チームからの質問にも答えた。普段は製造業の画像認識を主に担当するデータサイエンティスト、データ加工を得意とするデータエンジニアなど多様性に富むメンバーで、得意分野に合わせて作業を分担したという。さまざまなアプローチのモデルが集まったことで、アンサンブル学習により最終的なAIの精度が向上したと振り返った。