全2952文字

 NeurIPS 2020では若手日本人研究者の活躍も目立った。ディープラーニングの流行をきっかけに、他の分野から移ってきた研究者も少なくない。沖縄科学技術大学院大学の小津野将氏(30)も、その1人だ。2度目の挑戦で、執筆論文が1%の採択率のオーラルに輝いた。それも米グーグル(Google)と英ディープマインド(DeepMind)との共同研究だ。どのようにAI(人工知能)研究の世界最高位を射とめたのか。同氏に聞いた。

(聞き手は市嶋 洋平=シリコンバレー支局)

小津野将(こずの・ただし)氏
小津野将(こずの・ただし)氏
2010年津山工業高等専門学校電気電子工学科卒、大阪大学工学部電子情報工学科に編入。14年同大学院生命機能研究科修了。20年12月まで沖縄科学技術大学院大学に在籍し、博士号を取得してジュニアリサーチフェロー。30歳
[画像のクリックで拡大表示]

なぜAI、特に今回の論文の成果につながる強化学習の理論を研究するようになったのか

 高等専門学校(高専)では半導体工学を学んでいたが、大阪大学に編入してから神経科学に興味を持った。沖縄科学技術大学院大学(OIST)に来て神経科学を続けようと思っていたところに、ディープラーニングがはやり始めた。2014年頃だったと思う。

 ディープラーニングをやってみると面白く、これが自分のやりたいことだと考えるようになり、この分野を研究するようになった。そしてディープラーニングのネットワークを研究しているうちに、なぜ正確に動くのかという理論に興味を持ち解析を始めた。これが今につながっている。

ディープマインドが新研究所を開設

 この理論解析では周囲に教えてくれる研究者がいなかったので自分で進めていたが、2018年に転機が訪れた。今回論文を一緒に執筆したレミ・ムノス氏がOISTに来訪した。OISTでは外部に研究計画を精査してもらうのだが、その試験官としてだ。そこでムノス氏からディープマインドがフランスのパリに研究所を開設するという話を聞き、インターンの募集があったら行かせてほしいと頼み込んだ。

 これがきっかけで2019年9~12月までディープマインドのパリのオフィスに行って共同研究をした。本当は半年の予定だったが、ビザの関係で3カ月間となった。ただ帰って来てからもリモートで共同研究を続けそれが今回の論文につながっている。

NeurIPS 2020で論文を発表する研究チームの代表。論文名は「Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning」
NeurIPS 2020で論文を発表する研究チームの代表。論文名は「Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning」
(出所:NeurIPS 2020)
[画像のクリックで拡大表示]

 今回の論文のファーストオーサーでグーグルリサーチのブレインチームのニノ・ヴィエルラード氏が実験を、私はセカンドオーサーで理論解析と論文執筆を担当するなどした。ディープマインドのパリ研究所の責任者となったムノス氏も参加している。