まだ話題に上っていない技術や、今後話題になりそうな開発アイデアを探り出し、その内容を丁寧に解説します。
Sexy Technology
目次
-
大規模言語モデルに“眼”が備わる、グーグルSayCan カメラ画像を直接解釈しロボット行動生成
ロボットへの応用が進みつつある大規模言語モデル(LLM)。そこにまた新たな進化が起きた。LLMといえばテキストを扱うためのモデルだが、そのLLMがなんとカメラを使って周囲の状況を認識・把握できるようになったのだ。
-
NECのロボット動作生成技術が進化、スキルの能動学習や大幅な高速化を実現
NECが独自のロボット制御技術の強化を進めている。最新の開発成果を披露する発表会を2023年3月に開催し、乱雑な場所や向きに置かれた物をロボットアームが指定の場所に運ぶ「Pick & Place」タスクなどを実演した。
-
拡散モデルがロボットの行動生成AIに、ネット動画などを事前学習
「Stable Diffusion」や「Midjourney」、「DALL·E 2」など世界的な注目を集める画像生成AI。このAIをロボットの行動生成に応用する技術が登場した。画像生成AIは当初はテキストから静止画を生成するのみだったが、最近になって5秒ほどの短い動画も生成できるようになってきた。
-
注意機構をLSTMで置き換え最高精度、立教大らが意表を突く画像認識DNN
画像など空間方向に広がったデータの認識はCNN。言語といった系列データの処理にはLSTM。この常識は既に過去のものになった。状況を大きく変えたのが、2017年に登場したTransformerである。
-
デンソーITラボが新アンサンブル学習技術、ベイジアンニューラルネットで最高水準の精度や頑健性
デンソーが100%出資する子会社、デンソーアイティーラボラトリ(デンソーITラボ)が、複数のDNNから成るアンサンブルシステムを高性能化する研究を進めている。車載などの組み込み機器を主力とするデンソーグループの同社が、サーバー上で動作する大規模な機械学習モデルを手掛けるのはなぜか。
-
物理演算エンジンで大規模言語モデルを増強、力学問題の正答率を大幅向上させる技術が登場
「ChatGPT」などで大きな注目を集める大規模言語モデル(LLM:large language model)。2022年10月号で解説した「SayCan」のように、LLMはロボット分野でも行動生成AIとして適用が進みつつある。
-
グーグルのすごいロボット技術、後続版が早速登場、ついに制御器側にメス
米グーグルが2022年に発表した斬新なロボット技術「SayCan」。「ChatGPT」と似たような大規模言語モデル(LLM)をロボットの行動生成に生かすもので、本誌では2022年10月号で解説したが、このたびその後続技術が早速、グーグルから登場した。
-
富士通が説明可能AIの新技術、「羅生門集合」で多様な解釈を発見
機械学習で作成したモデルの挙動を人にわかりやすく説明することを目指す、いわゆる「説明可能なAI」の技術で、富士通が新基軸を打ち出した。説明可能なAIでは、通常は特定のモデルの動作を分析の対象とする。
-
アンサンブル学習はどうすれば性能アップできるのか、日立製作所が実務に役立つ新理論を提唱
機械学習モデルの精度を高める手法の1つにアンサンブル学習がある。同じ入力を複数のモデルに与え、それぞれのモデルの出力を統合して最終的な判断を下す手段である。
-
数枚の教師データ、再学習なしで画像セグメンテーション ソフトバンクが最高精度の新技術
ディープラーニング(深層学習)の課題として、しばしばやり玉に挙げられるのが、学習に大量のデータが必要なことである。このハードルを超えるために、様々な手法が以前から開発されてきた。例えば画像認識の分野では、Few-shot learningと呼ばれる技術がある。
-
動作計画にも大規模データの力、NVIDIAと米大、300万超の軌道で学習し成功率アップ
ロボットのマニピュレーションにおいて多関節アームの動きを生成する、いわゆる動作計画(motion planning)にも、ディープラーニング技術によるデータ駆動・大規模化の流れが到来した。
-
ソニーが新型の深層生成モデルを自社開発、まずは高性能VAEの利用を容易に
2022年夏、「Midjourney」や「Stable Diffusion」といった画像生成AIが世間の話題をさらった。言葉で内容を指定すると自動的に絵を描いてくれるサービスで、誰でも高品質の画像を手軽に入手できることから人気を集めている。
-
強化学習で2足歩行ロボの100m走ギネス世界記録、sim-to-realで実機へ
強化学習技術の利用が2足歩行ロボットにまで広がってきた。2022年9月、米国のロボットベンチャーであるAgility Robotics社と米Oregon State University(OSU)が、自社の2足歩行ロボット「Cassie」で100m走を行い、24.73秒で2足歩行ロボットとしてのギ…
-
パナソニックが探る実ロボット向け世界モデル、マルチモーダル統合や実空間との一致へ
パナソニックが、工場や流通現場などで使うロボットに、モデルベースの強化学習を適用するための研究開発を着々と進めている。2022年の9月から10月にかけて、最新の成果を相次いで公表。
-
巨大クレーンの制御に強化学習技術、劣駆動でも巧みに操る
高さ数十mもある巨大な建機、クレーンの操縦を自動化する技術が登場した。強化学習技術を手掛けるAIベンチャーのDeepXと、建設用クレーンメーカー大手のタダノが共同開発した。
-
自動運転の安全性を数学的に証明する技術、NIIが運転ルールの構築法を開発
自動運転車の安全性を保証する究極の方法が登場した。国立情報学研究所(NII)の蓮尾一郎教授らの研究グループは、自動車が置かれた状況ごとに、安全性の確保と運転目標の達成を数学的に証明できる運転ルールを作成する手法「GA-RSS」を開発。
-
ついに来た、グーグル発のすごいロボット技術、大規模言語モデルをロボ身体を通じグラウンディング
米グーグルから、注目に値する“すごい”ロボット技術が登場した。同社が得意とするロボット向け機械学習技術の領域での成果だが、これまで漸進的な進化が続いてきた強化学習や模倣学習といった範疇の技術ではない。
-
数式生成の画像で超大規模データセットへ、産総研がディープラーニングの事前学習に新技術
ディープラーニングの研究で、米グーグルなどの大手IT企業が圧倒的に強いのはなぜか。理由の1つは、DNNの学習に巨大なデータセットを利用できることである。
-
スケールし始めたAI/IoTベンチャーのIdein、エッジAIの能動学習でMLOpsに挑む
激安ボード「ラズパイ(Raspberry Pi)」全機種に標準搭載されているGPUで、ディープニューラルネット(DNN)推論の高速化を実現してしまったベンチャーを覚えていらっしゃるだろうか。ラズパイSoCの製造元はそのGPUを汎用計算に使うためのライブラリやツールなど一切提供していないにもかかわら…
-
東芝が物体検出DNNの新技術を開発、未見の画像1枚のみで再学習なしで高精度実現
東芝が2022年5月に発表した物体検出DNNの新技術は、非常に目を惹く特徴を備えている。学習用のデータに存在しなかった物体でも、画像を1枚〜数枚登録するだけで高い精度で検出できるようになることだ。しかもDNNを再学習(ファインチューニング)する必要がなく、その場ですぐ検出が可能になるのである。