全4508文字
PR
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 データ圧縮は既に多くの用途で使われているが、今後、デジタルツインやメタバース、ライフサイエンス等において膨大な量のデータが発生すると考えられる中、さらなる発展が必要とされている。例えば3Dのビデオ会議システムを実現する米グーグルのProject Starline1)は今のビデオ会議システムの数十倍(30M~100Mビット/秒)の伝送容量を必要とする。

著者の岡野原大輔氏
著者の岡野原大輔氏

 データ圧縮は大きく可逆圧縮と非可逆圧縮に分類できる。可逆圧縮は圧縮後のデータから元のデータを誤りなく復元できる方法でありテキストなどに適用される。これに対し非可逆圧縮は多少の誤りを許して復元する方法であり、誤りを許す代わりに高い圧縮率を達成でき、画像や音声、動画などに適用される。ここでは非可逆圧縮を考える。

 こうした圧縮手法は、データが備える特徴や制約を考慮し専門家が設計し実現していた。これに対し近年では学習ベースの圧縮手法が多く登場している。