全3918文字
PR

 前回の記事では、最近の米グーグル(Google)や世界のコンピューター科学分野の論文出版数のデータに注目することで、今後のITに関する技術トレンドの分析を試みました。今回は、ここに論文の引用関係というデータの分析を加えることで、人工知能(AI)に関する新しい技術の研究がどのように広がっていったかを具体的に可視化した事例を紹介します。

 エルゼビアが提供している世界最大級の抄録・引用文献データベース「Scopus(スコーパス)」では、過去に発表された論文が、その後に他の論文に何回引用されたかを調べて集計しています。ある論文が他の論文に引用されたということは、その論文が他の論文にインパクトを与え、技術の発展に貢献したということを意味します。また、引用の回数を数えることで、その論文がどれだけのインパクトを与えたのかを客観的に測ることができます。

 例えば、最近のコンピューター科学分野の引用回数が上位の論文に、2016年に発表された「Deep residual learning for image recognition」というタイトルのAIの技術に関する論文があります*1 。この論文は、深層学習(ディープラーニング)に使われる畳み込みニューラルネットワークにおいて、「ResNet(Residual Network)」と呼ぶ新しいモデルを考案し、AIを使った画像分類の性能の飛躍的な向上を実現しています。

*1  He, K., Zhang, X., Ren, S. & Sun, J. 2016, "Deep residual learning for image recognition", Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 770.

 この論文は、Scopusに収録されている他の論文に、合計約2万回引用されています。ちなみに、Scopusに収録されている16年に発表されたコンピューター科学分野の論文の平均の被引用数は約5.7回です。そのため、この論文は、分野平均の約3500倍(20000 ÷ 5.7 ≒ 3500)も引用されている、世界でもトップクラスを誇るインパクトの大きい論文であるといえます。

 このように、ある新しい技術を発表した重要論文を特定することができれば、その論文を引用している論文群を分析することで、その技術が他の研究テーマにどのように応用されていったかを調査することができます。

ResNetを応用した技術が広がったプロセス

 例えば、図1は16年のResNetの論文を引用している約2万件の論文の研究トピックが、16~19年にかけて各分野に広がっていったプロセスを表しています。

図1●ResNetの論文を引用している論文のトピックの分野の広がり(2016~19年)。データソースはScopus。19年2月19日時点での分析。
図1●ResNetの論文を引用している論文のトピックの分野の広がり(2016~19年)。データソースはScopus。19年2月19日時点での分析。
(出所:エルゼビア)
[画像のクリックで拡大表示]

 この図で、色付きの「◯」は論文の研究トピックを、◯の大きさは各研究トピックの論文数を、◯の色はトピックの主要な研究分野を表しています。また、外側の円周に論文の研究分野が割り当てられており、特定の分野の論文が多いトピックは円周付近に、複数の分野の論文がいずれも多い学際的なトピックは円の中央付近に表示されます。

 16年時点では、濃い青色の大きなトピックといくつかの小さなトピックのみが表示されています。濃い青色は、コンピューター科学分野の論文が多いトピックであることを意味します。吹き出しが付いた大きな◯のトピックは、畳み込みニューラルネットワークのアルゴリズムに関する研究トピックを表しています。まずは、モデルそのものに関する研究が発展していったことが分かります。このトピックは、17年以降も論文数が最大のトピックとして研究が続いていきます。

 一方、17年、18年、19年と年を経るにつれて、他の色、つまり他の分野のトピックも増加しています。例えば、赤は医学、薄い青系の色は工学や材料科学、緑系の色は生化学や農学、環境学などの生命科学系の分野を意味しています。ここからは、この技術の応用範囲がコンピューター科学以外のさまざまな分野へと広がっている様子がうかがえます。

 次に、いくつか具体的なトピックを見てみたいと思います。前回の記事の分析で、データプライバシーに関する研究が最近の注目トピックの1つであるという結果が得られました。そこで、16年のResNetの論文を引用しており、かつ「Privacy」というキーワードを含む論文を検索し、それらの論文のトピックを分析してみます。

図2●ResNetの論文を引用しているPrivacyに関する論文のトピックの分野の広がり(2016年以降)。データソースはScopus。20年2月19日時点の分析。
図2●ResNetの論文を引用しているPrivacyに関する論文のトピックの分野の広がり(2016年以降)。データソースはScopus。20年2月19日時点の分析。
(出所:エルゼビア)
[画像のクリックで拡大表示]

 トピックの色を見ると、濃い青色以外の色のトピックがいくつか見られます。これらは、ResNetをコンピューター科学以外の分野でのデータプライバシー研究に応用した研究を発表した論文といえます。研究トピックのキーワードとして、「Traffic control(交通管理)」や「Construction industry(建設産業)」、「Camera(カメラ)」などが抽出されています。

 また、各トピックの論文のタイトルや抄録を読むと、具体的な技術の内容がうかがえます。水色の2つのトピックのうち、左上の方は、人の交通移動のデータにおいて、プライバシーが保護された、集約されたデータから個人レベルの詳細なデータを生成する技術の研究のようです*2。右下のトピックは、土木作業現場において、労働者のプライバシーを保護したビデオ監視システムを使って生産性の向上に役立てる技術の研究のようです*3。緑色のトピックは、野生生物の調査を目的とした固定カメラにおいて、動物を自動的に識別し、かつプライバシーを保護した状態で画像をユーザに転送する技術の研究のようです*4

*2  Rong, C., Feng, J. & Li, Y. 2019, "Deep learning models for population flow generation from aggregated mobility data", UbiComp/ISWC 2019- - Adjunct Proceedings of the 2019 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2019 ACM International Symposium on Wearable Computers, pp. 1008.

*3  Kim, H., Ham, Y., Kim, W., Park, S. & Kim, H. 2019, "Vision-based nonintrusive context documentation for earthmoving productivity simulation", Automation in Construction, vol. 102, pp. 135-147.

*4  Falzon, G., Lawson, C., Cheung, K.-., Vernes, K., Ballard, G.A., Fleming, P.J.S., Glen, A.S., Milne, H., Mather-Zardain, A. & Meek, P.D. 2020, "ClassifyMe: A field-scouting software for the identification of wildlife in camera trap images", Animals, vol. 10, no. 1.