全3060文字
PR

 前回は、科学論文の統計的なデータ分析からGAFA (Google、Apple、Facebook、Amazon)の研究開発戦略の特徴を比較しました。今回は、2019年に発表された最新の科学論文に注目し、過去のトレンドと比較することで、2020年のIT研究トレンドを予想してみたいと思います。まず、IT業界のトップ企業の例として、米グーグル(Google)の論文を分析します。次に、その結果と比較する形で、世界全体のITに関する論文を分析する、という手順で行います。

 今回もオランダ・エルゼビアが提供している「Scopus(スコーパス)」という世界最大級の抄録・引用文献データベースに収録されている科学論文のデータを分析します。なお、2019年の論文については、2019年12月時点で収録が完了しているデータのみを対象に分析した暫定値を利用するため、分析結果は速報値です。

 図1は、米アルファベット(Alphabet:Googleの親会社)が2019年に発表した科学論文のタイトルや抄録、本文の内容に関するキーワードを分析し、多く出現する単語を抽出したものです。概観すると、「学習システム」や「ニューラルネットワーク」など、コンピューターや人工知能(AI)に関するキーワードが多く抽出されていることが分かります。ここから、2019年にGoogleのどのような研究が論文として発表されたのか、その内容についての傾向が垣間見えます。

図1●2019年のAlphabetの科学論文の主要キーワード(上位50件)
図1●2019年のAlphabetの科学論文の主要キーワード(上位50件)
文字の大きさがキーワードの出現頻度の高さを意味する。データソースはScopus(2019年12月18日時点)。(出所:エルゼビア)
[画像のクリックで拡大表示]

 これらの中で、特にどの研究領域の論文が2019年に増えていたのかを比較してみましょう。まず、Alphabetが2019年に発表した科学論文を、論文の引用関係のネットワーク分析などを使ってトピッククラスターと呼ばれる研究領域に分類します。次に、研究領域を論文数が多い順に上位10件まで抽出します。最後に、その前の期間からの論文数の成長率を調べて比較します。具体的には、2016〜18年の3年間における各研究領域の論文数の平均値を調べ、そこから2019年への論文数の成長率を比較します。なお、各研究領域の名称は、領域内の論文をテキスト分析し、抽出された3種類の主要なキーワードで表現されています。