PR
図1●特設ステージの講演 EDSF事務局が撮影。
図1●特設ステージの講演 EDSF事務局が撮影。
[画像のクリックで拡大表示]
図2●講師の西井龍映氏 EDSF事務局が撮影。
図2●講師の西井龍映氏 EDSF事務局が撮影。
[画像のクリックで拡大表示]
図3●サッカー・ゴール数のモデル化 西井氏のスライド。
図3●サッカー・ゴール数のモデル化 西井氏のスライド。
[画像のクリックで拡大表示]
図4●一般的な統計解析の流れ 西井氏のスライド。
図4●一般的な統計解析の流れ 西井氏のスライド。
[画像のクリックで拡大表示]
図5●乱数の品質 西井氏のスライド。
図5●乱数の品質 西井氏のスライド。
[画像のクリックで拡大表示]
図6●モデル精度向上の様子 西井氏のスライド。
図6●モデル精度向上の様子 西井氏のスライド。
[画像のクリックで拡大表示]

 半導体分野で使われる様々な統計解析手法についての解説講演が「EDSFair 2013」(2013年11月20日~22日にパシフィコ横浜で開催)の特設ステージで行われた。講師は、九州大学IMI(マス・フォア・インダストリ研究所)教授の西井龍映氏が務めた。

 今回の講演のカバー範囲は広かった。基礎的な様々な確率分布とその求め方から始まり、ベテランの技術者でも全部を理解している人はあまりいないと思われる高度な統計手法まで、半導体設計に役立ちそうないくつかの統計手法をピックアップして説明した(図1)。聴講者の中には、若い技術者だけでなく、ベテラン技術者の顔も見られた。紹介された内容は、大学での半年以上の授業に相当するほど広範囲に及んでいたが、以下にその内容をかいつまんで紹介する。

 講演の冒頭で西井氏(図2)は、最近、統計学がブームになっていることに触れ、統計モデルが役立つ例を紹介した。例えば、2002年のサッカーのワールドカップの1試合当たりの得点の分布は、Poisson(ポアソン)分布に一致する事例を出した(図3)。これで、一見複雑な事象が単純な統計モデルで説明できること示した。

 単位時間当たりの通信エラーの回数も同じPoisson分布である。1チップに含まれる欠陥数のような分散がもっと大きい場合は、負の二項分布で表せるという。

統計解析を4ステップに分ける

 続いて同氏は、統計解析のフローを、大きく4つのステップに分け、各ステップの注意事項を説明した(図4)。また、後述する各種統計解析手法が、これら4つのどのステップで使われるかを明示しながら説明がなされた。各統計手法は独立しており、網羅的に理解していなくても、どこで使うかさえ分かっていれば、理解している手法だけでも役に立つという。

 そして、同氏の話は各種統計分布と用語についての説明になった。トランジスタのオン電流、リーク電流、通信エラーの間隔、ビア不良によるチップ不良率などの分布が知られている。これらの分布の母数(分散等の分布の定数パラメータ)を求める少し難しい母数推定手法を紹介した。その後に、これらの難しい手法は理解してなくても、近年はR言語のgamlssなどのライブラリで70以上の分布について、最新の手法による母数推定ができるとのことだった。

オーバー・フィッティングなモデルは避けられる

 正規分布の性質や統計的遅延解析(SSTA)などで使われる最大値の分布の性質などの説明のあとに、良いモデルをどうやって選択するかについての解説があった。測定値から回帰モデルを作成した場合に、説明変数(モデルの入力)と目的変数(モデルの出力)の間の関係が、たまたま測定値がばらついて発生したのか、本当に相関があるのかを判定する。

 同氏はその判定の手法として、従来の決定係数や検定を用いる方法を説明し、その後で近年一般的になりつつある、AIC(Akaike Information Criterion)やBIC(Bayesian Information Criterion)といった、情報量基準を用いる方法の説明をした。サンプル数が多い場合は、AICよりBICの方が良いとのことだった。必要以上に複雑なモデルではなく適切なモデルを選択すれば、一見誤差が減少するものの、モデル精度が低下する、いわゆるオーバー・フィッティングを避けることができる。

 そして同氏の説明は、アナログ性能評価や歩留り計算などに使われるモンテカルロ解析に移った。複雑な分布関数でも扱えるモンテカルロ解析は、乱数の品質に注意が必要なことや(図5)、分布関数が分からない場合は、ブート・ストラップ・サンプリング手法が使えることなどを紹介した。

 最後にBayes(ベイズ・)モデル(図6)。このモデルは、サンプルの増加に伴いモデル精度が向上する。すなわち、Bayesモデルでは、母数も分布に従うと考えることで、観測データが増加するに つれて、推定されるモデルの精度が向上していく。回帰モデルなどの2つの例で、精度が向上していく様子が紹介された。

 なお時間の関係で、詳細な理論の部分は講演では軽く触れる程度だった。聴講者は、配布資料記載のパスワードを使って、EDSFのWebサイトから詳しいい資料をダウンロードできる。