全4655文字
PR

「Kaggleは怖くないよ」

 第3次AIブームで機械学習エンジニアやデータサイエンティストの魅力が高まる中、「Kaggle」や「SIGNATE」といった機械学習コンペに参戦する技術者が増えている。

 Kaggleのコンペというと、機械学習のトップ級エンジニア同士の「神々の争い」のようなイメージがあるかもしれない。だがKaggleなどの機械学習コンペには、初心者を優しく受け入れるコミュニティーとしての側面もある。

 下の記事の筆者はKaggleに参加して1週間とのことだが、Kaggleについて「『競争』ではなく『知的好奇心を刺激しまくってくれる楽しい競技』です」と表現している。

22:Kaggleって怖いとこじゃないよ。


 次に紹介するのは「Kaggleはソシャゲである」という仮説を長大な文章で検証した記事。伝えたいことを要約すると「Kaggle はソシャゲみたいなものだよ」「Kaggle は怖くないよ」「Kaggle は本当に楽しいよ」だそうだ。

23:Kaggle ソシャゲ説


 Kaggleは参加実績に基づくランク制を採用しているが、最初の「novice」から次の「Contributor」へは10分でランクアップできますよ、という記事だ。

24:【写真でわかる】10分で、kaggle初心者が「初期ステータス(novice)」から「Contributor」にランクアップする方法。


Kaggle初心者はどこにつまずくのか

 続いて紹介するのは、Kaggleへ本格参戦したい初心者向けの記事だ。「他の人が書いたNotebookをひたすら読む」というのは、私が取材した多くのKagglerも実践していた。

25:[kaggle]初心者に読んでほしい。notebookを熟読せよ

26:スコア推移からみるKaggleコンペのプロセス

27:kaggleを始める前に、python言語が壁な人への導入【全7講義まとめ】

28:Kaggleの初期装備〜高い頻度で利用するコードをまとめたひとつのセル〜


「初心者」と「メダル獲得」の間に高いハードル

 続いて紹介するのは、初心者を脱してメダル獲得(コンペ上位入賞)を目指したい人向けの記事だ。

 本記事の筆者は、初心者向けの課題として有名な「Titanicコンペ」(北大西洋で沈没したタイタニック号の乗客データの分析)のレベルと「メダル対象コンペ参加」や「メダル獲得」のレベルの間には非常に大きなハードルがある、と語っている。そのハードルを乗り越えるための方法論を解説している。

29:Kaggle脱初心者のための「Titanicコンペの先」講座


 続く記事の筆者は中学2年生、14歳Kagglerの投稿だ。コンペで銅メダルを取ったものの、「低迷期」に陥ってしまった理由を自ら分析している。

30:データを分析できない学生Kaggler(低迷期)が自分を分析する


 Kaggleはソロ参加のほか、チーム参加も可能だ。本記事は、これまでソロ参戦していた筆者が初めてチームを組み、リーダーとして参加した記録である。

31:Kaggleで初心者5人チームのリーダーとして参加した時の話


めざせKaggleマスター

 コンペでメダル獲得などの実績を積むことで「Kaggle Master」の称号が得られる。機械学習エンジニア/データサイエンティストとしての実力の証しといえるKaggle Master獲得への道を書いた記事が2本あった。

32:【Kaggle Master】になるまでとその後

33:データ分析未経験のSIerがKaggle Masterになってデータ分析案件を受注した


 Kaggle編の最後に、コンペでも有効なデータ分析のTipsやKaggleランキングポイントの仕組みを分析した記事を紹介する。

34:Permutation Importanceを使って検証データにおける特徴量の有用性を測る

35:Category Encodersのすゝめ

36:Kaggleランキング ポイントの仕組み