BERTの衝撃、進化する機械学習ツール
米グーグル(Google)が2019年10月、キーワード検索に組み込んだことで話題の自然言語処理モデル「BERT」。「とにかくBERTを触ってみたい」人向けの環境構築チュートリアルの記事を紹介する。JPOPの歌詞を可視化するデモが面白い。
この他、自然言語処理モデルの環境構築には以下の記事もお薦めだ。
BERTの登場以来、BERTを改良した様々な自然言語処理モデルが登場しているが、その1つである「GPT-2」を実際に使ってみた記事だ。「川端康成『雪国』の続きを生成できるか」「日経 xTECHの記事冒頭からフェイクニュースを生成できるか」という面白い課題に挑戦。その結果は?
39:危険すぎるAI「GPT-2」は実際どこまで自然な文を生成できるのか
三菱ケミカルホールディングスが2019年7月に公開した機械学習の導入・運用ノウハウ集「機械学習プロジェクトキャンバス」を紹介した記事だ。「PoC(概念実証)だけに終わらないためのリアルな方法論」として優れているとのこと。
40:「機械学習プロジェクトキャンバス」がデータサイエンティストの仕事を変えそう!
次の記事は、人間にしか解けないような問題を解かせてbotの入力を排除する「CAPTCHA」を、機械学習APIの力で突破する試み。結論は「CAPTCHAを自作してはならない」「機械学習のプロでも破るのが難しいreCAPTCHA v2およびv3(グーグル提供)を使うべきだ」というものだった。
このほか、機械学習ツールを掘り下げる以下のような記事の投稿をいただいた。
42:【サーバレス機械学習入門】AWS Lambda レイヤーの使い方
43:AutoML Video Intelligence(ベータ版) を試してみた画像
44:GCP AutoML Tablesでバイナリ分類するなら知っておいたほうが良いこと
45:今日からAmazon Rekognition Custom Labelsで転移学習できるようになった!
46:Light GBMの多クラス分類/二値分類を可視化するConfusion Matrix Plot