全4655文字
PR

BERTの衝撃、進化する機械学習ツール

 米グーグル(Google)が2019年10月、キーワード検索に組み込んだことで話題の自然言語処理モデル「BERT」。「とにかくBERTを触ってみたい」人向けの環境構築チュートリアルの記事を紹介する。JPOPの歌詞を可視化するデモが面白い。

37:超初心者向け爆速BERTチュートリアル


 この他、自然言語処理モデルの環境構築には以下の記事もお薦めだ。

38:BERTをお手軽に試すための環境


 BERTの登場以来、BERTを改良した様々な自然言語処理モデルが登場しているが、その1つである「GPT-2」を実際に使ってみた記事だ。「川端康成『雪国』の続きを生成できるか」「日経 xTECHの記事冒頭からフェイクニュースを生成できるか」という面白い課題に挑戦。その結果は?

39:危険すぎるAI「GPT-2」は実際どこまで自然な文を生成できるのか


 三菱ケミカルホールディングスが2019年7月に公開した機械学習の導入・運用ノウハウ集「機械学習プロジェクトキャンバス」を紹介した記事だ。「PoC(概念実証)だけに終わらないためのリアルな方法論」として優れているとのこと。

40:「機械学習プロジェクトキャンバス」がデータサイエンティストの仕事を変えそう!


 次の記事は、人間にしか解けないような問題を解かせてbotの入力を排除する「CAPTCHA」を、機械学習APIの力で突破する試み。結論は「CAPTCHAを自作してはならない」「機械学習のプロでも破るのが難しいreCAPTCHA v2およびv3(グーグル提供)を使うべきだ」というものだった。

41:機械学習APIの力でCAPTCHAを破る


 このほか、機械学習ツールを掘り下げる以下のような記事の投稿をいただいた。

42:【サーバレス機械学習入門】AWS Lambda レイヤーの使い方

43:AutoML Video Intelligence(ベータ版) を試してみた画像

44:GCP AutoML Tablesでバイナリ分類するなら知っておいたほうが良いこと

45:今日からAmazon Rekognition Custom Labelsで転移学習できるようになった!

46:Light GBMの多クラス分類/二値分類を可視化するConfusion Matrix Plot

47:高速でKaggle用のGCP環境を手軽に構築

48:Chainer PyTorch同盟 VS TensorFlow(Keras)

49:MLプロジェクトを始める際に使えるフレームワーク・ツール達