
実務で使えるデータ分析スキル
目次
-
ABテストで施策を検証 帰無仮説を棄却できるか
[最終回]
ABテストにより、「施策の実施前の状態」と「施策の実施後の状態」を比べる。仮説検定では、必ず「帰無仮説」と「対立仮説」の2つを設定する。「有意水準」「検定力」「効果量」などから、適切なサンプル数を決める。
-
個人情報を理解し 自社の利用目的を確認する
[第11回]
データ分析プロジェクトでは、分析対象データが「使えるか」の検討が欠かせない。データの利用は法令面や自社ポリシーの面で、問題がないことが前提となる。自社の個人情報保護方針やプライバシーポリシーを確認する必要がある。
-
KPIツリーを活用する 仮説・分析・評価を繰り返す
[第10回]
データ分析で成果を上げるには、仮説・分析・評価の繰り返しが必要だ。分析には「課題解決型」と「AI・機械学習を使ったサービス開発型」の2種類がある。どちらの分析でも、うまく進めるには「KPIツリー」の活用が重要である。
-
データ分析プロジェクトの「PM」に求められる知識
[第9回]
実務としてデータ分析に取り組む際に身につけておくべきスキルを解説する。取り上げる内容は「データ分析実務スキル検定」の出題範囲に沿っている。データサイエンスは「何らかの知見やインサイト(洞察)を導き出す」ことがポイントだ。
-
Pythonによるデータ分析で必須 pandasライブラリーを使おう
[第8回]
「Python」は初心者でも学びやすく汎用性の高いプログラミング言語だ。データ分析や機械学習向けのライブラリーが数多く公開されているのが特徴である。Pythonにおけるデータ分析で欠かせないライブラリー「pandas」の使い方を解説する。
-
統計解析で役立つ R言語の基本を実践で理解
[第7回]
Rは統計解析に特化したオープンソースのプログラミング言語だ。プログラムを再利用できる、きれいに描画できるといった利点がある。コンビニの売り上げに影響を与えている要因の分析を通じ、使い方を理解する。
-
データ分析は前処理が8割 「毒抜き」しないと危険
[第6回]
データ分析でエラーが起きたり分析結果にゆがみが出たりするケースがある。それを防ぐには、その原因に合わせて適切な「データの前処理」を実施する必要がある。「欠損値処理」「外れ値処理」を行うことで、データの「欠け」や「偏り」を補正できる。
-
意思決定を左右する データ分析の「精度指標」
[第5回]
AIや機械学習を使ったデータ分析で特に重要な用語が「精度指標」だ。「回帰問題」と「分類問題」では、それぞれ利用する精度指標が異なる。再現率と適合率のバランスを取りたい場合は「F値」を用いる。
-
機械学習はアルゴリズム データを基に予測する
[第4回]
機械学習ではデータを基に、何らかの値を予測することが可能だ。機械学習はアルゴリズムの名称であり、「やり方」「手順」を指す。種類として「教師あり学習」や「教師なし学習」などがある。
-
統計モデル「回帰分析」でデータ分析の基礎を学ぶ
[第3回]
有用なデータ分析には「統計モデル」の理解が欠かせない。統計モデルの基礎というべきものが「回帰分析」である。説明変数が複数ある場合は、「重回帰分析」を利用する。
-
データベースとSQLの基本 Excelとの違いを理解する
[第2回]
大規模データの取り扱いには「データベース」が欠かせない。データベースを操作するための言語「SQL」への理解も必要だ。簡単な英単語が分かれば、SQLでデータを抽出したり集計したりできる。
-
こんなデータは嫌だ 分析に耐えるデータを作ろう
[第1回]
データがたくさんあっても、その質に難があればデータ分析で有効な結果は出せない。データの質を見極めるには、データを集計し、グラフを作成するなどして可視化する。その際、「このような集計値やグラフになるはずだ」と予想しておくことが重要だ。