「通勤講座」は10周年で「STUDYing(スタディング)」に生まれ変わりました!

データ解析の成功パターン・失敗パターン

データサイエンティスト養成の第一歩 ビジネスを理解する

ビジネス理解に失敗したイメージ

データ解析プロジェクトが成功するパターン、失敗するパターンにはどのような違いがありますか?
典型的な「失敗プロジェクト」には、共通点があります。それは、解析を行う前のディスカッションをしっかりと行わず、解析作業からスタートしてしまうことです。そのような失敗プロジェクトでは、最も大切な「ビジネスの理解」が足りていないのです。

データ解析プロジェクトが成功するカギは「ビジネスの理解」

株式会社アイズファクトリーではこれまで300以上のデータ解析プロジェクトを行ってきましたが、その中で日々強く意識していることがあります。
それは「お客様のビジネスを理解すること」の重要性です。
データ解析を行う際に、データがあればすぐに解析作業にとりかかれるというイメージがあるかもしれません。
しかしこれは、我々データサイエンティストにとっても解析プロジェクトを依頼してきたお客様にとっても、アクションに結びつかない解析結果の導出や、解析作業自体のミスなどが起きる典型的な失敗プロジェクトになります。
その最大の理由は、「ビジネスの理解」ができていないためです。

「ビジネスの理解」とは、CRISP-DM(※注1)における6つあるステップの中でもファーストステップの部分であり、データ解析プロジェクトの目標、ビジネスにおいて果たす役割、およびその効果を明確にすることを言います。
もう少しわかりやすく言うと、ビジネスモデル(収益を上げるための仕組み)の理解業務フローの理解お客様が持っている肌感覚の理解などを行い、データ解析で解決できる課題へのブレイクダウンなどを行う作業をいいます。

(※注1)
CRISP-DM(CRoss-Industry Standard Process for Data Mining)は、SPSS、NCR、ダイムラークライスラー、OHRAがメンバーとなっているコンソーシアムで開発されたデータマイニングのための方法論を規定したものです。業界横断的に展開可能なデータマイニングのプロセスモデルとなっています。

データ解析プロジェクトが成功するカギは「ビジネスの理解」にあるといっても過言ではありません。今回は「ビジネスの理解」をしっかり行うことで、どんなメリットがあるのか見ていきたいと思います。

「ビジネスの理解」のメリット その1

―価値のある解析が可能になる―

解析作業を行う前にビジネスの理解を行うことで、大きく2つのメリットがあります。1つ目のメリットは、「価値のある解析=アクションに結びつく解析」が可能となることです。

たとえば最新の解析手法で、とても高度なアルゴリズムを使用して解析結果を出したとします。
しかし出てきた結果が、お客様が活用できない結果であればなんの意味もありません。
解析結果は、お客様のアクション(施策など)に結びつかなければ意味がありません。
たとえばお客様の顧客像を構築する際に、データ上は10個の顧客像に分けることが最適なグルーピングだとしても、実際に解析結果を活用して運用していく際(DMのクリエイティブの打ち分けなど)には10個のグループは過多であったりします。
その場合、お客様が解析結果を活用できるようにデータの観点とビジネスの観点の両方で最適な顧客像の数を設定する必要があります。

この問題を解決するためには、解析作業を行う前にお客様の「ビジネスの理解」をしっかりと行い、どんな解析結果を出すことでお客様が活用できるのかを、データサイエンティストとお客様がきちんとディスカッションを行う必要があります。
解析結果を活用したアクション(施策など)を見据えたうえで解析作業を行うことで、解析結果がお客様のアクション(施策など)に結びつかないというような「典型的な失敗プロジェクト」を回避することができます。

ビジネス理解が深ければ、成果も出やすくなります

「ビジネスの理解」のメリット その2

―解析作業の質の向上―

2つ目のメリットは、「解析作業のミスを防ぐ」ことが可能となり、解析作業の質の向上が図れることです。
私たちデータサイエンティストが扱うデータは、時に数億行(数年間にわたるPOSデータなど)という大きなデータになることがあります。
数億行にもなるデータの場合、数万行のデータとは違い中身を目視ですべて確認したり、集計結果の妥当性を確認することは難しくなります。
そこで役に立つのが「ビジネスの理解」です。

たとえば数億行のPOSデータから顧客ごとに1年間の平均購買金額(Monetary)を集計したケースを考えてみます。
その結果、顧客1人当たりの年間平均購買金額(Monetary)が10,000円という結果が出たとします。
POSデータの集計に用いたプログラムについてもスモールセットデータを用いて集計結果の妥当性は確認済みであり、解析作業自体に間違いはないようでした。
しかし算出された年間平均購買金額(Monetary)は間違いだったのです。
それは何故でしょう。

このケースでは、集計結果を確認した解析担当者がミスを発見できたのですが、ミスを発見できた要因は「ビジネスの理解」ができていたからです。
POSデータを集計する前に、お客様とディスカッションをしながらお客様の顧客の購買傾向、たとえば商品単価やお客様が肌感覚として持っている顧客の年間での購買行動などを把握していたことから、多くの顧客は3,000円程度の購買を年間約2回行っていることを理解できていたために、年間平均購買金額が10,000円という集計結果はその肌感覚に照らすと高すぎることに気づくことができたのです。

このようにビジネスの理解をしっかりと行うことで、解析作業のミスを防ぐことができ、解析の質の向上が図れるのです。

繰り返しになりますが、解析プロジェクトを行う際、データがあればなんらかの解析結果が出て、なにか施策に活用できるものが出てくるのではないかという漠然としたイメージを持たれている方がまだまだ多いのが現状だと思います。

しかしそれは「失敗プロジェクト」の典型的なケースになります。
上述のように、解析を始める前にしっかりと「ビジネスの理解」に時間を使うことで、アクションに結びつく解析結果を導き出すことで解析の価値が向上し、さらには解析作業のミスを防ぐこともでき、解析作業自体の質の向上も狙えることがご理解いただけたでしょうか。

この記事は株式会社アイズファクトリーが提供しています。

株式会社アイズファクトリー

株式会社アイズファクトリーは、理学博士が中心となり設立されました。
「全ての人に成功確率UPを届ける」をキャッチフレーズに、科学を活用してより良い社会に貢献すること、その後のシステム開発を通じて、お客様企業の業務効率向上に貢献すること、を目指しております。

 近年、ビッグデータ活用の必要性が高まっており、データマイニングがより注目されています、過去300超のプロジェクトで培った解析力と実ビジネスへの応用力は、グルメ情報提供サイト、ECサイト、広告関連企業、教育関連企業、自動車メーカー、公官庁、といった幅広い業界の大手企業・団体様から高い評価を得ております。

データサイエンスの概要を無料配信中!無料セミナーの動画と講義レジュメを配信!

通勤講座は今すぐ無料で受講できます。
まずはお試しください!

登録すると無料で試せます

  • 無料セミナー
    「データサイエンスの入口」
  • 講義レジュメ(PDF)
    無料セミナーのスライドがダウンロードできます!

※無料講座の内容は予告なく変更される場合があります。
あらかじめご了承ください。