DX(デジタルトランスフォーメーション)

DX時代に知っておきたい!データマイニングの手法や活用事例を解説

まとまったデータのイメージ

データマイニングって聞くけど何?!

最近になってこの「データマイニング」という言葉を見かける機会が増えましたよね。

実はこの言葉が登場したのは1990年代と長い歴史があり、データを分析していく上でなくてはならないものの1つとなっています。

とはいうもののこの用語がどういったもののことを言っていて何のためにするのか、どういった手法がありどこで使われているのかちんぷんかんぷんになりがちなのも事実。
そこで今回はデータマイニングにスポットを当ててこれらの疑問を解き明かして行きます。

そして最後にデータマイニングをめぐる今後の課題についても明らかにしていきます。

中村
中村

それではまず、そもそもデータマイニングとは何かから始めていきましょう。

データマイニングとは何か

スタート地点のイメージ

まず、データマイニングとはデータ(=情報)とマイニング(=採掘)という二つの単語を組み合わせたもの。

大量にあるデータに対し統計やAI(人工知能)などの手法を用いて分析、法則やルールを見出すこととなります。

では、どうしてこのようなことをするのか次の章で見ていきましょう。

データマイニングを活用する目的

目的のイメージ

データマイニングを活用していく大きな目的はデータ分析を通して得た知見を未来予測などに活用していくことです。

それを象徴するものとして特に有名なのはマーケティングでの応用。

具体的な話として「ビールとおむつの話」をご紹介します。

これはデータマイニングをしたところ一見関係のないビールとおむつは一緒に買われることが多いことが判明、その分析結果を信じ両者を店内ですぐそばに並べたところ売り上げが伸びたというもの。

実際にあった話ではないようですが人間が考えるだけでは見出せないデータ同士の関連を発見することで新たなマーケティング戦略に繋がるというたとえ話となっています。

データマイニングの手法

実際に行なっているイメージ

データマイニングの目的について触れたのでどういった手法があるか見ていきましょう。

ロジスティック回帰分析

ロジスティック回帰はYesとNoのように明確な定義のできる予測によく使われる手法。

特に発生確率の予測で活躍します。

例としてダイレクトメールを送ることで購買を促す場合で考えましょう。

メールをきっかけに買うかそうでないかを1と0と決めれば送った相手一人一人の確率を計算、高い相手を優先的に送ることで効率よくチャンスを得ることができます。

主成分分析

主成分分析は情報をより少なくすることでデータの特徴を掴めるようにすること。

ここでいう主成分は説明力の高い情報のことを指します。

これを明らかにすることでデータの「要約」をするのです。

よく使われる例として挙げられるのはマーケティングにおける優良顧客の定義。

何をもって優良とするか様々な定義がありますが主成分分析を使えばそういった要素を組み合わせ新たな指標を作るのに繋げられます。

クラスター分析

クラスター分析はそれぞれのデータが持つ情報を分類する手法。

ここでは類似性、つまり似た者同士でまとめるというものです。

よく挙げられるのは似たような行動をしている人をグループ化すること。
これを通してメールや広告をどういったターゲットに絞って出すか考える材料となります。

決定木分析

決定木分析はデータの分類を通して予測していく手法。

この手法の特徴は「Aが起きたら、次にBが起きる」といった形式を取り入れていることです。

例としておもちゃ屋で考えましょう。

お客さんが人気のゲーム機を買うのがAとなった場合、次にBとして何が起きるか分岐を繰り返していきます。

これを繰り返すことでお客さんを分類、そして分類されたお客さんに合わせそれぞれの確率を出していくことなるのです。

アソシエーション分析

アソシエーション分析は「ビールとおむつの話」のような商品の相関性を見つけていく手法。

例えばAmazonなどで買い物をしているとおすすめの商品として一人一人違ったものが出てきますよね。

ここでのポイントは商品の組み合わせを理解すること。

買い物カゴに入れられたものの組み合わせということから「バスケット分析」や「マーケットバスケット分析」と呼ばれる場合もあります。

小売業での分析は勿論、ポイントカードであれば利用している店舗とウェブサイトの履歴を見るなどサービスを跨いだ関係性を見つけていくときにも使われています。

データマイニングの活用事例3つ

仕事で活用しているイメージ

データマイニングの手法を見てきたので今度はどのようなところで活用されているか見ていきましょう。

クレジットカードの不正利用を見つける!

まずはクレジットカード。

ニュースを見ているとクレジットカードの不正利用の話をよく聞きますよね。

データマイニングを用いればクレジットカードの利用履歴を基に不正利用を見つけることができます。

クレジットカードにはどの人がどんな商品を買ったかの記録がありとてつもなく膨大。

大量のデータを用いることでどういったものを好き好んで買うかやそのパターンを分析するので明らかにおかしなものがあれば検知ができるのです。

日を追うごとにデータの量も精度も上がっていくのでより安心して利用できることが期待されています。

ニュースアプリでその人に合ったものを提供!

データマイニングはニュースキュレーションアプリでも活躍しています。

ニュースキュレーションアプリは大量のニュースの中からユーザーごとの好みに合ったものや拡散しやすいものを自動で選んでくれるもの。

データマイニングの技術を通して情報のレコメンドを自動で行うエンジンなどの開発が進んでおり、ウェブで情報の検索をする際はキーワードが必要というこれまでの常識を覆しています。

金融機関の審査でもデータマイニング!

データマイニングを金融機関の審査に利用するところも出てきています。

審査の材料として挙げられるのは職業や勤続年数、収入など多種多様。

金融機関も個人情報と信用履歴について膨大なデータを持っており申請者と似たタイプの人を抽出、その人らがどれくらいちゃんと返済してたかも判断材料にもしているのです。

これからのデータマイニング

未来のイメージ

データマイニングの重要性は今後さらに高まっていくことが予想されています。

というのもスマートフォンやSNSの普及などデータの量がどんどん多くなっていくから。

そのためこの膨大なデータを自分達の所属する企業や機関にどう活用していくかが課題となります。

そこで問題となるのは人材不足。

AI(人工知能)の発展により膨大なデータでも処理ができるようになった分それを管理したり適切な活用をすることでより優れた分析結果を出し活用を促せる人材を生み出せるかが重要事項となっていくこと間違いありません。

データの恩恵を示したイメージ

今回はデータマイニングという言葉がどういったもののことを言っていて何のためにするのか、どういった手法がありどこで使われているのかといった疑問を解き明かし、最後にデータマイニングが抱える今後の課題を明らかにしていきました。

データマイニングは大量にあるデータに対し統計やAI(人工知能)などの手法を用いて分析、法則やルールを見出すことで未来予測などに使われます。

手法は目的に応じて様々なものがあり今回は5つを紹介しました。

データマイニングが使われているのは「ビールとおむつの話」に象徴されるようなマーケティングの他にもクレジットカードの不正検知やニュースキュレーションアプリ、金融機関の審査など分野は多種多様。
データの増加やAI(人工知能)の発展に伴いデータマイニングの重要性は高まっておりうまく扱える人材の確保がこれから重要となっていきます。
中村
中村

ますますデータの重要性が高まっている今、この技術を知ることで自分の所属する企業や組織がより良い方向に向かうきっかけにできるといいですよね。

トップへ戻る
タイトルとURLをコピーしました