AIとは何か

3分でわかるデータマイニングとは?AI開発を加速させたテクノロジー

データマイニングのイメージ

AIブーム到来からしばらくが経ちましたが、その熱は一向に冷める気配がありませんよね。一方でAI(人工知能)と非常に関係が深く、世の中の情報の価値を変えてしまったとすら言えるものに「データマイニング(data mining)」があります。

AIを実現する技術であるディープラーニング(Deep Learning)や機械学習に比べれば、データマイニングという単語を耳にする機会はそれほど多くはないですが、データマイニングは社会の変化の中心となるテクノロジーの一つであることは間違いありません。

データマイニングがどのようなものでどう社会と関わり、これから何を変えていくかについて知っておけば、「これからの時代はこうなっていくだろうな〜」なんていうように少しだけ近い将来の姿が予測できるようになるはずです。

そこで今回は、重要なテクノロジーの一つデータマイニングについてお伝えしていきます。

機械学習:AI(人工知能)を実現するための一つの技術で近年非常に注目を集めています。

ディープラーニングとは、人間の脳の仕組みを真似てコンピュータのプログラム上で再現したもの。機械学習のうちの一つ

データマイニングとは

データマイニング早速結論からお伝えすると、データマイニングとは統計的な分析手法を活用し情報の中に隠れている「何らかの価値ある知見」を見つけ出す技術です。

これだけだと漠然としすぎていてわかりづらいのでもちろん順番に見ていきましょう。

現在では、誰もが携帯電話、スマートホンなどの通信機器を携帯してインターネットを時間や場所に捉われず利用していますよね。このような情報通信技術の進歩によって、様々なサービスの利用者情報は速く安く簡単に手に入るようになりました。

そして入手した情報には価値ある「何か」が数多く眠っているものですが、その「何か」は何もせずとも手に入るものではなく、むしろ何もしなければどんどん増える新しい情報に埋もれていってしまいます。

こうした情報の中に隠れている「何か」、つまり「価値ある知見」を統計的な分析手法を活用して見つけ出す技術がデータマイニングです!今ではデータマイニングという言葉はかなり広い意味で使われることが多く、「データから何かを見つける作業」というだけでデータマイニングと言われることもあります。

ビールとおむつ

ビールデータマイニングの効果の説明としては、過去に実際にあった次の事例が有名です。

米国の大手スーパーマーケット・チェーンで膨大な販売データを分析した結果、顧客はビールとおむつを一緒に買う傾向があることがわかった。調査の結果、子供のいる家庭では母親はかさばる紙おむつを買うよう父親に頼み、店に来た父親はついでに缶ビールを購入していたことが判明しました。そこでこの2つを並べて陳列したところ、売り上げが上昇した。

このように情報はただ持っていてもダメで、そこから価値ある知見を導き出して初めてそこで意味を持つと言えるでしょう。

データマイニングとビッグデータとAI(人工知能)の関係

データが大事であるどんどん増える様々な情報とは、例えばオンラインショッピングでいえば利用者の性別、年齢、閲覧したページ、閲覧時間などで、何万人、何億人という数が蓄積された膨大なデータはビッグデータと呼ばれています。少し前からこの「ビッグデータをどう活用するか?」が声高に叫ばれてきているので「なんか少し前にビッグデータって言葉が流行ったなあ」と思われた方もきっといることでしょう。

ただ、ビッグデータはそれ単体では意味をなさず、ビッグデータから価値ある情報を取り出すデータマイニングがあって初めて価値を持ちます。しかもビッグデータとデータマイニングは、現在世間から熱い注目を集めているAI(人工知能)と非常に深い関係にあるのです。

AI(機械学習)はデータから学習をして能力を高めていくのですが、それは言い換えれば学習用のデータによって能力が決まるということです。そのため、学習に適したデータを準備する必要があるわけですが、ビッグデータの中から学習に適したデータの選定を支えているのがデータマイニングであり、そのデータの選定能力もまた、AI(機械学習)によって向上させることができるのです。

近年のAI(機械学習)の進歩には目を見張るものがありますが、輝かしい成果の裏にはデータマイニングが必ず存在していると言えるでしょう。

データマイニングとAI(機械学習)の線引きは非常に曖昧

AI(人工知能)のイメージデータマイニングを用いれば、データを分類したり、予測したり、データ同士の関係性を発見したりできるわけですが、この能力はそのままAIの能力となります。現在のAIブームの火付け役ともなったニューラルネットワークは、データマイニングのツールでありながらAI(機械学習)でもあり、この辺りの名称や定義はかなり曖昧なものになっていて、これらの研究・応用領域は混じり合っています。

※ニューラルネットワークとは、人間の脳の仕組みを真似てコンピュータのプログラム上で再現したもので、ニューラルネットワークの層を深くした機械学習手法がディープラーニングと呼ばれています。詳しく知りたい方は下記をご覧ください。

ニューラルネットワークがデータマイニングに与えた影響は、大きく次の二つです。

  • 扱えるデータの幅を広げた
  • 学習によって高度な分析が可能になった:

従来画像や音声の認識は機械には困難でしたが、ニューラルネットワークによって上記の二つが可能となり、データマイニングができるデータに画像や音声が加わりました。この影響は本当に大きく、冷静に考えてみれば、みなさんが日々スマホで写真をパシャりと撮影したり、誰かと通話をしているように世の中に大量に存在しているそれらのデータをデータマイニングできるようになったわけです。

例えば、カメラの映像から入店した客の性別や年齢を把握し、それを商品パッケージやデザイン、売り上げに紐づけて分析できるようになったり、SNSに投稿される画像や映像を分析して文字情報だけでは掴めなかった世の中のトレンドを理解できるなど、ニューラルネットワークがデータマイニングに与えた影響は計り知れません。

そしてその進歩したデータマイニングがAI(機械学習)の性能向上につながりました。

データマイニングによって大きく進歩した領域

前述したようにデータマイニングはAI(機械学習)に対して大きな影響を与えていますが、たくさんのデータを扱う他の分野でも大きな影響を与えています。

教育

教育のイメージデータマイニングによって教育分野には大きな進歩がもたらされています。教師や生徒、教材、カリキュラム、成績をデータ化し、データマイニングを実施すれば一人一人の生徒に最適な教師、教材、カリキュラムが見えてくるでしょう。

国内では塾や私立の教育機関で導入が進んでおり、海外では大学でもデータマイニングが活用されています。最近では機械学習と組み合わせたオンライン教育システムも導入されるようになってきており、テストの結果から課題を発見し、つまづきポイントや苦手克服のための解くべき問題提案なども自動でしてくれるサービスが登場しています。

今後、生徒一人一人にデータマイニングを実施するとで、最適な教育方法を見つけるアプローチはさらに一般的になるでしょう。

生命科学(生命情報科学)

DNAのイメージ生命科学(生命情報科学)の領域にデータマイニングが与える影響は計り知れません。DNAやタンパク質の構造を解析する際にデータマイニングが用いられ、DNAでは「塩基」が、タンパク質では「アミノ酸」の構造がデータマイニングの対象となります。これは生物をタンパク質の塊として捉えてそのDNAや構造を解析しようとすると、データ量はビッグデータに匹敵します。

DNA構造の解明に始まって遺伝的な疾患の特定、新薬の創出、遺伝子組み換えへとつながり、データマイニングは私たちの生活を大きく変えてしまう可能性を秘めているんですね。

材料科学

素材研究のイメージ衣服や電池、自動車など、世の中のあらゆるモノに対して、繊維や金属などなんらかの素材が使われていますが、モノの性能向上には素材開発が鍵を握っており、この素材の研究をするのが材料科学です。

素材には様々な元素が使われていてその組み合わせと構造で性質が大きく変化するのですが、何十種類とある元素の組み合わせ、比率、構造をどのようにすれば優れた性質を持つ素材を開発できるのか探索していくことが求められます。

データマイニングの進歩によってこうしたデータ分析が容易になったことに加え、AI(人工知能)と組み合わせることで開発と分析のスピードが飛躍的に高まりました。近年では特にバッテリー開発で成果をあげており、電気自動車やスマホ、PCなどの電池の性能が劇的に向上する日は近いでしょう。

まとめ

さて、今回はデータマイニングについて理解を深めてきました。

  • データマイニングとは、統計的な分析手法を活用し情報の中に隠れている「何らかの価値ある知見」を見つけ出す技術のこと
  • ビッグデータはそれ単体では意味をなさず、ビッグデータから価値ある情報を取り出すデータマイニングがあって初めて価値を持つ
  • データマイニングとAI(機械学習)の線引きは非常に曖昧
  • データマイニングはAI(機械学習)以外にも、たくさんのデータを扱う他の分野で大きな影響を与えている

といったことを見てきましたよね。近年では、AI(機械学習)がいくつかの領域で人間を超えるレベルにまで発展しているように、テクノロジーの進歩が目覚ましく日々新たな技術が生まれています。

データマイニング、AI、ニューラルネットワーク、ディープラーニング・・・。けれどそうした次から次へと登場する最新技術の一つ一つを理解していくのは、よほどそうしたことに興味のある人でない限り困難で、普通は混乱するでしょう。

一方で、こうした言葉を完全ではなくても要点さえ押さえてしまえば、今後世の中がどうなっていきそうかの予測を立てられたり、「こんなアプリがあるはず・・・ほらやっぱりあった」なんて風にテクノロジーの進歩を楽しみながらその恩恵を教授しやすくなるはずです。

気になった用語は積極的に調べたり、日々アンテナも張ることでさらに暮らしを豊かで楽しいものにしていきましょう。

<参考>

つっちー
つっちー

AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。

「歩く負債」と言われた僕がゼロからAIエンジニアになる為のステップを実践してみた!
みんなのAI(人工知能)用語集

コメントをどうぞ

トップへ戻る
タイトルとURLをコピーしました