AIブーム到来からしばらくが経ちましたが、その熱は一向に冷める気配がありませんよね。一方でAI(人工知能)と非常に関係が深く、世の中の情報の価値を変えてしまったとすら言えるものに「データマイニング(data mining)」があります。
AIを実現する技術であるディープラーニング(Deep Learning)や機械学習に比べれば、データマイニングという単語を耳にする機会はそれほど多くはないですが、データマイニングは社会の変化の中心となるテクノロジーの一つであることは間違いありません。
データマイニングがどのようなものでどう社会と関わり、これから何を変えていくかについて知っておけば、「これからの時代はこうなっていくだろうな〜」なんていうように少しだけ近い将来の姿が予測できるようになるはずです。
そこで今回は、重要なテクノロジーの一つデータマイニングについてお伝えしていきます。
※機械学習:AI(人工知能)を実現するための一つの技術で近年非常に注目を集めています。
※ディープラーニングとは、人間の脳の仕組みを真似てコンピュータのプログラム上で再現したもの。機械学習のうちの一つ
データマイニングとは
これだけだと漠然としすぎていてわかりづらいのでもちろん順番に見ていきましょう。
現在では、誰もが携帯電話、スマートホンなどの通信機器を携帯してインターネットを時間や場所に捉われず利用していますよね。このような情報通信技術の進歩によって、様々なサービスの利用者情報は速く安く簡単に手に入るようになりました。
そして入手した情報には価値ある「何か」が数多く眠っているものですが、その「何か」は何もせずとも手に入るものではなく、むしろ何もしなければどんどん増える新しい情報に埋もれていってしまいます。
こうした情報の中に隠れている「何か」、つまり「価値ある知見」を統計的な分析手法を活用して見つけ出す技術がデータマイニングです!今ではデータマイニングという言葉はかなり広い意味で使われることが多く、「データから何かを見つける作業」というだけでデータマイニングと言われることもあります。
ビールとおむつ
米国の大手スーパーマーケット・チェーンで膨大な販売データを分析した結果、顧客はビールとおむつを一緒に買う傾向があることがわかった。調査の結果、子供のいる家庭では母親はかさばる紙おむつを買うよう父親に頼み、店に来た父親はついでに缶ビールを購入していたことが判明しました。そこでこの2つを並べて陳列したところ、売り上げが上昇した。
このように情報はただ持っていてもダメで、そこから価値ある知見を導き出して初めてそこで意味を持つと言えるでしょう。
データマイニングとビッグデータとAI(人工知能)の関係
ただ、ビッグデータはそれ単体では意味をなさず、ビッグデータから価値ある情報を取り出すデータマイニングがあって初めて価値を持ちます。しかもビッグデータとデータマイニングは、現在世間から熱い注目を集めているAI(人工知能)と非常に深い関係にあるのです。
AI(機械学習)はデータから学習をして能力を高めていくのですが、それは言い換えれば学習用のデータによって能力が決まるということです。そのため、学習に適したデータを準備する必要があるわけですが、ビッグデータの中から学習に適したデータの選定を支えているのがデータマイニングであり、そのデータの選定能力もまた、AI(機械学習)によって向上させることができるのです。
近年のAI(機械学習)の進歩には目を見張るものがありますが、輝かしい成果の裏にはデータマイニングが必ず存在していると言えるでしょう。
データマイニングとAI(機械学習)の線引きは非常に曖昧
※ニューラルネットワークとは、人間の脳の仕組みを真似てコンピュータのプログラム上で再現したもので、ニューラルネットワークの層を深くした機械学習手法がディープラーニングと呼ばれています。詳しく知りたい方は下記をご覧ください。
ニューラルネットワークがデータマイニングに与えた影響は、大きく次の二つです。
- 扱えるデータの幅を広げた
- 学習によって高度な分析が可能になった:
従来画像や音声の認識は機械には困難でしたが、ニューラルネットワークによって上記の二つが可能となり、データマイニングができるデータに画像や音声が加わりました。この影響は本当に大きく、冷静に考えてみれば、みなさんが日々スマホで写真をパシャりと撮影したり、誰かと通話をしているように世の中に大量に存在しているそれらのデータをデータマイニングできるようになったわけです。
例えば、カメラの映像から入店した客の性別や年齢を把握し、それを商品パッケージやデザイン、売り上げに紐づけて分析できるようになったり、SNSに投稿される画像や映像を分析して文字情報だけでは掴めなかった世の中のトレンドを理解できるなど、ニューラルネットワークがデータマイニングに与えた影響は計り知れません。
そしてその進歩したデータマイニングがAI(機械学習)の性能向上につながりました。
データマイニングによって大きく進歩した領域
前述したようにデータマイニングはAI(機械学習)に対して大きな影響を与えていますが、たくさんのデータを扱う他の分野でも大きな影響を与えています。
教育
国内では塾や私立の教育機関で導入が進んでおり、海外では大学でもデータマイニングが活用されています。最近では機械学習と組み合わせたオンライン教育システムも導入されるようになってきており、テストの結果から課題を発見し、つまづきポイントや苦手克服のための解くべき問題提案なども自動でしてくれるサービスが登場しています。
今後、生徒一人一人にデータマイニングを実施するとで、最適な教育方法を見つけるアプローチはさらに一般的になるでしょう。
生命科学(生命情報科学)
DNA構造の解明に始まって遺伝的な疾患の特定、新薬の創出、遺伝子組み換えへとつながり、データマイニングは私たちの生活を大きく変えてしまう可能性を秘めているんですね。
材料科学
素材には様々な元素が使われていてその組み合わせと構造で性質が大きく変化するのですが、何十種類とある元素の組み合わせ、比率、構造をどのようにすれば優れた性質を持つ素材を開発できるのか探索していくことが求められます。
データマイニングの進歩によってこうしたデータ分析が容易になったことに加え、AI(人工知能)と組み合わせることで開発と分析のスピードが飛躍的に高まりました。近年では特にバッテリー開発で成果をあげており、電気自動車やスマホ、PCなどの電池の性能が劇的に向上する日は近いでしょう。
まとめ
さて、今回はデータマイニングについて理解を深めてきました。
- データマイニングとは、統計的な分析手法を活用し情報の中に隠れている「何らかの価値ある知見」を見つけ出す技術のこと
- ビッグデータはそれ単体では意味をなさず、ビッグデータから価値ある情報を取り出すデータマイニングがあって初めて価値を持つ
- データマイニングとAI(機械学習)の線引きは非常に曖昧
- データマイニングはAI(機械学習)以外にも、たくさんのデータを扱う他の分野で大きな影響を与えている
といったことを見てきましたよね。近年では、AI(機械学習)がいくつかの領域で人間を超えるレベルにまで発展しているように、テクノロジーの進歩が目覚ましく日々新たな技術が生まれています。
データマイニング、AI、ニューラルネットワーク、ディープラーニング・・・。けれどそうした次から次へと登場する最新技術の一つ一つを理解していくのは、よほどそうしたことに興味のある人でない限り困難で、普通は混乱するでしょう。
一方で、こうした言葉を完全ではなくても要点さえ押さえてしまえば、今後世の中がどうなっていきそうかの予測を立てられたり、「こんなアプリがあるはず・・・ほらやっぱりあった」なんて風にテクノロジーの進歩を楽しみながらその恩恵を教授しやすくなるはずです。
気になった用語は積極的に調べたり、日々アンテナも張ることでさらに暮らしを豊かで楽しいものにしていきましょう。
<参考>
AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。
コメントをどうぞ