「ビッグデータ」という言葉が今や日常的に使われている世の中ですが、IT(インターネットなどの通信とコンピュータとを駆使する情報技術)に興味がなかったり、自分から知らない言葉を調べていくという習慣が特にない場合は、
うーん大きいデータのことなのかなあ・・・ぐらいに思ってしまうのが普通でしょう。
一方で近年急激に耳にするようになり始めた「AI(人工知能)」。「ビッグデータ」はAI(人工知能)の活用と非常に密接に結びついているのです。今回は「ビッグデータ」を入門者向けに簡単にお伝えしていきます!!
AI(人工知能)は、人間の話すや予測する、判定するなどの知的な活動をコンピュータで実現するための技術や研究分野のことを指す概念です(専門家でも定義は様々)。AI(人工知能)については以下のページで詳しく解説しています。
一言で言うと「ビッグデータ」とは・・・
データが積もりに積もって大量になったものがビッグデータ
2011年ごろから、「ビッグデータ」という言葉がニュースやネットで飛び交うようになりました。その背景には、スマートフォンの普及などをはじめとした情報通信技術の飛躍的な発展と、私たちがインターネットを利用して残り蓄積されていく、様々な行動履歴が関係しています。
例えば、グーグルの検索窓に何か文字を入力した際には、次のようにひょっとしてこれでは?のように検索キーワードを提案して表示してくれますよね。
他には、amazonでのショッピング中に「この商品を買った人はこんな商品も買っています」と表示されること、自分が普段検索しているキーワードに連動してWebページに表示される広告の内容が変化していること、などを体験している方は多いことでしょう。
こうしたサービスの背景にビッグデータの存在があります。検索キーワードの候補は、たくさんの人々が入力したキーワードの傾向から、「この単語の後にはこういう単語が多い」と行った予測に基づいて表示されます。この「たくさんの人々が入力したキーワード」のような、データが積もりに積もって大量になったものをビッグデータと呼んでいます。
スマートフォンの普及やソーシャルメディア(SNS)の台頭、クラウド等に代表される情報通信技術の発展によって、私たちの生活や仕事の仕方は、ここ数年で大きく変わってきました。
そのような背景で、私たちの行動履歴、生の声や感情、文章や写真などのデータが爆発的に増え、それらがインターネット上に蓄積されて誕生したいろんなデータの集合体が、今日ビッグデータと呼ばれています。
一方で最近注目を集めているAI(人工知能)ですが、実用的なAI(人工知能)をつくるためには、AI(人工知能)が学習するための大量のデータが必要です。AI(人工知能)は大量のデータから、そこに潜むパターンや傾向を見つけ出していくためです。逆に言えば、データの量が少なければ、情報が少なければ、データから傾向やパターンを掴みづらいため、実用的なAI(人工知能)はつくれないということです。
データからパターンや傾向を掴んでいく、AI(人工知能)の中心となっている技術を「機械学習」と言います。「機械学習」については以下のページで詳しく解説しています。
今後、冷蔵庫や洗濯機、エアコン、そうした身近な機器がインターネットを通じて繋がり、何千万人、何億人もの行動履歴がビッグデータとしてインターネット上に蓄積されていきます。
あらゆるものがインターネットに繋がっていく世界のことを「IoT」と呼びます。「IoT」については以下のページで詳しく解説しています。
こうして蓄積されたデータ、つまりビッグデータから、AI(人工知能)が顧客に共通する傾向や行動パターンというものを見つけていきます。近年のAI(人工知能)の発展のベースにはビッグデータの存在があった、とも言えるかもしれません。
しかし、ただビッグデータを持っているだけでは何の価値もありません。AI(人工知能)などのツールを用いて、ビッグデータから価値ある知見を取り出せて、そこで初めてビッグデータは意味を持ちます。
まとめ
つまり、「ビッグデータ」とは、
<参考>
AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。
コメントをどうぞ