AIとは何か

【機械学習入門】教師あり学習と教師なし学習について調べてみた

AIのイメージ

AI(人工知能)にまつわる用語に「教師あり学習」「教師なし学習」というものが存在します。これらはいずれも「機械学習」の一種です。

AI(人工知能)を知るうえで欠くことのできない概念のひとつが「機械学習」。「機械学習」を知らずしてAI(人工知能)を語ることはできないといっても過言ではないでしょう。そのくらい切っても切れない関係なのです。

学習といえば、AI(人工知能)だけでなく人間も行いますよね。みなさんも学校では先生に教わっていろいろなことを学んだはずです。一方で、独学で勉強をして資格などを取得したという人もいることでしょう。これと同じように、AI(人工知能)の機械学習にも「教師あり学習」と「教師なし学習」という2つの概念が存在します。

それでは、機械学習の理解に欠かせない「教師あり学習」「教師なし学習」の考え方についてお伝えしていきましょう。

AI(人工知能)の機械学習とはどんな手法?

機械学習のイメージ

機械学習とは、AI(人工知能)の学習の手法のひとつで、AI(人工知能)にデータを読み込ませて、AI(人工知能)が持つアルゴリズムに基づいて分析などを行って、特徴やパターンなどを学ばせることです。
教材となるデータを大量に学習させることによって、潜在する特徴やパターンを見つけることができるようになり、そして、見つけ出した特徴やパターンをまた新たなデータに適用することによって、そのデータを分析したり予測したりすることができるようになります。

この仕組みを上手く利用したものの一つが、Googleの関連企業が開発し、人間の囲碁チャンピオンに勝利したあのAlphaGoに代表される「囲碁AI」。「囲碁AI」は、過去に行われたさまざまな対局のデータを機械学習によって分析し、勝利につながるパターンを学習することで実力をつけてきました。

このような機械学習ですが、大きく分けて2つの種類が存在します。それが「教師あり学習」と「教師なし学習」です。ここからは、この「教師あり学習」と「教師なし学習」について詳しく解説しましょう。

教師あり学習とは

教師ありのイメージ

教師あり学習とは、AI(人工知能)に教材として与えるデータに答えを付けて学習させる方法のこと。
例えば、AI(人工知能)にイチゴを覚えさせるとします。イチゴを覚えさせるためにイチゴの画像を読み込ませようとしますよね。その時に、画像データとともに、「この画像に写っているのがイチゴだよ」ということを教えてあげます。

このように正解付きのイチゴの画像データを大量に与えられて学習したAI(人工知能)は、新たにイチゴの画像を見たときに、まるで先生に教わったかのようにして「これはイチゴだ」と答えられるようになるというわけ。

このような学習の特徴から「教師あり学習」と呼ばれています。人間でいうと、学校の教室で先生が黒板に書いた説明をノートに取りながら勉強して覚えていくようなイメージといえるかもしれません。

教師なし学習とは

教師なしのイメージ

一方の教師なし学習では、AI(人工知能)に教材として与えるデータには答えがありません。では一体どのようにして、AI(人工知能)は学習をしていくのでしょうか。

先ほどのイチゴの例をもとに説明していきましょう。教師なし学習では、AI(人工知能)はただただ一方的に大量のイチゴの画像を与えられます。もちろん先ほども説明したように、その画像に写っているものがイチゴであることは伝えません。

では、AI(人工知能)はどのようにしてそれをイチゴだと理解できるようになるのでしょうか。ここで用いられるのが、「クラスタリング」という手法です。

「クラスタリング」は、大量に与えられた画像データからある特徴量を読み取って、その特徴量から似た者同士をグループ分けするというもの。ですから、イチゴでいえば「赤い」「つぶつぶがある」などの特徴をデータから読み取ります。そして学習していくうちに、AI(人工知能)自らが、これは赤くてつぶつぶがあるからイチゴだ、と理解し始めるのです。

こうした訓練を重ねたAI(人工知能)はやがてイチゴというものを認識、判別できるようになるというわけ。

教師なし学習が活用されている分野のひとつが、マーケティングです。顧客データのクラスタリング分析を行うことで、大量の顧客データを年齢や職種、趣味嗜好などに分類することでターゲットを絞ったマーケティングを行うことが可能になります。

教師あり学習と教師なし学習は何が違う?比較してみた

教師ありなしのイメージ

ではここまで説明したことをいったんおさらいしてみましょう。

教師あり学習は、データとともに答えが与えられる学習。その答えを学習することで、データの分析・判別をするというものです。これを統計の用語を使って言うと、目的変数が定義された解析ということができます。

教師あり学習の代表的なものとしては「回帰分析」があります。回帰分析では、もともと答えがわかっているデータをもとに回帰モデルを作り、それを新たに入ってきたデータにあてはめます。

一方の教師なし学習は、データのみが与えられて答えは与えられない学習。AI(人工知能)は自らデータの特徴量を学習していくというものです。こちらは目的変数がないということになります。

教師なし学習の代表的なものは先ほどもご紹介した「クラスタリング」です。

つまり、あらかじめ問題と答えのセットが与えられていて、新たな問題が与えられるとそのセットに基づいて回答するのが教師あり学習。問題に対する答えが与えられず、AI(人工知能)自らが学習しながら答えを見つけ出していくのが教師なし学習ということになります。

こうして見ると、教師なし学習のほうはAI(人工知能)っぽいけれど、教師あり学習はAI(人工知能)とはいえないのでは?と思う方もいらっしゃるのではないでしょうか。

確かに、イメージとはかけ離れているかもしれませんが、「回帰分析」のような教師あり学習もAI(人工知能)の重要な考え方のひとつです。単に「機械学習」と言っても様々な概念があることを覚えておきましょう。

「教師あり学習」と「教師なし学習」はどう使い分けるのか

AIのイメージ

教師あり学習と教師なし学習の違いはわかりましたよね。では、実際、これらはどのように使い分ければいいのでしょうか。

普通に考えれば、AI(人工知能)が自ら学んでくれるのですから、すべて教師なし学習を選べばいいように思ってしまいますよね。ですが、教師あり学習、教師なし学習それぞれに特長があり、目的に応じて使い分けられているのです。

教師あり学習の代表的な手法である回帰分析は、過去のデータをもとに傾向を見出し、未来の数値を予測するといった特徴があります。
ですので、売上予測や人口予測、来店者数の予測、不正の検知などに活用されています。また、他にも画像の分類や、正常と不良を見分ける故障診断などにも教師あり学習が活用されています。
一方教師なし学習の分析手法であるクラスタリングは、大量のデータをもとにカテゴライズするような処理に適しています。
ECサイトの購買実績に基づいて顧客をカテゴリ分けしてマーケティング手法を変えるといったように、顧客のセグメンテーションやターゲットマーケティングに活用されています。また、ECサイトなどでよく見かける「レコメンド」などにも活用。「この商品を買った人にはこちらもおすすめ」というあれです。

 

AIのイメージ

今回は、機械学習の基本的な概念である「教師あり学習」と「教師なし学習」について、その特徴を比較しながら詳しくご紹介してきました。

教師あり学習は、学習データに答えを付けて学習させる方法で、問題と答えの関係性を覚えさせ、新しいデータが入ってきたときにその関係性をもとに答えを導き出すというものでした。その代表的な手法が「回帰分析」。

一方の教師なし学習は、学習データに答えが付いておらず、AI(人工知能)自らがデータの特徴量などを学習しながら、判断や分類を行うというものでした。そして教師なし学習の代表的なものは「クラスタリング」。

教師あり学習と教師なし学習はそれぞれ適した用途で活用されているということもわかりましたよね。

教師あり学習と教師なし学習は、機械学習を理解するためには欠くことのできない重要な概念です。違いとそれぞれの特徴についてしっかり押さえておきましょう。

トップへ戻る
タイトルとURLをコピーしました