AIとは何か

3分で解説!ディープラーニングの仕組み・学習方法・アルゴリズム

高度なAI(人工知能)のイメージ

ディープラーニングって言葉をよく聞くけれど仕組みが難しすぎてわからない!

AI(人工知能)という言葉をよく見かけるようになる中ディープラーニングという用語も一緒に聞く事が多いですよね。

ディープラーニングはAI(人工知能)が注目され期待が高まっているかを知る上で欠かせない要素。

しかし肝心の仕組みが何か置いてきぼりになりCNNやRNNなどさらに応用した分野の話になるとちんぷんかんぷんになりがちなのも事実。

そこで今回はディープラーニングの仕組みに焦点を当て、種類や仕組みに触れつつ機械学習との違いや実際に使われている事例についても見ていきます。

中村
中村

それではまず、そもそもディープラーニングとは何かからお伝えします。

ディープラーニングとは

疑問のイメージ


ディープラーニングはデータを十分に与えることで人間がいちいち手を加えなくてもコンピューターが自動で特徴を見つけ出してくれる技術のことです。

ディープラーニングで用いられているのはディープニューラルネットワークというもの。

ニューラルネットワークという脳の神経回路の仕組みを参考にしたアルゴリズムを応用、多層構造化したものというところから注目を集めるに至っています。

ディープラーニングの学習方法はどんな種類があるのか

ロボットを相手しているイメージ

ディープラーニングと一口に言っても学習方法は多種多様。

ニューラルネットワークの仕組みが変わることで得意とする分野が変わっていくためです。

それぞれ見ていきましょう。

中村
中村

ここでは主なものとしてCNNとRNNをご紹介します。

CNN(畳み込みニューラルネットワーク)

CNNは主に画像認識で応用されるニューラルネットワーク。

ディープラーニングで頻繁に使われるものの中で上位に位置するもの。

CNNでは画像の特徴をどうやって取り込むかを重視しています。

ここで工夫しているのは画像を二次元のままで処理をすること。

多くの特徴の情報を失ってしまうという従来のニューラルネットワークが抱えていた問題を克服する大きなきっかけとなっています。

RNN(リカレントニューラルネットワーク )

RNNは自然言語処理という分野で活躍しているニューラルネットワークで時系列データの予測に応用されています。

時系列データとは特定の地点を起点に前後と関連性のあるデータとして認識することのできるもの。

自然言語処理では様々な長さの文章や会話の展開、種類といったものを学習させることが重要になります。

それをきちんとやることでRNNが単語同士や文章同士がどう関連するかを理解し自然な形で言語処理をする事ができるようになるのです。

ディープラーニングの仕組み

システムのイメージ

ディープラーニングの学習方法の種類について触れたので今度は仕組みを見ていきましょう。

最初の章でも言及したようにディープラーニングは脳の神経回路の仕組みを参考にしたアルゴリズムであるニューラルネットワークを応用、多層化したディープニューラルネットワークを用いています。

ニューラルネットワークで情報表現を行うのは「入力層」、「隠れ層」、「出力層」の順。

これまでのニューラルネットワークで使われていた隠れ層の数は2,3程度。そのため扱える情報は限られたものとなり極めて単純なものに終始していました。
それに対しディープラーニングではニューラルネットワークの仕組みを隠れ層の数を増やす事で応用、複雑さに対応できるようになるとともに高精度での分析も実現させているのです。

ディープラーニングと機械学習はどう違うのか

疑問を持ったイメージ

ところで、ディープラーニングという言葉とともに機械学習という言葉も聞きますよね。

どちらもAI(人工知能)の要素となる技術であるという点で共通しています。

ここでは両者がどう違っているのか見ていきましょう。

まずディープラーニングは機械学習をさらに発展させたもの。

大きな相違点として挙げられるのは分析する際の枠組みにあります。

ここではリンゴの色を赤と青で区別する仕組みを例に考えていきましょう。

機械学習であれば区別をする際にこちらの方から色に着目するよう指定する必要があります。

一方でディープラーニングにはそういった指定は不要。

複数のデータを見ることで人間が手を入れなくてもどこに目をつければいいかを自分で学習、性能の向上を進めていく事ができるかが両者を分ける決定的なポイントとなるのです。

見方を変えれば機械学習では人間の側が学習の進め方について方針を決められる一方、ディープラーニングの場合はコンピューターが効率的に学習をし思わぬ方向にいかぬようインプットするものを慎重に決めていく必要があります。

ディープラーニングのアルゴリズムとは

複雑なイメージ

ディープラーニングと機械学習の違いについて触れたので今度はアルゴリズムの仕組みについても見ていきましょう。

ここではディープラーニングの学習方法でも挙げたCNNとRNNについてそれぞれ触れていきます。

CNN

学習方法の種類でも述べたようにCNNは画像認識で主に応用されるニューラルネットワーク。

これのニューラルネットワークは複数の「畳み込み層」と「プーリング層」が交互に組み込まれてできています。

重要となるステップとなるのが「畳み込み」というもの。

畳み込み層でインプットされた画像を特定の画像の大きさに切り取ります。

切り取った部分を用いて計算することで「何が特徴か」を特定し抽出していくのです。

そこで抽出された特徴をプーリング層で圧縮、情報を本当に必要なものだけに絞り込んでいくことに。

こういった処理を繰り返すことで画像認識ができるのです。

近年では物体検出や領域推定など別の分野での利用も広まっています。

RNN

RNNは時間の概念が必要となるアルゴリズム。

一度時系列データについて触れていたのでクイズ番組を例に「明智光秀が織田信長を討った事件の名前は?」という問いがあった場合で考えていきましょう。

AI(人工知能)でしたら「明智光秀が」と流れてきた段階だとまだ解答はわかりません。

しかしその時の時点で「倒した相手は誰」「つけられたあだ名は何」などどういった言葉が続くか浮かんでいます。

そして「織田信長を」と流れたことで問題文の意図を理解し「本能寺の変」と答えることに。

時系列で見ていくと「明智光秀が」「織田信長を」と出てきたから何を聞こうとしているかわかったということになります。

ここでポイントとなるのは2つの文節の間に明確に連続的なつながりがあること。

情報が入力層から隠れ層の順に伝わっていくのは従来のニューラルネットワークと同じですがRNNは過去の隠れ層と現在の隠れ層にも繋がりを持たせています。それによってこれまで与えられてきた情報が新しいものに対しどれくらい重要なものであるか学習するから先程あげたクイズのような事ができるようになるのです。

ディープラーニングを応用すると、こんなことができる

ロボットと手を組むイメージ

ここまでディープラーニングの種類や仕組み、機械学習との違いについて触れてきました。

最後にディープラーニングを用いた事例を見ていきましょう。

ここでご紹介するのは京都大学発のベンチャー企業のピリカ

この会社は「タカノメ」というアプリを開発しゴミのポイ捨て問題の解決に向け取り組んでいます。

このアプリは画像認識をディープラーニングで行い、ポイ捨てゴミの識別を効率化させるというもの。

スマートフォンにこのアプリをインストールし、調査対象となるエリアの歩道を撮影。

会社が独自に開発した画像認識システムを通して動画に写ったゴミがどの種類のものでどれくらいあるかを解析するのです。

コンピュータ処理をするとゴミ捨て場にきちんと置かれたものかポイ捨てされたものであるかを判断、ヒートマップや報告書の作成に繋げています。

ピンときたイメージ
今回はディープラーニングの仕組みに焦点を当て、種類や仕組みに触れつつ機械学習との違いや実際に使われている事例についても見ていきました。

ディープラーニングはニューラルネットワークの仕組みを応用し自動で特徴を見つけるもの。

機械学習を発展させたもので、データを見る際に人の手が必要であるかが大きな違いとなります。

主な種類として挙げられるのは畳み込み層とプーリング層を用いて画像から重要な情報を抽出していくCNNや過去の隠れ層と現在の隠れ層に繋がりを持たせ時系列でデータを扱えるようにしたRNNなど。

活用事例としてピリカという会社が開発したアプリ「タカノメ」を用いたゴミのポイ捨て問題の調査があります。

中村
中村

今後も進められていくディープラーニングの研究開発や応用についてきちんと土台を踏まえ正しく理解できるといいですよね。

トップへ戻る
タイトルとURLをコピーしました