AI(人工知能)ニュース

「CNN」って何?「Deep Learning」って何?難しいけど頑張って調べてみた

「CNN」って何?「Deep Learning」って何?難しいけど頑張って調べてみた

「「CNN」は分からないけど、「Deep Learning」は聞いたことがある」「ニュースやネットでよく見るけど、何のことかはよく分からない」。きっとほとんどの方が、ニュースなどで聞くたびにこのように思いますよね。かくいう筆者も、「CNN」、「Deep Learning」について最近まではよく分かっていませんでした。

「CNN」、「Deep Learning」とは人工知能に関する用語になります。科学技術分野のトレンドとも言えますので、興味のある方や勉強したい方も多い分野ですが、最先端技術であるため用語も難解で、とっつきにくく感じるでしょう。

そこでこの記事ではこれから「CNN」、「Deep Learning」について勉強したいビジネスマンやエンジニアの方向けに、なるべく簡単にわかりやすく解説していきます。

「CNN」、「Deep Learning」ってどういう意味?

Deep Learningのイメージ

「「CNN」 「Deep Learning」」、と言われてもそもそもどういう意味なのか分からなければお話になりません。特に「「Deep Learning」はなんとなく分かるけど「CNN」って?」という方も多いでしょうから、簡単に用語の解説からしていきましょう。

まずはニュースでも耳にする機会の多い「「Deep Learning」(ディープラーニング)」からご紹介します。これは日本語で「深層学習」と呼ばれています。似たような言葉で「機械学習」というワードを聞いたことがあるかもしれませんが、これらは全くの別物ではなく、「深層学習」は「機械学習」の一種になります。

端的に述べると「深層学習」は「機械学習」はともに、膨大な量のデータから法則性を見つけ出すことを目的としています。従来の機械学習ではデータ抽出の前に「何に注目すればいいのか」ということを人間が定義する必要がありましたが、深層学習ではそれすらも自分で見つけ出し、膨大なデータからコンピューターが自動的に特徴を抽出してくれるのです。

つまり深層学習は機械学習をより発展させたものであり、これは人間の神経回路をモデルとしていて、機械がより人間の考え方に近い動作を行っているといえます。

そんな「Deep Learning」(ディープラーニング)には様々な種類があり、それぞれの得意分野が異なっています。そのいくつかある「Deep Learning」(ディープラーニング)」の一つが「CNN」 「Deep Learning」なのです。

「CNN」は「Convolutional(畳み込み) Neural Network」を略したもので、詳細は次以降の項目で解説していきますが、主に画像認識が得意であるという特徴を持っています。それでは具体的にどのように利用されているのかを次の項で解説していきましょう。

画像認識とは?

カメラのイメージ

さて、先の項でお話しした通り「CNN」 「Deep Learning」には画像認識が得意という特徴があります。では画像認識とは何でしょうか。

デジタルカメラで撮影された写真を見たときに、例えばそれが「風景である」とか「バラの花が写っている」とか「笑顔の子供が写っている」とか…人間であれば意識せずともこれまでの経験から写真の内容を理解し、判断することができますよね。

しかしコンピューターにとってこれらの写真はピクセルの値としてのデータでしかないため、写真の内容そのものを判断することはできません。そこで膨大な量のデータから特徴を抽出して学習させることによって、コンピューターに対象が何であるかを判断させるのです。

冒頭で「CNN」 「Deep Learning」は最先端技術であると述べましたが、実は画像認識自体の研究は50年以上前から行われており、その技術は我々が日常的に利用しているスマートフォンやデジタルカメラにも取り入れられています。その他、顔認証によるセキュリティ設備であったり、文字認証などにも利用されています。

画像認識は近年大きな発展を遂げており、その発展に深層学習が大きく関わっているのです。

画像認識技術の発展と「CNN」「Deep Learning」

神経回路のイメージ

従来の機械学習で画像認識させるためには、人間が手作業で特徴を抽出し機械に記憶させる必要がありました。しかし第一項で述べたように「Deep Learning」(ディープラーニング)を利用することによって、特徴を抽出する段階から機械が自動で行うことができるようになったのです。

また深層学習は人間の神経回路をモデルとしている、とお話ししました。この人間の神経回路、つまり人間の脳の仕組みをモデルにしたアルゴリズムのことを「Neural Network」(ニューラルネットワーク、NN)といいます。そこに「Convolutional」(畳み込み)という操作を加えたものが「CNN」(Convolutional Neural Network)です。「Convolutional(畳み込み)」とは簡単に言うと、人間の脳が視覚情報を処理する際の動きを簡易的に再現したものです。

そのため「CNN」 「Deep Learning」は画像認識に特化した技術であるといえるのです。この技術を利用することにより画像認識の技術は大きく発展することとなりました。

以上、今回は「CNN」 「Deep Learning」に関してなるべく簡単に解説をしてきました。

  • Deep Learning(ディープラーニング)は人間の神経回路をモデルとしている。
  • 「CNN」 「Deep Learning」は「Deep Learning」の中でも特に画像認識に特化している。

など、「CNN」 「Deep Learning」とは画像認識に特化した技術である、ということがわかりましたよね。

極力専門的な用語を使わないようにするため、「Neural Network」や「Convolutional(畳み込み)」が具体的にどのような処理を行っているのかこの記事では省略しましたが、実際はかなり複雑な処理を行っています。この記事では概略しかお話しできませんでしたので、という方はぜひ調べてましょう。

参照元やさしい深層学習の原理
CNN(Convolutional Neural Network)を理解しよう(TensorFlow編)
初心者のための畳み込みニューラルネットワーク(MNISTデータセット + Kerasを使ってCNNを構築)
ディープラーニングの初心者が読むべき厳選3冊の入門本。ディーラプラーニグ(深層学習)を本で勉強するならこの3冊がオススメ。

トップへ戻る
タイトルとURLをコピーしました