テクノロジー

今、AIによる画像認識がアツい!そのサービスと未来像を解説

画像認識のイメージ

昨今のAI(人工知能)や機械学習の目まぐるしい技術の進歩は皆さんもすでにご存じのとおりでしょう。その処理能力は指数関数的に向上しています。学習データをもとにした判断業務や、過去のデータから傾向を予測する処理などは、AI(人工知能)の得意分野として、さまざまなところで活用されていますよね。

一方でいま、AI(人工知能)による画像認識の技術が注目を集めています。AI(人工知能)の処理能力の向上が、画像認識をも可能にさせているのです。そして、AI(人工知能)による画像認識は、すでに私たちの暮らしの中においても大いに活用されています。

そこで今回は、そんないま大注目の技術でもあるAI(人工知能)による画像認識について、その魅力と未来の姿についてご紹介します。

まずは「画像認識」について、ざっくり解説!

画像認識のイメージ

AI(人工知能)を用いた画像認識とは、具体的にはどのような技術なのでしょうか。まずは仕組みについて簡単にご紹介しましょう。

AI(人工知能)を使って画像認識を行う試みは、1960年ごろから研究が行われていました。しかしながら、当時はCPUの性能も低く、コンピュータの価格も高額だったので、大学など一部の研究機関だけでの利用でした。今では、パソコンやデジカメ、スマートフォンなどあらゆる場所でAI(人工知能)による画像認識技術が活躍しています。
AI(人工知能)による画像認識では、画像や動画をピクセルデータとして認識します。そして、そのデータからある一定の特徴や傾向を見出します。
それらを学習することで、その画像や動画に写っているものが犬なのか、猫なのかを判断したり、Aの写真とBの写真の人物が同一人物か、違う人物であるかを判定したりすることができるのです。

もちろん、いきなり画像を見せられて判断できるというわけではありません。画像認識も、他のAI(人工知能)の処理と同様に、学習という概念があります。先ほどの犬や猫を判別する場合であれば、さまざまな犬や猫の画像を大量に学習データとして読み込ませて学習を行います。その結果、しっぽや耳、目の形状などの特徴量データから、それが犬なのか猫なのかを判別できるようになるのです。

AI(人工知能)・ディープラーニングが画像認識に与えた影響

ディープラーニングのイメージ

AI(人工知能)による画像認識は、ディープラーニング(深層学習)技術の向上により、近年急激に進化を遂げています。

2012年、「ILSVRC2012」という画像認識の大会が行われ、AI(人工知能)の画像認識の成功率が競い合われました。それまで高くても70%程度だった正解率が、ディープラーニングを導入したモデルを採用したトロント大学のチームが、一気に85%まで向上したのです。翌年からは、ディープラーニングを活用したモデルの競い合いが始まり、現在の正解率はおおむね95%以上。これはもうすでに人間を超えるレベルにまで達しています。

ディープラーニングの出現で、これまでの通常の機械学習ではなしえなかったより細かい特徴量の抽出と判別が可能になりました。

東京大学大学院工学系研究科の松尾豊教授は、ディープラーニングを『目の技術』と表現しています。ディープラーニングの普及により「非構造化データ」の処理が可能になったことが、画像認識の精度を急速に向上させているといわれています。この非構造化データとは、表やデータベースのような定型のデータではないより自然な形のデータ。画像データはまさにこの「非構造化データ」の代表的なものというわけです。

ディープラーニングが普及するまでは、犬の画像を犬と判断するためには、耳や鼻の形、ひげの本数など犬と判断するための犬の定義を細かくAI(人工知能)に教え込ませる必要がありました。しかし、ディープラーニングでは、大量の画像を学習することで自らがその特徴を認識し、犬かどうかを判断することができるようになったのです。

実際にAI(人工知能)による画像認識事例・サービス

googleのイメージ

みなさんは、Googleのサービスのひとつ「Googleフォト」を利用したことがあるでしょうか。あのサービスにも実はAI(人工知能)による画像認識の技術が利用されています。Googleフォトでは、写真に写っている人の顔によって写真を分類することができます。

これもAI(人工知能)による画像認識を活用したものです。また、近年企業などでも導入が進んでいるAI-OCR。ここでも手書き文字の認識にAI(人工知能)による画像認識が活躍しています。

もちろん身近な事例だけではありません。

例えば、医療分野でも、AI(人工知能)による画像認識の活用は進んでいます。理化学研究所光量子工学研究センター画像情報処理研究チームでは、AI(人工知能)の画像認識によって早期胃がん領域の検出に成功しました。画像認識で、人間の目でもわからないような異常な細胞を検出することができるようになったのです。

また、防犯の分野でもAI(人工知能)による画像認識は大きく活躍の場を広げようとしています。これまでにも防犯カメラなど画像を用いて防犯に役立てようとする技術は存在していました。

しかし、それらはあくまで後で人間の目で見て確認するためだけのものでした。そこで登場するのがAI(人工知能)です。

例えば、監視カメラにAI(人工知能)を搭載しておくことで、今映っている映像が、異常な状態であるかどうかをリアルタイムに判断することができるようになります。実際に、セキュリティ大手のALSOKでは、NTTドコモと提携し、監視カメラが映像から異常を検知すると警備員を呼び出せる仕組みの開発を進めています。ALSOKでは、AI・4K・5Gという3つの新しい技術を用いて警備というサービスの質を飛躍的に向上させようとしているのです。

でも、AI(人工知能)の画像認識ではまだ誤認識することもある

画像認識のイメージ

先ほど、「現在のAI(人工知能)による画像認識の正解率はおおむね95%以上」とご紹介しました。しかしいくら精度が上がったとはいえ、5%近くは誤認識しているとも取れます。

では、いったいどういう場合に誤認識してしまうのでしょうか。

カリフォルニア大学などが参加した共同研究チームが発表した論文では、ある画像データベースに蓄積されている8万枚以上のトンボの画像から、AI(人工知能)による画像認識を行い、正確に認識できた画像を除外していったところ、80枚の画像が正しく認識されずに残ったといいます。(誤認識率0.1%なので十分とも言えますが…)

認識されなかった理由は例えば、撮影当日の天候不良であったり、写真の構成の問題。また、トンボの一部分が写っていなかったり、周囲と同化していたりといったものでした。(ある画像では、黄色いシャベルの上にとまったトンボを、シャベルごと認識してしまい、「バナナ」という珍解答もあったようです。)
このように画像認識は決して100%ではありません。

ですが、人間の目も時として節穴です。この誤認識率0.1%を低いとみるか、高いとみるかは意見の分かれるところではないでしょうか。

今後、AI(人工知能)の画像認識でできることは増えるかも

未来の画像認識のイメージ

このようにAI(人工知能)による画像認識は、私たちの暮らしのあらゆるところに浸透し始めています。

そして、今後AI(人工知能)のさらなる活躍が見込まれているのが、自動運転、医療分野、警備・防犯であるといわれています。
まず、自動運転では、周囲の状況をリアルタイムで認識しながら安全に自動車を走らせるために、画像認識が応用されます。危険物や障害物などだけではなく、道路の形状、標識なども自動で判断し、完全な自動運転の実現の大きな立役者となることは間違いないでしょう。
また、医療の分野では、特に再生医療の研究開発において、細胞画像の解析に画像認識が用いられようとしています。形状が常に動きながら変化する細胞を3次元物体として認識する必要があり、ここにAI(人工知能)による画像解析が応用されようとしているのです。
また、警備・防犯の分野では、冒頭でご紹介したように、2020年の東京オリンピックパラリンピックや、2025年の大阪万博などの世界的なイベントにおいて、テロなどの発生を事前に防ぐ手立てとして、画像認識による出入国、入退室などの管理が行われようとしています。

 

画像認識のイメージ

今回は、今大きな注目を集めているAI(人工知能)による画像認識について詳しくご紹介してきました。

本記事でご紹介したように、AI(人工知能)はまだ決して100%正しく画像認識することはできません。ですが、限りなく人間の目に近づいていることは紛れもない事実です。

人間の目が疲れなどによって正確な判断ができない状況に陥ることがあることを考えると、疲れを知らないAI(人工知能)の画像認識は、もはや人間の目を超えているといえるかもしれません。

ただ人間は、目で見たものから何かを感じ、その感じたものと見たものを総合的に判断して答えを出しています。ですからAI(人工知能)による画像認識がそこまでできるようになった時、AI(人工知能)による画像認識は、本当の意味で「人間の目を超えた」といえるかもしれませんよね。

AIによる画像認識は信用できない? 誤認識された画像たち
[特集] 画像データ利活用の未来 画像処理技術の最先端

トップへ戻る
タイトルとURLをコピーしました