テクノロジー

魔法の技術と騒がれるスパースモデリングって何?気になって調べてみた

魔法の技術と騒がれるスパースモデリングって何?気になって調べてみた

現在、AIだ!機械学習だ!Deep Learningだ!と何かと叫ばれているように、AIブームを肌で感じていらっしゃる方が多いことでしょう。中でもDeep Learningが特段世間で叫ばれているような気が しますが、一方でそれにも引けを取らずに「魔法の技術」とまで言われ注目を集めている技術があるんです。

その名は、、、スパースモデリング(疎性モデリング)!!

僕自身この記事を書くまで「スパースモデリング」が注目を集めていることを知りませんでした 汗。。ひょっとしたら、あまり聞きなれず知らないという方も多いかもしれません。

ただ、このスパースモデリングという単語については僕自身、以前Lasso回帰と呼ばれるものについて調べて記事を書いた時にチラッと知って興味があったのですが、理解を曖昧なままにしていました。そんな状態でしたが、「魔法の技術とまで言われるなんて本当ですかそれ?」と気になったので今回スパースモデリングについて調べてまとめてみました。

手元のデータから不足部分を予測して全体像を構成する技術

手元のデータから不足部分を予測して全体像を構成する技術

最初にスパースモデリングって何?というところですが、スパースモデリングとは少ない情報から全体像を的確にあぶり出す手法で、言い換えると今あるデータから足りない部分のデータを予測して、全体像を構成するという技術です。

ちなみに、スパース(sparse)とは「スカスカ」、「まばら」、「少ない」を意味する単語で、スパースモデリングで使われるスパース性とは「物事やデータの本質的な特徴を決定づける要素はわずかである」という性質のことを指しています。

画像データを例に出せば、みなさんご存知の通り画像は多くの細かい画素というものが集まってできています。隣り合う画素間でその値の差が大きく異なるところは、画像に写っている物質が変わるところなど全体から見たら、わずかな量になります。このような時、データにはスパース性があると言います。

そしてモデリングとは、物事や事象をわかりやすい形にして表現することを意味する単語ですので、スパースモデリングとは、物事にあるそのスパース性を利用して情報を抽出してわかりやすい形にして表現する技術のことなんですね。

スパースモデリングがなぜ注目される3つの理由

スパースモデリングがなぜ注目される3つの理由

スパースモデリング(疎性モデリング)がなぜ注目されているかについて調べてみたところざっくりと次の3点が大きな理由になっているようです。

  1. データ不足の問題を解決してくれる
  2. 複雑なデータ構造を人間が解釈、説明できるしやすくなる
  3. 計算コストを抑えられる

データ不足の問題を解決してくれる

現在世間を賑わしているDeep Learningは、大量のデータがあることを前提として利用されるため、十分な量のデータを準備できないビジネスの現場では活用できません。もしも学習データが少ないと、Deep Learningは学習パラメータが多いため、過学習(過剰適合、オーバーフィッティング)という汎化性能の低い状態に陥ってしまうんですね。

一方で、スパースモデリングは少量のデータから欲しい情報を抽出できるという可能性を秘めています。実際のビジネスの現場では、十分な量のデータを準備できなかったり、準備するのにたくさんの時間がかかったりすることが多いにあるのでスパースモデリングに注目が集まっているというわけです。

複雑なデータ構造を人間が解釈、説明しやすくなる

また、ディープラーニングは層が何層にも重なっているため、出力された結果からなぜこの結果が出力されたのかを人間が説明することができません。これはブラックボックス問題と言われています。対してスパースモデリングはシンプルな形のモデルを採用しているため出力結果の解釈と説明がしやすくなります。

スパースモデリングは多くのデータの要素の中から本当に関係する要素を選択し、不必要な要素は排除するので、高次元で複雑に見えるデータを単純化して表現することが可能です。これにより因果関係の説明可能性が向上します。ですので、利用者への説明責任という意味でもスパースモデリングを使う意義は大きいでしょう。

計算コストを抑えられる

さらにディープラーニングは大量のデータを処理するための高価な計算機器が必要になり、データ処理にも時間がかかります。病気の診断などでは一刻を争うこともありますし、検査に時間がかからなくなれば患者への負担軽減にも繋がることは間違いありません。スパースモデリングは安価な機器に組み込んで利用でき、データ処理に要する時間を大幅に短縮できます。

ここまでの内容を表にまとめると次のようになります。

スパースモデリングとディープラーニングの比較

つっちー
つっちー

このようにスパースモデリングにはディープラーニングにできないことができる特徴があるんですね。

スパースモデリングは不足するデータを補う技術であるので、こうしたディープラーニングの課題を解決する技術としても活躍が期待されており、既存の技術とスパースモデリング組み合わせることでより大きな成果を発揮できると考えられています。

重要でないパラメータを0にする!スパースモデリングの基本方針

重要でないパラメータを0にする!スパースモデリングの基本方針

スパースモデリングはデータ要素を抽出したり足りないデータを補完することができましたが、ここからはその仕組みを見ていきましょう。スパースモデリングには、重要でないパラメータを0と推定する(重要でない要素を排除する)という基本的な考え方があります

スパースモデリングの一つにLasso回帰がありますが、Lasso回帰は最小二乗コスト関数に対して、重みの合計を足したもの(L1正則化項と呼びます)で、データがm個あるとすると以下のように表現されます。

Lasso回帰

機械学習では、求めたい目的変数(例えば来週の売上)を関係がありそうな説明変数(立地条件、気温、曜日など)を用いて予測することが行われます。この時、説明変数が多くなると、精度の高い予測をするために必要なデータ数が多くなり、得られた予測式を人間が理解するのが困難(数式が複雑になる)になってしまいます。

この点Lasso回帰を使用すれば、あまり重要でない説明変数の予測式への寄与が0になる(係数が0になる)ため、重要度の低い(不要な)説明変数を自動で排除でき、人間が理解できるシンプルなモデルを作ることができます。

Lasso回帰はL1正則化項(L1ノルム)の働きによってスパースモデリングの工夫が実現しています。L1正則化項を加えることで、予測式の係数がスパース、つまりほとんどが0になるため、その結果シンプルなモデルが出来上がるというわけなんですね。

Lasso回帰についてもっと知りたい方はコチラもどうぞ

スパースモデリングがもたらす強烈なインパクト

スパースモデリングがもたらす強烈なインパクト

ここまでスパースモデリングについて紹介してきましたが、大学や研究機関でのスパースモデリングについての研究は進んでいるようですが、スパースモデリングを実際のビジネスへの活用事例はまだまだ少ないようです。わかりやすい代表的な活用事例としては、「ブラックホールの可視化」と「MRIでの検査時間短縮」がよく挙げられます。

ブラックホールの撮影に世界で初めて成功

2019年4月にブラックホールシャドウの撮影に世界で初めて成功した!!というニュースには驚いた方は多いでしょうが、なんとこれを実現した手法としてスパースモデリングが採用されていたと聞くとまたこれも驚きです。

本来ブラックホールの姿を捉えるには、地球サイズの望遠鏡が必要となるのですが、当然のことながらそんな望遠鏡を作ることはできません。その対策として世界数カ所の望遠鏡を使い可能な限り多くのデータを収集し、足りない部分をスパースモデリングで補ってブラックホールの姿を描き出そうという考えが考案されました。

つっちー
つっちー

現在ブラックホールシャドウの撮影画像が公に公開されていますが、僕たちがブラックホールの姿を見られるのはスパースモデリングの賜物なのですね!!

MRIの検査時間が短縮

スパースモデリングは医療分野でも活躍しています!現在、MRI(磁気共鳴画像診断装置)を使ってガンや脳、背椎の病気などの診断が行われています。簡単に言うとMRIは磁気の力で体内を撮影する装置ですが、撮影するのに時間がかかってしまうという問題があり、緊急を要する場合や長時間の撮影による患者への負担が課題となっていました。

スパースモデリングはこの課題を解決します。MRIで膨大な量のデータ収集には時間がかかるので、最初からまびいたデータを収集して、収集しなかった箇所はスパースモデリングによって補います。京都大学医学部の研究では、驚くべきことにMRIのデータが80%欠損していても、ほぼ正確な画像を構成することに成功しています

つっちー
つっちー

スパースモデリングによって検査時間が大幅に短縮されるのは間違いなさそうですね。

まとめ

さて、今回は魔法の技術とまで言われ騒がれているスパースモデリングについて整理してお伝えしてきました。ここまでのポイントを振り返ってみると、

  • スパースモデリングとは今あるデータから足りない部分のデータを予測して、全体像を構成する技術である
  • スパースモデリングが注目される背景には、「データが少量でも利用可能」「出力結果を人間が解釈、説明しやすい」「計算コストを抑えられる」という大きく3つの理由がある
  • 重要でないパラメータを0と推定する(重要でない要素を排除する)という基本的な考え方に基づいてシンプルなモデルを実現している
  • 活用事例はまだまだ少ないが、ブラックホールシャドウの画像撮影やMRIの検査時間短縮など大きな成果をあげている

ということでした。

第四次産業革命とも言われる現在、IoTによって今後さらにデータが蓄積され大量のデータを扱う必要も増えていくでしょうが、まだまだデータを集めることが困難なケースもあるで今後はスパースモデリングの活用がどんどん増えていくでしょう。

スパース性は様々な現象に共通して現れるものなので、今回ご紹介した活用事例に止まらず幅広い分野への応用が期待されています。今後もスパースモデリングの進化がますます楽しみですね!!

<参考>
日高 昇治 (著). (2017).『スパースモデリングって何だ?―データ構造を解き明かす先端技法 (テクノロジーを知る 7)』株式会社 カットシステム
スパースモデリング技術と応用分野
大量データに頼らない:スパースモデリングによる情報抽出
スパースモデリング
今日から分かる スパースモデリングと深層学習 – 京都大学
スパースモデリングはなぜ生まれたか? 代表的なアルゴリズム「LASSO」の登場
スパースモデリング ~少量データから画像を復元~
スパースモデリング (1) 特徴量と冗長な辞書
ブラックホールの可視化にも使われた「スパースモデリング」とは / ディープラーニングは唯一の選択肢なのか!?

つっちー
つっちー

AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。

「歩く負債」と言われた僕がゼロからAIエンジニアになる為のステップを実践してみた!
みんなのAI(人工知能)用語集
テクノロジー

コメントをどうぞ

  1. 通りがかり より:

    本記事のスパースモデリングとディープラーニングの比較表に、スパースモデリングでは「結果の解釈と説明ができる」という記述がありますが、スパースモデリングにそのような特徴はないです。例えばLassoでは相関性の高い特徴量を絞り込むことが出来るので普通のDNNより解釈性は上がりますが、それを以て「結果の解釈と説明ができる」とは言い難いです。

    また、同表で「安価な機器やFPGAに組み込める」ことを利点として挙げておられますが、FPGAは安価とは言い難いです。またスパースモデリング自体にそのような特徴はないです。特定の会社の製品か技術をあたかもスパースモデリングの特徴かのように記述するのは間違っています。

    もしかして自分の頭で考えずにどこかの会社のセールストークを鵜呑みにして、それを丸写ししていませんか?

    • つっちー つっちー より:

      通りがかりさん、丁寧なご指摘ありがとうございました。
      ご指摘頂いた箇所を修正いたしました!

AIZINE(エーアイジン)

コメントをどうぞ

  1. 通りがかり より:

    本記事のスパースモデリングとディープラーニングの比較表に、スパースモデリングでは「結果の解釈と説明ができる」という記述がありますが、スパースモデリングにそのような特徴はないです。例えばLassoでは相関性の高い特徴量を絞り込むことが出来るので普通のDNNより解釈性は上がりますが、それを以て「結果の解釈と説明ができる」とは言い難いです。

    また、同表で「安価な機器やFPGAに組み込める」ことを利点として挙げておられますが、FPGAは安価とは言い難いです。またスパースモデリング自体にそのような特徴はないです。特定の会社の製品か技術をあたかもスパースモデリングの特徴かのように記述するのは間違っています。

    もしかして自分の頭で考えずにどこかの会社のセールストークを鵜呑みにして、それを丸写ししていませんか?

    • つっちー つっちー より:

      通りがかりさん、丁寧なご指摘ありがとうございました。
      ご指摘頂いた箇所を修正いたしました!

トップへ戻る
タイトルとURLをコピーしました