AI(人工知能)について勉強していると、確率論の知識が必要だと聞いた事がある人もいますよね。確率論と一口にいってもさまざまなものがあり、AI(人工知能)分野で近年とくに注目を集めているのがベイズ理論です。
ベイズ理論の生みの親は英国の数学者トーマス・ベイズで、ベイズ理論の「ベイズ」はトーマス・ベイズの「ベイズ」から取っています。AI(人工知能)分野で注目を集めているのだから最近の理論だろうと思いきや、歴史は古く18世紀に生み出された理論なのだと。
このような背景を持つベイズ理論ですが、ベイズ理論やベイズ統計、ベイズ確率という言葉は聞いたことがあるけれどよく知らない、どこで使われているのかわからない人は結構いるでしょう。そこで今回は、ベイズ理論の仕組みや活用例などの全体像を解説します。まずはベイズ理論とはどのようなものなのかについてお伝えしましょう。
18世紀の確率論、ベイズ理論とは
ベイズ理論を簡単に説明すると、「未来の確率は過去のデータをもとに求められる」というもの。中学校や高校で学ぶ一般的な確率・統計(推計統計学)を振り返ると、“すでに”確率が決まっていて、その結果が実際のデータとして現れるというものでした。このふたつを比較してみると、データが先か、確率が先か、データと確率の関係が違うことがわかるでしょう。
ベイズ理論では推定前に確率(事前確率)を設定し、新しいデータをもとに確率を変更して新たな確率(事後確率)を求めます。ベイズ理論による推定の代表的な強みは以下の点です。
- データ数が少なくても推定が可能である
- データ数が多くなるにつれて事後確率の精度が上がる
- データが増えるたびに事後確率がアップデートされる
- 新たなデータが出てきても一から解析する必要はなく、修正を加えるだけで済む
まとめると、ベイズ理論では新たなデータに出くわすたびに確率がアップデートされる特徴を持ち、新たな情報を得て、新たな考えに変えるという人間の思考の動きと類似している確率論となります。
ベイズ理論の概要について解説しましたが、ベイズ理論を生み出したトーマス・ベイズってそもそも何者なのか、どのような背景でベイズ理論を生み出したのかも確認したいですよね。次にトーマス・ベイズについて解説します。
そもそもベイズって誰?
トーマス・ベイズは英国の数学者であり神学者でもある経歴を持つ人物で、1702年に誕生し、1761年まで生きました。トーマス・ベイズがベイズ理論を生み出したのは18世紀中頃で、キリスト教に関する論争がその背景にありました。
きっかけは1748年にデビッド・ヒュームという哲学者がイエスの復活という出来事に関して否定的な態度を確率の観点から取ったことです。この態度にトーマス・ベイズは出来事の信ぴょう性がたとえ低くても積み重ねればその確率をひっくり返すことができる、と主張(発見)しました。これがベイズ理論の始まりで、このベイズ理論は後に神学的な論争だけでなく数学的応用がなされたのだとか。
現在ではその科学性は置いといて、AI(人工知能)の分野をはじめとした現実に役立つと評価され活躍しています。では、どのように役立ち、どのように注目を集めているのかについて解説します。
なぜ今ベイズ理論が注目されているのか
AI(人工知能)の分野でベイズ理論が注目される理由は、AI(人工知能)開発の要となる学習に有利なことです。有利である、と一口にいってもさまざまな観点があり、ベイズ理論はいくつかの利点を持っています。
まずは、データを積み重ねて収集することができ、そのたびに精度が上がるという点です。ベイズ理論では事前確率と現在起こった事象のデータをもとに事後確率を求めるため、新たなデータを積み重ねることでAI(人工知能)はアップデートされた機能を取得することができます。また、繰り返し事後確率を求めることで事後確率の精度が増し、AI(人工知能)による予測や認識の精度の向上にもつながるでしょう。
また、少ないデータでもAI(人工知能)の開発を可能とするという点もベイズ理論をAI(人工知能)開発で適用することのメリット。ベイズ理論では必要量の標本を事前に集める必要がなく、新たなデータが出てきても一から作り直さずに既存のデータに追加して結果を更新すれば済む、という特徴からこのようなメリットが生まれます。データセットをそろえるという、最初のハードルが低くなるのは開発を進めるうえで大変助かりますよね。
このような利点から、AI(人工知能)分野にベイズ理論を用いる場合も増えており、私たちの生活をより豊かなものとしています。それでは実際にどのような活用がなされているのか紹介しましょう。
ベイズ理論を使った活用例
ベイズ理論の代表的な活用例には次のようなものがあります。
検索エンジン
数年前まではブール型と呼ばれる、andやorといった論理的な検索ワードの組み合わせに沿った検索が主流でした。しかしベイズ理論の導入で検索アルゴリズムに変化が訪れ、例えば○○が検索ワードにあれば□□というサイトを上位に出すなど、検索結果のランキングに活用されるようになりました。またこのアルゴリズムを変化させる(向上させる)ことも可能です。
迷惑メールの分類
特定の単語が、過去に届いた迷惑メールにどれくらいの確率で含まれるのか把握し、更にその精度をあげることがベイズ理論で割り出すことが可能です。そして得られた確率から新規に届いたメールを、文面などをもとに迷惑メールであるかを判断します。
病気の罹患率
例えば、ある病気の日本人の病気の罹患率(事前確率)と実際に罹患している人が検査を受けた時に陽性と判定される確率がわかっているとします。このとき、医療の現場では罹患しているか不明の人が検査を受けたときに陽性だった場合に、本当に罹患している確率はどれくらいかをベイズ理論で求めています。
レコメンド機能
○○という商品を見た人は□□という商品も見る可能性が高い、ということを絶えず更新することがベイズ理論では可能です。主に得られた確率をもとに商品のおすすめや広告の提示をします。
接客支援
これまでの接客対応で集まったノウハウ(過去のデータ)をもとに、接客行動と顧客の反応を予測することがベイズ理論で可能です。学習により精度が高まり、スタッフ間でのノウハウの共有などもできます。
ここまでベイズ理論の基礎知識や活用例を紹介してきました。最後にベイズ理論をさらに勉強したい人におすすめのサイトや書籍を紹介します。
ベイズ理論の応用を勉強するのにおすすめのサイトや書籍とは
ベイズ理論の応用に関するサイトや書籍は無数にあり、なかなか選ぶのが大変ですよね。その中でも、とくにおすすめなのが次の通りです。
AVILEN AI Trend(株式会社AVILEN)
AVILEN AI TrendはAI(人工知能)に特化したWebメディアで、「ベイズ統計」という項目でベイズ理論を扱っています。特に仮説検定の話題を中心に扱っており、ベイズ理論が統計手法としてどのように役立つのかの解説が豊富です。
宮谷隆「ベイズな予測―ヒット率高める主観的確率論の話」(リックテレコム)
ベイズ理論でなにができるようになるのか、その仕組みはなにかを中心に解説した一冊です。株価や販売戦略など、比較的ビジネス向けのネタが盛り込まれています。
小島寛之「完全独習 ベイズ統計学入門」(ダイヤモンド社)
四則演算のみで理解ができるということが売りのベイズ理論入門書です。ベイズ理論を用いたシステムの内部を理解したいときに読むと良いでしょう。
Allen B. Downey(訳:黒川利明)「Think Bayes――プログラマのためのベイズ統計入門」
主にプログラマ向けの書籍で、サンプルコードはPythonで書かれています。数学的な記述を控えめに、実例をもとに実用的にベイズ理論を解説し、応用的な部分をプログラミングの視点から知りたい場合に有効です。
間瀬茂「ベイズ法の基礎と応用 条件付き分布による統計モデリングとMCMC法を用いたデータ解析」(日本評論社)
ベイズ理論について深く掘り下げて解説した書籍です。ところどころ実際の応用例が載っており、理解の手助けにも、応用的なイメージをつけるためにも役立ちます。
さて、今回はベイズ理論の仕組みや活用例などの全体像を解説しました。18世紀に生み出されたベイズ理論は、現在さまざまな場面で活躍を見せています。
ベイズ理論は神学的な論争を背景にトーマス・ベイズによって生み出されたもので、客観性の低さから長いこと数学者から嫌われてきましたが、現在再評価されています。その理論は「未来の確率は過去のデータをもとに求められる」というもので、事前確率を設定し、新しいデータをもとに事後確率を求めるというものです。データ数が多くなると精度が上がったり、新しいデータで確率が変化したりする特徴を持っており、人間の思考とよく似ています。
現在脚光を浴びるベイズ理論ですが、他の理論と比べて優れている点は主に次の2つです。
- データを積み重ねて収集することができ、そのたびに精度が上がるという点。使えば使うほど(学べば学ぶほど)より高度なものとなる。
- 少ないデータでも理論の適用を可能とするという点。そのため開発のハードルが下がる。
ベイズ理論は次のような技術に応用されています。
- 検索エンジン:検索アルゴリズムに影響を与え、検索ワードから最適な検索結果を予測する。
- 迷惑メールの分類:蓄積されたデータをもとに特定の単語などから迷惑メールを分類。さらにその結果をフィードバックして精度を高める。
- 病気の罹患率:正しい罹患率を求めるのに使われる。
- レコメンド機能:おすすめの商品を購入履歴などのデータから割り出す。
- 接客支援:過去のノウハウをもとに顧客の反応を予測。さらに、得られたデータから学習し精度を高める。
ベイズ理論に関するサイトや書籍は豊富にありますが、応用を勉強したい人がまず手をつけて欲しいものは次の通りです。
・AVILEN AI Trend(株式会社AVILEN)
- 宮谷隆「ベイズな予測―ヒット率高める主観的確率論の話」(リックテレコム)
- 小島寛之「完全独習 ベイズ統計学入門」(ダイヤモンド社)
- Allen B. Downey(訳:黒川利明)「Think Bayes――プログラマのためのベイズ統計入門」
- ・間瀬茂「ベイズ法の基礎と応用 条件付き分布による統計モデリングとMCMC法を用いたデータ解析」(日本評論社)
ベイズ理論は非常に奥が深く、今回紹介したのは最初に知っておきたい基礎知識になります。最後に紹介したサイトや書籍を参考にさらなる知識を深めて、ベイズ理論を用いた最先端の技術を理解しましょう。
ベイズ統計学とは?初心者向けのやさしい解説
5分でスッキリ理解するベイズ推定
ベイズ原理はどうして生まれたのか?
ビッグデータの分析は客観的から主観的へ、ベイズ推定が注目される理由【第3回】
ベイズ理論の概要
ベイズ理論とは
現在,さまざまな分野で注目されるベイズ統計学
ベイズ推定の簡単な例と利点
グーグル、インテル、MSが注目するベイズ理論
ベイズ統計とは?普通の統計と何が違う?徹底解説!
BPMF(Bayesian Probabilistic Matrix Factorization)によるレコメンド
あの病気にかかる確率は? ベイズの定理
ベイズの定理で理解する新型コロナウイルスへのPCR検査の検査対象を絞る意義
なるほど統計学園高等部 | 迷惑メールの判別
ベイジアンネットワーク
ベイズ統計の入門書が出版ラッシュなのでまとめてみた
ベイズ統計を学びたい人はチェックしてほしい良書、8冊はこちらです
厳選8冊!ベイズ統計学を勉強する上でおすすめな本!