AI(人工知能)用語集

ゼロからわかるAI(機械学習)モデルの評価に役立つ混同行列とは

混同行列

実用的なAI(機械学習)モデルをつくるには訓練データを用いて学習させていく必要がありますが、目的達成に繋がる適切なモデルかどうかを判断するにはただ精度だけを見るのでは危険です。

※モデル:ある事象を簡略化して本質を表したもの(パターンやルールを数式で表現したもの)です

※訓練データ:実用的なAI(機械学習)モデルを作るために、モデルを訓練させるために用いるデータです

※学習:データの傾向やパターンを適切に表現するモデルを構築していくことです

AI(人工知能)はあくまで問題解決のためのツールなので、解きたい問題やテーマに応じて適切な性能評価が求められます。そこで今回は、性能評価の中でも代表的な存在である「混同行列」という行列についてお伝えしていきます。

一言で言うと「混同行列」とは・・・

AI(機械学習)モデルの性能を数値化して評価するための最も包括的な方法の一つです

4つの領域から構成される混同行列

混同行列は、「予測結果がどうだったか」と「実際どうだったか」の関係を示す行列で、次のような形をしています。

混同行列

陽性=Postive, 陰性=Negative、予測が当たった→真 = True、予測が外れた→偽 = Falseという意味です。

混同行列の内容を具体的に整理すると、

真陽性(TP):実際陽性であるものを陽性だと予測した

偽陰性(FN):実際陽性であるものを陰性だと予測した

偽陽性(FP):実際陰性であるものを陽性だと予測した

真陰性(TN):実際陰性であるものを陰性だと予測した

となり、上の図を略称表記にして見やすく整えると次のようになります。

混同行列

この混同行列から、

  • モデルによって予測したものが実際どれだけ的中したのかの割合を表す「正解率(精度)」
  • 陽性だと予測したもののうち実際に陽性だった割合を示す「適合率」
  • 実際に陽性だったものを陽性だと予測できた割合を示す「再現率」
  • 「適合率」と「再現率」のバランスを示す指標である「F値(F-measure、F1スコア、F尺度)」

が算出でき、これらを元に機械学習モデルの性能を評価することできます。

つっちー
つっちー

もっと詳しく知りたい方はこちらの記事がオススメです!↓

まとめ

つまり、「混同行列」とは

AI(機械学習)モデルの性能評価に用いられる最も包括的な方法の一つであり、真陽性(TP)、偽陰性(FN)、偽陽性(FP)、真陰性(TN)という4つの領域から構成される行列です。この領域から算出されるいくつかの指標を用いてモデルの性能を評価することができます。
つっちー
つっちー

AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(ほぼ実話)。

「歩く負債」と言われた僕がゼロからAIエンジニアになる為のステップを実践してみた!
みんなのAI(人工知能)用語集

コメントをどうぞ

トップへ戻る
タイトルとURLをコピーしました