機械学習によく使われる損失関数の種類を整理してみた

教師あり学習では与えられたデータとその正解データの組み合わせからある損失関数を最小化するように学習しますよね。本記事では機械学習で利用される様々な損失関数について紹介していきましょう。

そもそも損失関数とは
まとめ

そもそも損失関数とは

機械学習アルゴリズムは一般にどれだけ正しく予測できているかの指標として損失関数を利用し、その損失関数を最小化することで最も正しい予測ができているとします。

本章では著名ないくつかの損失関数とその性質の紹介をしていきましょう。

二乗誤差(Mean squared error)

まずは二乗誤差（Mean squared error）について解説していきましょう。

二乗誤差は回帰問題で広く利用される損失関数で、上記の数式で表されます。二乗誤差は予測値と正解ラベルの誤差を二乗したものですが、これはデータに含まれるノイズに平均0の正規分布を仮定した場合の最尤推定（さいゆうすいてい）の結果と一致します。

交差エントロピー誤差(Cross entropy error)

次に、交差エントロピーエントロピー誤差(Cross entropy error)について解説していきましょう。

交差エントロピー誤差は分類問題で広く利用される損失関数で、正解ラベル0か1と予測結果に自然対数をとったものの積で表現されます。正解ラベルに対応するものの損失関数の値が0でなくなり、また自然対数は入力が0の場合に負の無限大の値を返し、1の場合に0を返す関数です。

このことから交差エントロピー誤差は、予測の確信度が高い正解であればあるほど0に近い値を返し、確信度の低いものほど大きな値を返します。

回帰問題における二乗誤差、分類問題における交差エントロピー誤差はとりあえずこれを利用するといっていいほど広く利用されるので覚えておくと良いでしょう。これら損失関数を試した上で応用の目的に合わせて他の損失関数を試して求めたモデルに近づいているかどうかを判断することが多いです。

平均絶対誤差(Mean absolute error)

続いて、平均絶対誤差(Mean absolute error)について解説していきましょう。

平均絶対誤差は主に回帰問題に利用される損失関数で、予測と正解の差を二乗しないため二乗誤差と比較して外れ値の影響を受けにくいという性質があります。また二乗誤差の場合は予測を大きく外したものに対してより大きなペナルティを与えるのに対し、平均絶対誤差では予測を大きく外したものも予測との差が小さいものも同じスケールでペナルティを与えます。