AI(人工知能)用語集

2分でわかる!機械学習アルゴリズムの基本、決定木学習を入門

決定木

機械学習アルゴリズム(機械学習の方法)には様々な種類がありますよね。たくさんある機械学習アルゴリズムの全てを理解するなんてことはとてもできませんが、代表的なものは知っておきたいもの。その中の1つが「決定木(けっていぎ)」です。

そこで今回は、決定木の基本について入門編という形でお伝えしていきます。

一言で言うと「決定木」とは・・・

教師あり学習(分類)に該当する機械学習アルゴリズムの一つで、一連の質問に基づいて決断を下す方法でデータを分類していきます。

階層の深さを指定してあげることが大事

決定木(decision tree)分類器は、得られた結果の意味を解釈しやすいかどうかに配慮する場合に魅力的なモデルである。「決定木」は、一連の質問に基づいて決断を下すという方法により、データを分類するモデルであると考えることができます。

例えば、名前のわからない犬の名前を「これ何犬?」と尋ねると「〇〇犬!」と教えてくれるAI(機械学習)をつくろうとして決定木学習を採用した場合、決定木のモデルは次のように段階的に犬の特徴を見つけていくイメージになります。

深さが3の決定木のイメージ

もっと階層を増やせば(自由に指定可能です)こんな風に犬の画像を判定するために必要な特徴が増えていきます。

深さが6の決定木のイメージ

このように、決定木モデルは階層がどんどん深くなっていくにつれて犬の細かな特徴(目的変数を分類しやすい特徴)を段階的に見つけていくわけです。これはつまり、階層が増えるほど、決定木モデルがごちゃごちゃして複雑になっていくということです。

決定木モデルでは、一番最初の始点を決定木の根(ルート)と呼び、分割された一つ一つを葉(リーフ)と読んでいます。決定木は、各リーフのサンプルが全て同じクラスに属するようになるまで、上の図のような分割を繰り返すことができます。しかし実際には、リーフを分割しすぎてしまうと過学習に陥りやすくなるため、階層の深さをどこまでにするかについては制限を設けることが重要です。

※過学習:訓練データにだけ適合して、テストデータには適合していないモデルの状態

まとめ

つまり、決定木とは

一連の質問に基づいて決断を下す方法でデータを分類していく機械学習アルゴリズムで、過学習を防ぐために階層の深さに関する制限を設けることが大事です
つっちー
つっちー

AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(ほぼ実話)。

「歩く負債」と言われた僕がゼロからAIエンジニアになる為のステップを実践してみた!
みんなのAI(人工知能)用語集

コメントをどうぞ

トップへ戻る
タイトルとURLをコピーしました