教育

機械学習をプログラミングする人が知っておくべき英語の用語まとめ

機械学習をプログラミングする人が知っておくべき英語の用語まとめのイメージ

機械学習のプログラミングを習得するには、プログラミング言語はもちろんのこと線形代数や確率統計など数学の知識も大いに必要とされますよね。

しかし、機械学習の専門用語の多くは英語です。ですからそれらの言葉の意味を理解していなければ、機械学習のプログラミングを進めていくのは至難の業といえそう。英語が苦手な方はもちろんのこと、英語が得意という方でも機械学習のような専門用語となれば普段あまり聞き覚えのないような言葉も頻繁に出てきますので、また理解度も違ってくるのではないでしょうか。

今回は、機械学習のプログラミングを効率よく進めるために、知っておきたい英語の用語についてわかりやすくまとめてみましたので、お伝えします。

そもそもプログラミングはなぜ英語?

勉強をしていた人のイメージ

機械学習に限らず、プログラミングは英語で行われることが圧倒的に多いですよね。(各国の言語で開発できるプログラミング環境も一部ではあるようですが)

ではなぜ、プログラミングに英語が用いられるのでしょうか。
それは、初期のプログラミング言語であったFORTRANやCOBOLが当時のプログラミング先進国であったアメリカやイギリスで生まれたことが経緯として考えられています。また、コンピュータのインターフェースとして用いられたのが英文タイプライターであったことも要因の一つでしょう。

コンピュータの世界ではその草創期から英語がベーシックな言語としてアドバンテージを持っていたのです。

機械学習に必要な数学全般の英語用語

英語のイメージ

まず機械学習をプログラミングするためには、数学全般の知識も必要となってきますよね。

それではここではそんな機械学習に関わる数学の英語についてご紹介しましょう。

degree:多項式の次数
coefficient:係数
fraction:分数
indesies:指数
power:累乗(力ではありません)
product:積(Excel関数などでも登場しますね)
quotient:商、割合
ratio:比率
derivative,integrate:微分、積分
induction:帰納法
帰納法のとは、類似した事例をもとに、一般的法則や原理を導き出す方法のこと。
deduction:演繹法(えんえきほう)
演繹法とは、前提となる事象をもとに、そこから確実に言える結論を導き出す方法のこと。

機械学習には欠かせない!統計学の英語

統計学のイメージ

そして機械学習をプログラミングするにあたってもうひとつ欠かせないもの、それが統計学です。今度は、機械学習に必要な統計学の英語の用語についてご紹介していきます。

population:母集団
母集団とは統計の対象となるすべての要素の集合のこと。
sample:標本
標本は、母集団から一定数を抽出した部分集合。
mean:平均値
median:中央値
中央値はデータを小さい順に並べたときに中央に位置する値のこと。平均値とは異なることもあるので注意が必要です。
variance:分散
分散は確率変数からその期待値を引いた二乗の期待値のこと。確率変数の分布が期待値がどれくらい散らばっているのかを示す値のこと。
deviation:偏差
偏差は母集団に属するデータが標準となる一定の数値からどのくらい偏っているかの度合いのこと。
standard deviation:標準偏差
標準偏差は分散の正の平方根として定義されます。データの散らばり具合を表す指標のひとつ。
distribution:分布
分布とは、確率変数に対して、各々の値をとる確率を表す関数のこと。
mean squared error,MSE:平均二乗誤差
平均二乗誤差とは測定値と真値の差の相加平均について正の平方根をとったもので、測定値のばらつき具合を定量的に表すもの。この平均二乗誤差が小さければ小さいほど測定精度が高いといえます。
R-squared,coefficient of determination:決定係数、寄与率
回帰分析によって求められた目的変数の予測値が、実際の目的変数の数値とどの程度一致しているかを表す指標のことです。寄与率とも呼ばれます。
analysis of variance,ANOVA:分散分析
分散分析は観測するデータにおける変動を、誤差変動と各要因およびそれらの交互作用による変動に分解することにより、要因及び交互作用の効果を判定する手法のこと。
Interquartile Range,IQR:四分位範囲
データを大きさの順に並べたとき、下から25%に位置する値を第1四分位数、50%に位置する値を第2四分位数、75%に位置する値を第3四分位数です。このとき第3四分位数と第1四分位数の差を四分位範囲と言います。
multivariate analysis:多変量解析
統計学において、複数の独立変数からなる多変量のデータを統計的に扱う手法のことを多変量解析。これは主成分分析、因子分析、クラスタ分析などがあります。
Collaborative Filterring:協調フィルタリング
協調フィルタリングは多くのユーザの嗜好に関する情報を蓄積し、あるユーザの嗜好と類似したほかのユーザの情報を用いて自動的に推論を行う方法のこと。「この商品を買った人はこの商品も見ています」といった、趣味の似た人へのレコメンドなどに活用されます。

機械学習の画像処理に関する英語の用語

画像処理のイメージ

ところで機械学習、なかでもディープラーニングの活用分野として注目されているのが画像処理ですよね。ここでは、そんな機械学習の画像処理に関する英語の用語をご紹介しましょう。

Convolutional Neural Network,CNN:畳み込みニューラルネットワーク
機械学習における、順伝播型ディープニューラルネットワークの一種で、画像や動画認識に広く使われているモデル。
Recurrent Neural Network,RNN:再起型ニューラルネットワーク
再起型ニューラルネットワークはある層の出力がもう一度同じ層に入力される「回帰結合」を持ったニューラルネットワークのことです。この「回帰結合」を持つことで、ニューラルネットワークが過去の情報を保持することができるようになります。
Generative Adversarial Networks,GAN:敵対的生成ネットワーク
敵対的生成ネットワークは生成モデルの一種で、データから特徴を学習することで、実在しないデータを生成したり、存在するデータの特徴に沿って変換することができます。正解データを与えずに特徴を学習する「教師なし学習」の手法として注目。

ニューラルネットワークに関する英語の用語

ニューラルネットワークのイメージ

今度はNeural Networkです。Neural Network(ニューラルネットワーク)は、人間の神経回路を模したもので、入力層、1つ以上の中間層、出力層という多層ネットワークを構成するもの。これも機械学習に関わる重要な概念のひとつです。最後はこのニューラルネットワークに関する英語の用語についてご紹介しましょう。

training:学習
これは機械学習のモデルを作ること。大量のデータを入力し、適切な出力を行う方法を求めていく作業のことです。
supervised learning:教師あり学習
教材となるデータに「答え」を付加して与えることでAI(人工知能)に学習させる方法。
unsupervised learning:教師なし学習
教材となるデータに答えがなく、AI(人工知能)自らが特長や傾向などをつかみながら学習していく方法のこと。
deep learning:深層学習
機械学習をより人間の思考に近づけたもの。機械学習のニューラルネットワークが「入力層」「中間層」「出力層」の3層で思考していたのに対し、ディープラーニングでは中間層が複数の層に分かれているため、より人間に近い深い思考が可能。深層学習ではAI(人工知能)自らが着目すべき特徴量を見つけ出すことができます。
reinforcement learning:強化学習
教師あり学習、教師なし学習のような固定的なデータをもとにした学習ではなく、プログラム自身が、現在の状態を認識し、一連の行動の結果最も多く報酬が得られる行動を自ら学習し、選択していくもの。また、行動についての評価も自ら更新していく。

 

プログラミングのイメージ

今回は、機械学習のプログラミングをする人が知っておくべき英語の用語についてご紹介してきました。

英語の苦手な人も、得意な人も、機械学習を学ぶ上で欠くことのできない重要な用語を中心にピックアップしていますので、これらの英語の用語を覚えておくことは、機械学習のプログラミングに役立つだけではなく、英語で書かれた論文を読む際などにも役立ちそうですよね。

ただし、機械学習に関する英語の用語は、今回ご紹介したもの以外にもまだまだたくさんあります。

文献などを読んでいてわからない用語が出てきたときは、「これどんな意味だっけ?」とすぐに調べるクセをつけておくと良いでしょう。そうすれば、機械学習に対する理解も圧倒的に進んでいきます。

ところで、機械学習の用語についてもう少し詳しく知りたい方はこちらもご覧ください。

みんなのAI(人工知能)用語集

トップへ戻る
タイトルとURLをコピーしました