機械学習に関する記事を読んでいたり勉強を行なっていると、「データセット」という言葉によく出会いますよね。この言葉は理系出身の方や普段データ解析を行なうなど、データを扱う業務をしていない人にとっては馴染みのない言葉でしょう。
「データと同じ意味でしょ?」と捉えることも間違いではないですが、一つ一つの言葉に対する正しい意味を理解をしておくことは大切なことです。そこで今回はこの「データセット」の意味についてお伝えします。
一言で言うと「データセット」とは・・・
データの集まりのことです
データセットとデータは厳密には違うものを意味する
データセットとはデータの集まりを意味する言葉ですが、データという言葉が出て来ても文脈によっては正確には「データセット」のことを指している場合があります。
例えば、ある製品の日本の各都道府県の売り上げを見たい場合は、日本全国のデータをデータセットと表現し、各都道府県の売り上げをデータセットの一部、または単にデータと表現します。
まとめ
つまり、データセットとは
データを集めたもののことを言います。
<参考>
つっちー
AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。
コメントをどうぞ