私は機械学習の基本について チュートリアル をフォローしていますが、何かが機能またはラベル。
私が知っていることから、機能は使用されているデータの特性です。ラベルの意味を理解することはできません。Wordの意味はわかっていますが、機械学習の文脈での意味を知りたいのです。
簡単に言うと、特徴が入力されています。ラベルが出力されます。これは分類問題と回帰問題の両方に当てはまります。
フィーチャは、入力セット内のデータの1列です。たとえば、誰かが選択するペットの種類を予測しようとしている場合、入力機能には年齢、出身地、家族の収入などが含まれます。ラベルは、犬、魚、イグアナ、岩などの最終選択です。等.
モデルをトレーニングしたら、それらの機能を含む一連の新しい入力をモデルに渡します。その人の予測された「ラベル」(ペットタイプ)を返します。
Feature:
機械学習機能では、トレーニングデータの特性を意味します。トレーニングデータセットで列名を言うこともできます。
これがあなたのトレーニングデータセットだとしましょう
Height Sex Age
61.5 M 20
55.5 F 30
64.5 M 41
55.5 F 51
. . .
. . .
. . .
. . .
それで、ここでHeight
、Sex
、およびAge
が機能です。
ラベル:
モデルのトレーニング後にモデルから得られる出力はラベルと呼ばれます。
上記のデータセットを何らかのアルゴリズムにフィードし、男女を性別として予測するモデルを生成するとします。上記のモデルでは、age
、height
などの機能を渡します。
そのため、計算後に性別を男性または女性として返します。それはと呼ばれるラベル
簡単に説明された機能はあなたがシステムに与えた入力であり、ラベルはあなたが期待している出力です。たとえば、犬の身長、毛皮の色など、犬のさまざまな機能を提供したので、計算後に、知りたい犬の品種が返されます。
手書きの写真を使用してアルファベットを検出する例を見てみましょう。これらのサンプル画像をプログラムでフィードし、プログラムは取得した機能に基づいてこれらの画像を分類します。
このコンテキストでの機能の例は次のとおりです。文字'C'
は、右向きの凹面と考えることができます。
これらの機能を保存する方法に関して疑問が生じています。それらに名前を付ける必要があります。ラベルの役割は次のとおりです。 ラベルがそのような機能に与えられ、区別は他の機能と区別されます。
したがって、features as inputを指定すると、-labels as outputが得られます。
ラベルはnot教師なし学習に関連付けられています。
前提条件:基本統計とML(線形回帰)への露出
文で答えることができます-
それらは似ていますが、必要に応じて定義が変わります。
私の声明を説明させてください。データセットがあるとします。この目的のために、exercise.csv
を検討してください。データセットの各列は、フィーチャと呼ばれます。性別、年齢、身長、心拍数、Body_temp、およびカロリーは、さまざまな列の1つです。各列は、個別の機能またはプロパティを表します。
User_ID Gender Age Height Weight Duration Heart_Rate Body_Temp Calories
14733363 male 68 190.0 94.0 29.0 105.0 40.8 231.0
14861698 female 20 166.0 60.0 14.0 94.0 40.3 66.0
11179863 male 69 179.0 79.0 5.0 88.0 38.7 26.0
理解を固め、パズルを明確にするために、2つの異なる問題(予測の場合)を取り上げます。
CASE1:この場合、運動中に消費されるカロリーを予測するために、性別、身長、体重の使用を検討するかもしれません。その予測(Y) カロリー がここにあります Label。 カロリー -x1:Gender、x2:Heightおよびx3:Weightなどのさまざまな機能を使用して予測する列です。
CASE2:ここの2番目のケースでは、性別と体重を機能として使用して、Heart_rateを予測できます。ここでHeart_Rateは Label features-x1:Gender and x2:Weightを使用して予測されます。
上記の説明を理解すると、Label and Featuresともう混同することはなくなります。