例 に従ってSeabornを使用してグループ化された箱ひげ図を取得しようとしています
上記の例を動作させることができますが、次の行:
tips = sns.load_dataset("tips")
まったく説明されていません。 tips.csvファイルを見つけましたが、load_datasetが具体的に何をするかについての適切なドキュメントを見つけることができないようです。私は自分のcsvを作成してこれをロードしようとしましたが、役に立ちませんでした。また、tipsファイルの名前を変更しましたが、まだ機能していました...
したがって、私の質問は次のとおりです。
load_dataset
実際にファイルを探していますか?これを自分の箱ひげ図に実際に使用できますか?
編集:私は自分のDataFrame
を使用して自分のボックスプロットを動作させることができましたが、load_dataset
は、謎めいたチュートリアルの例以外にも使用されます。
_load_dataset
_は https://github.com/mwaskom/seaborn-data でオンラインのCSVファイルを探します。 docstringは次のとおりです。
オンラインリポジトリからデータセットをロードします(インターネットが必要です)。
パラメーター
name:strデータセットの名前(
name
。csv on https://github.com/mwaskom/seaborn-data )。 :func:_get_dataset_names
_を使用して、利用可能なデータセットのリストを取得できます。kws:dict、オプションpandas.read_csvに渡されます
そのオンラインデータセットを変更するか、独自のデータを取り込む場合は、おそらく pandas を使用する必要があります。 _load_dataset
_は、実際にpandas DataFrame
オブジェクトを返します。これは、type(tips)
で確認できます。
たとえば、tips2.csvという名前のcsvファイルに独自のデータを作成し、スクリプトと同じ場所に保存した場合は、これを使用して(pandasをインストールした後)ロードします。
_import pandas as pd
tips2 = pd.read_csv('tips2.csv')
_
「セルウィス」の答えに追加するだけです。
import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)
これらの手順を正常に完了したら。これで、プロットは実際に次のように機能します。
バープロットをプロットするとします。
sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.
これは、実際にシーボーンのすべてのプロットで機能します。
さらに、Seaborn Gitに独自のデータセットを追加する資格はありません。