KaggleのSan Fransico Salariesから抽出されたデータフレームがあります。 https://www.kaggle.com/kaggle/sf-salaries と、たとえば状態'。
これは私が試したものですが、セットの代わりにすべてのレコードのリストを表示します(sfはデータフレームの命名方法です)。
a=set(sf['Status'])
print a
このWebページによると、これは機能するはずです。 pythonでリスト項目からセットを作成する方法?
一意の値のリストのみを取得する必要がある場合は、unique
メソッドを使用できます。 Pythonを設定する場合は、set(some_series)
を実行します
In [1]: s = pd.Series([1, 2, 3, 1, 1, 4])
In [2]: s.unique()
Out[2]: array([1, 2, 3, 4])
In [3]: set(s)
Out[3]: {1, 2, 3, 4}
ただし、DataFrameがある場合は、その中からシリーズを選択するだけです(some_data_frame['<col_name>']
)。