python pandasを学習しています。pandasデータフレームを保存する2つの方法を示すチュートリアルが表示されます。
pd.to_csv('sub.csv')
および開くpd.read_csv('sub.csv')
pd.to_pickle('sub.pkl')
および開くpd.read_pickle('sub.pkl')
チュートリアルによると、to_pickle
はデータフレームをディスクに保存することです。私はこれについて混乱しています。 to_csv
を使用すると、csvファイルがフォルダーに表示されるのがわかりました。これもディスクに保存されていると思いますか?
一般に、csvやtxt、またはその他の形式で保存するのではなく、to_pickle
を使用してデータフレームを保存したいのはなぜですか?
Pickleは、Pandasデータフレームを保存するシリアル化された方法です。基本的には、データフレームの正確な表現をディスクに書き込みます。これは、列のタイプが同じで、インデックスが同じであることを意味します。ファイルをcsvとして保存するだけの場合は、ファイルをコンマ区切りのリストとして保存するだけです。データセットによっては、ファイルを再度読み込むと一部の情報が失われます。