web-dev-qa-db-ja.com

インデックスなしでpandas DataFrameを印刷する方法

データフレーム全体を印刷したいが、インデックスを印刷したくない

また、1つの列は日時型であり、日付ではなく時刻だけを出力したいです。

データフレームは次のようになります。

   User ID           Enter Time   Activity Number
0      123  2014-07-08 00:09:00              1411
1      123  2014-07-08 00:18:00               893
2      123  2014-07-08 00:49:00              1041

として印刷したい

User ID   Enter Time   Activity Number
123         00:09:00              1411
123         00:18:00               893
123         00:49:00              1041
100
lserlohn
print df.to_string(index=False)
144
Pavol Zibrita
print(df.to_csv(sep='\t', index=False))

または場合によっては:

print(df.to_csv(columns=['A', 'B', 'C'], sep='\t', index=False))
23
U2EF1

文字列/ jsonを出力するだけの場合は、次の方法で解決できます。

print(df.to_string(index=False))

データをシリアル化したり、MongoDBに送信したい場合は、次のようなことをお勧めします。

document = df.to_dict(orient='list')

データの方向を決めるには6つの方法があります。より適切な panda docs を確認してください。

3
Ziul

「インデックスなしでデータフレームを印刷する方法」の質問に答えるには、次のようにインデックスを空の文字列の配列(データフレームの各行に1つ)に設定できます。

blankIndex=[''] * len(df)
df.index=blankIndex

投稿のデータを使用する場合:

row1 = (123, '2014-07-08 00:09:00', 1411)
row2 = (123, '2014-07-08 00:49:00', 1041)
row3 = (123, '2014-07-08 00:09:00', 1411)
data = [row1, row2, row3]
#set up dataframe
df = pd.DataFrame(data, columns=('User ID', 'Enter Time', 'Activity Number'))
print(df)

通常、次のように出力されます。

   User ID           Enter Time  Activity Number
0      123  2014-07-08 00:09:00             1411
1      123  2014-07-08 00:49:00             1041
2      123  2014-07-08 00:09:00             1411

データフレーム内の行と同じ数の空の文字列を含む配列を作成することにより、

blankIndex=[''] * len(df)
df.index=blankIndex
print(df)

出力からインデックスを削除します:

  User ID           Enter Time  Activity Number
      123  2014-07-08 00:09:00             1411
      123  2014-07-08 00:49:00             1041
      123  2014-07-08 00:09:00             1411

Jupyter Notebooksでは、このスクリーンショットのようにレンダリングされます。 インデックス列のないJuptyer Notebooksデータフレーム

1
roj

以下の行は、印刷時にDataFrameのインデックス列を非表示にします

df.style.hide_index()
0
AnarchistGeek

データフレームをきれいに印刷する場合は、 tabulate packageを使用できます。

import pandas as pd
import numpy as np
from tabulate import tabulate

def pprint_df(dframe):
    print tabulate(dframe, headers='keys', tablefmt='psql', showindex=False)

df = pd.DataFrame({'col1': np.random.randint(0, 100, 10), 
    'col2': np.random.randint(50, 100, 10), 
    'col3': np.random.randint(10, 10000, 10)})

pprint_df(df)

具体的には、showindex=Falseは、名前が示すように、インデックスを表示しないようにします。出力は次のようになります。

+--------+--------+--------+
|   col1 |   col2 |   col3 |
|--------+--------+--------|
|     15 |     76 |   5175 |
|     30 |     97 |   3331 |
|     34 |     56 |   3513 |
|     50 |     65 |    203 |
|     84 |     75 |   7559 |
|     41 |     82 |    939 |
|     78 |     59 |   4971 |
|     98 |     99 |    167 |
|     81 |     99 |   6527 |
|     17 |     94 |   4267 |
+--------+--------+--------+
0
kingmakerking