DataFrame.to_html
関数を使用して、パンダデータフレームをhtml出力に変換しました。これを別のHTMLファイルに保存すると、ファイルに切り捨てられた出力が表示されます。
たとえば、私のTEXT列では、
df.head(1)
が表示されます
この映画は素晴らしい努力でした...
の代わりに
この映画は、この時期に広まった複雑な社会的感情を解体する上で優れた取り組みでした。
大規模なパンダデータフレームの画面に適した形式の場合は、この表現は問題ありませんが、データフレームに含まれる完全な表形式のデータを表示するHTMLファイル、つまり、後者のテキスト要素ではなく後者のテキスト要素を表示するものが必要です。元のテキストスニペット。
HTMLバージョンの情報のTEXT列に、各要素の完全で切り捨てられていないテキストデータを表示する方法を教えてください。 htmlテーブルは完全なデータを表示するために長いセルを表示する必要があると思いますが、私の知る限りではDataFrame.to_html
関数に渡すことができるのは列幅パラメータだけです。
display.max_colwidth
オプションを-1
に設定します。
pd.set_option('display.max_colwidth', -1)
たとえば、iPythonでは、情報が50文字に切り捨てられているのがわかります。過剰なものはすべて省略されています。
display.max_colwidth
オプションを設定した場合、情報は完全に表示されます。
pd.set_option('display.max_columns', None)
id
(2番目の引数)は列を完全に表示できます。
pd.set_option('display.max_columns', None)
は表示される最大列数を設定しますが、オプションpd.set_option('display.max_colwidth', -1)
は各フィールドの最大幅を設定します。
私の目的のために、残りのコードに影響を与えずに巨大なデータフレームを完全に印刷するための小さなヘルパー関数を書きました。それはまた浮動小数点数を再フォーマットし、仮想ディスプレイ幅を設定します。あなたのユースケースにそれを採用することができます。
def print_full(x):
pd.set_option('display.max_rows', len(x))
pd.set_option('display.max_columns', None)
pd.set_option('display.width', 2000)
pd.set_option('display.float_format', '{:20,.2f}'.format)
pd.set_option('display.max_colwidth', -1)
print(x)
pd.reset_option('display.max_rows')
pd.reset_option('display.max_columns')
pd.reset_option('display.width')
pd.reset_option('display.float_format')
pd.reset_option('display.max_colwidth')