ファイル内のタブに基づいて文字列を分割する

Question

タブ（「\ t」）で区切られた値を含むファイルがあります。リストを作成し、ファイルのすべての値をリストに保存しようとしています。しかし、問題が発生します。これが私のコードです。

line = "abc def ghi" values = line.split("	")

各値の間にタブが1つしかない限り、問題なく機能します。ただし、タブが複数ある場合は、タブも値にコピーされます。私の場合、主に余分なタブはファイルの最後の値の後になります。

Ashwini Chaudhary · Accepted Answer

ここでregexを使用できます。

>>> import re >>> strs = "foo	bar		spam" >>> re.split(r'	+', strs) ['foo', 'bar', 'spam']

更新：

str.rstripを使用して、末尾の' 'を取り除き、正規表現を適用できます。

>>> yas = "yas		bs	cda		" >>> re.split(r'	+', yas.rstrip('	')) ['yas', 'bs', 'cda']

DimmuR · Answer

正規表現を使用してこれを行うことができます。

import re patt = re.compile("[^	]+") s = "a		bcde		ef" patt.findall(s) ['a', 'bcde', 'ef']

CornSmith · Answer

タブで分割しますが、空白の一致をすべて削除します。

text = "hi	there			my main man" print [splits for splits in text.split("	") if splits is not ""]

出力：

['hi', 'there', 'my main man']

Sylvain Leroux · Answer

他のregexベースのソリューション：

>>> strs = "foo	bar		spam" >>> r = re.compile(r'([^	]*)	*') >>> r.findall(strs)[:-1] ['foo', 'bar', 'spam']

Sylvain Leroux · Answer

Pythonは、同名の csv モジュールでCSVファイルをサポートしています。 カンマで区切られた値よりもはるかに多くをサポートしているため、比較的誤った名前です。

基本的なWord分割を超える必要がある場合は、ご覧ください。たとえば、引用符で囲まれた値を処理する必要があるためです。