私は次のようなテキストファイルに1万語のリストを持っています:
G15 KDNC30Aアクション標準エアブラシ空気希釈
GenSimでの後続の処理のために、このコードを使用してそれらを小文字のトークンに変換しようとしています。
data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')]
texts = [[Word for Word in data.lower().split()] for Word in data]
そして、私は次のコールバックを受け取ります:
AttributeErrorTraceback (most recent call last)
<ipython-input-84-33bbe380449e> in <module>()
1 data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')]
----> 2 texts = [[Word for Word in data.lower().split()] for Word in data]
3
AttributeError: 'list' object has no attribute 'lower'
私が間違っていることとそれを修正する方法についての提案は大歓迎です!!!ありがとうございました!!
リストを小さな後者に変換するだけでこれを行うことができます。
>>> words = ["PYTHON", "PROGRAMMING"]
>>> type((words))
>>> for i in words:
print(i.lower())
出力:
pythonプログラミング