目的:models
のすべての行内のアンカータグからテキストを抽出し、csvに配置します。
私はこのコードを試しています:
with open('Sprint_data.csv', 'ab') as csvfile:
spamwriter = csv.writer(csvfile)
models = soup.find_all('li' , {"class" : "phoneListing"})
for model in models:
model_name = unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip()
spamwriter.writerow(unicode(u' '.join(model.a.stripped_strings)).encode('utf8').strip())
Csvの各セルに含まれる文字が1つだけであることを除いて、正常に機能しています。
このような:
| S | A | M | S | U | N | G |
の代わりに:
|SAMSUNG|
もちろん、私は何かが欠けています。でも何?
writerow
はシーケンスを受け入れます。単一の文字列を与えているので、それをシーケンスとして扱い、文字列は文字のシーケンスのように機能します。
この行には他に何が必要ですか?何もない?その場合、1つのアイテムのリストにします。
_spamwriter.writerow([u' '.join(model.a.stripped_strings).encode('utf8').strip()])
_
(ところで、すでにUnicode区切り文字で結合しているため、unicode()
呼び出しは完全に不要です。)
.writerow()
はシーケンス(_''
_、_()
_、_[]
_)を必要とし、各インデックスを行の独自の列に順番に配置します。目的の文字列がシーケンス内のアイテムでない場合、writerow()
は文字列内の各文字を反復処理し、それぞれが個別のセルでCSVに書き込まれます。
後_import csv
_
これがリストの場合:
_myList = ['Diamond', 'Sierra', 'Crystal', 'Bridget', 'Chastity', 'Jasmyn', 'Misty', 'Angel', 'Dakota', 'Asia', 'Texxxas', 'Desiree', 'Monique', 'Tatiana']
listFile = open('Strippers.csv', 'wb')
writer = csv.writer(listFile)
for item in myList:
writer.writerow(item)
_
上記のスクリプトは、次のCSVを生成します:strippers.csv
_D,i,a,m,o,n,d
S,i,e,r,r,a
C,r,y,s,t,a,l
B,r,i,d,g,e,t
C,h,a,s,t,i,t,y
J,a,s,m,y,n
M,i,s,t,y
A,n,g,e,l
D,a,k,o,t,a
A,s,i,a
T,e,x,x,x,a,s
D,e,s,i,r,e,e
M,o,n,i,q,u,e
T,a,t,i,a,n,a
_
独自のセルに各名前が必要な場合、解決策は単純に文字列(item
)をシーケンスに配置することです。ここでは、角括弧_[]
_を使用します。 :
_listFile2 = open('Strippers2.csv', 'wb')
writer2 = csv.writer(listFile2)
for item in myList:
writer2.writerow([item])
_
.writerow([item])
を含むスクリプトは、目的の結果を生成します:Strippers2.csv
_Diamond
Sierra
Crystal
Bridget
Chastity
Jasmyn
Misty
Angel
Dakota
Asia
Texxxas
Desiree
Monique
Tatiana
_
リスト記号で囲むだけです(つまり[])
writer.writerow([str(one_column_value)])
これは通常私が使用するソリューションです:
import csv
with open("output.csv", 'w', newline= '') as output:
wr = csv.writer(output, dialect='Excel')
for element in list_of_things:
wr.writerow([element])
output.close()
これにより、すべてのリスト要素の出力が単一の行ではなく単一の列に表示されます。
ここでのキーポイントは、リストを反復処理し、 '[list]'を使用してcsvwriterシーケンスの問題を回避することです。
これが役に立つことを願っています!