リストがあります:
my_list = ['element1\t0238.94', 'element2\t2.3904', 'element3\t0139847']
この結果を得るために\t
とその後のすべてを削除するにはどうすればよいですか:
['element1', 'element2', 'element3']
何かのようなもの:
>>> l = ['element1\t0238.94', 'element2\t2.3904', 'element3\t0139847']
>>> [i.split('\t', 1)[0] for i in l]
['element1', 'element2', 'element3']
myList = [i.split('\t')[0] for i in myList]
リストの各要素を反復処理してから、タブ文字で分割して新しいリストに追加してみてください。
for i in list:
newList.append(i.split('\t')[0])
リストを変数名として使用しないでください。次のコードもご覧ください。
clist = ['element1\t0238.94', 'element2\t2.3904', 'element3\t0139847', 'element5']
clist = [x[:x.index('\t')] if '\t' in x else x for x in clist]
またはインプレース編集:
for i,x in enumerate(clist):
if '\t' in x:
clist[i] = x[:x.index('\t')]
特徴抽出のリストをlt、lcの2つの部分に分割する必要がありました。
ltexts = ((df4.ix[0:,[3,7]]).values).tolist()
random.shuffle(ltexts)
featsets = [(act_features((lt)),lc)
for lc, lt in ltexts]
def act_features(atext):
features = {}
for Word in nltk.Word_tokenize(atext):
features['cont({})'.format(Word.lower())]=True
return features