可能性のある複製:
Python文字列自然ソート用の組み込み関数を持っていますか?
数字を含む文字列のリストがあり、それらを並べ替える良い方法が見つかりません。
たとえば、次のようになります。
_something1
something12
something17
something2
something25
something29
_
sort()
メソッドを使用します。
私はおそらく何らかの方法で数字を抽出してからリストをソートする必要があることを知っていますが、最も簡単な方法でそれを行う方法がわかりません。
おそらくあなたは 人間のソート ( 自然なソート としても知られています)を探しています:
import re
def atoi(text):
return int(text) if text.isdigit() else text
def natural_keys(text):
'''
alist.sort(key=natural_keys) sorts in human order
http://nedbatchelder.com/blog/200712/human_sorting.html
(See Toothy's implementation in the comments)
'''
return [ atoi(c) for c in re.split(r'(\d+)', text) ]
alist=[
"something1",
"something12",
"something17",
"something2",
"something25",
"something29"]
alist.sort(key=natural_keys)
print(alist)
利回り
['something1', 'something2', 'something12', 'something17', 'something25', 'something29']
PS。 Toothyの自然な並べ替えの実装を使用するように回答を変更しました(コメントに投稿 here )。これは元の回答よりもかなり高速だからです。
フロートでテキストを並べ替える場合は、intに一致するものから正規表現を変更する必要があります(つまり、(\d+)
)to floatsに一致する正規表現 :
import re
def atof(text):
try:
retval = float(text)
except ValueError:
retval = text
return retval
def natural_keys(text):
'''
alist.sort(key=natural_keys) sorts in human order
http://nedbatchelder.com/blog/200712/human_sorting.html
(See Toothy's implementation in the comments)
float regex comes from https://stackoverflow.com/a/12643073/190597
'''
return [ atof(c) for c in re.split(r'[+-]?([0-9]+(?:[.][0-9]*)?|[.][0-9]+)', text) ]
alist=[
"something1",
"something2",
"something1.0",
"something1.25",
"something1.105"]
alist.sort(key=natural_keys)
print(alist)
利回り
['something1', 'something1.0', 'something1.105', 'something1.25', 'something2']