数値文字列の左側にゼロを埋め込む最もPythonicの方法は何ですか、つまり数値文字列は特定の長さを持ちますか
文字列:
>>> n = '4'
>>> print(n.zfill(3))
004
そして数のために:
>>> n = 4
>>> print('%03d' % n)
004
>>> print(format(n, '03')) # python >= 2.6
004
>>> print('{0:03d}'.format(n)) # python >= 2.6
004
>>> print('{foo:03d}'.format(foo=n)) # python >= 2.6
004
>>> print('{:03d}'.format(n)) # python >= 2.7 + python3
004
>>> print('{0:03d}'.format(n)) # python 3
004
>>> print(f'{n:03}') # python >= 3.6
004
文字列オブジェクトの rjust メソッドを使うだけです。
この例では、必要に応じてパディングして、10文字の文字列を作成します。
>>> t = 'test'
>>> t.rjust(10, '0')
>>> '000000test'
数字の場合:
print "%05d" % number
Python:Stringのフォーマットも参照してください 。
_ edit _ :それは注目に値する 昨日 2008年12月3日、このフォーマットの方法はformat
文字列メソッドを支持して非推奨となりました。
print("{0:05d}".format(number)) # or
print(format(number, "05d"))
詳細は PEP 3101 を参照。
>>> '99'.zfill(5)
'00099'
>>> '99'.rjust(5,'0')
'00099'
あなたが反対を望むならば:
>>> '99'.ljust(5,'0')
'99000'
Python 2とPython 3の両方で動作します。
>>> "{:0>2}".format("1") # Works for both numbers and strings.
'01'
>>> "{:02}".format(1) # Only works for numbers.
'01'
str(n).zfill(width)
はstring
s、int
s、float
s ...で動作し、Python 2. x および3. x と互換性があります。
>>> n = 3
>>> str(n).zfill(5)
'00003'
>>> n = '3'
>>> str(n).zfill(5)
'00003'
>>> n = '3.0'
>>> str(n).zfill(5)
'003.0'
ここに来た人は理解するためであり、素早い答えではありません。私は特に時間文字列のためにこれらを行います:
hour = 4
minute = 3
"{:0>2}:{:0>2}".format(hour,minute)
# prints 04:03
"{:0>3}:{:0>5}".format(hour,minute)
# prints '004:00003'
"{:0<3}:{:0<5}".format(hour,minute)
# prints '400:30000'
"{:$<3}:{:#<5}".format(hour,minute)
# prints '4$$:3####'
"0"は "2"のパディング文字に置き換えるものを表します。デフォルトは空白です。
">"記号は、文字列の左側にあるすべての2 "0"文字を割り当てます。
":"はformat_specを表します
width = 10
x = 5
print "%0*d" % (width, x)
> 0000000005
刺激的な詳細については、印刷物の資料を参照してください。
Python 3.x用に更新(7.5年後)
その最後の行は次のようになります。
print("%0*d" % (width, x))
すなわちprint()
は関数であり、文ではありません。 IMNSHOの方が読みやすく、1980年1月からその表記法を使用してきたので、私はまだOld Schoolのprintf()
スタイルを好みます。 。
数値文字列の左側にゼロを埋め込むための最もPythonicの方法は何ですか?つまり、数値文字列は特定の長さを持ちますか?
str.zfill
はこれを行うことを特に意図しています。
>>> '1'.zfill(4)
'0001'
それは特に要求されたように数値文字列を扱うことを意図していて、+
または-
を文字列の先頭に移動することに注意してください。
>>> '+1'.zfill(4)
'+001'
>>> '-1'.zfill(4)
'-001'
これがstr.zfill
のヘルプです。
>>> help(str.zfill)
Help on method_descriptor:
zfill(...)
S.zfill(width) -> str
Pad a numeric string S with zeros on the left, to fill a field
of the specified width. The string S is never truncated.
これは、他の方法の中でも最も高性能なものです。
>>> min(timeit.repeat(lambda: '1'.zfill(4)))
0.18824880896136165
>>> min(timeit.repeat(lambda: '1'.rjust(4, '0')))
0.2104538488201797
>>> min(timeit.repeat(lambda: f'{1:04}'))
0.32585487607866526
>>> min(timeit.repeat(lambda: '{:04}'.format(1)))
0.34988890308886766
リンゴを%
メソッドのリンゴと最もよく比較するには(実際には時間がかかることに注意してください)、そうでなければ事前計算します。
>>> min(timeit.repeat(lambda: '1'.zfill(0 or 4)))
0.19728074967861176
>>> min(timeit.repeat(lambda: '%04d' % (0 or 1)))
0.2347015216946602
少し掘り下げると、 Objects/stringlib/transmogrify.h
にzfill
メソッドの実装が見つかりました。
static PyObject *
stringlib_zfill(PyObject *self, PyObject *args)
{
Py_ssize_t fill;
PyObject *s;
char *p;
Py_ssize_t width;
if (!PyArg_ParseTuple(args, "n:zfill", &width))
return NULL;
if (STRINGLIB_LEN(self) >= width) {
return return_self(self);
}
fill = width - STRINGLIB_LEN(self);
s = pad(self, fill, 0, '0');
if (s == NULL)
return NULL;
p = STRINGLIB_STR(s);
if (p[fill] == '+' || p[fill] == '-') {
/* move sign to beginning of string */
p[0] = p[fill];
p[fill] = '0';
}
return s;
}
このCコードを見ていきましょう。
最初に引数を位置的に解析します。つまり、キーワード引数は許可されません。
>>> '1'.zfill(width=4)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: zfill() takes no keyword arguments
それはそれが同じ長さかそれより長いかどうかをチェックし、その場合それは文字列を返します。
>>> '1'.zfill(0)
'1'
zfill
はpad
を呼び出します(このpad
関数は、ljust
、rjust
、およびcenter
からも呼び出されます)。これは基本的に内容を新しい文字列にコピーしてパディングを埋めます。
static inline PyObject *
pad(PyObject *self, Py_ssize_t left, Py_ssize_t right, char fill)
{
PyObject *u;
if (left < 0)
left = 0;
if (right < 0)
right = 0;
if (left == 0 && right == 0) {
return return_self(self);
}
u = STRINGLIB_NEW(NULL, left + STRINGLIB_LEN(self) + right);
if (u) {
if (left)
memset(STRINGLIB_STR(u), fill, left);
memcpy(STRINGLIB_STR(u) + left,
STRINGLIB_STR(self),
STRINGLIB_LEN(self));
if (right)
memset(STRINGLIB_STR(u) + left + STRINGLIB_LEN(self),
fill, right);
}
return u;
}
pad
を呼び出した後、zfill
は最初に先行していた+
または-
を文字列の先頭に移動します。
元の文字列が実際には数値である必要はないことに注意してください。
>>> '+foo'.zfill(10)
'+000000foo'
>>> '-foo'.zfill(10)
'-000000foo'
整数として保存された郵便番号の場合
>>> a = 6340
>>> b = 90210
>>> print '%05d' % a
06340
>>> print '%05d' % b
90210
>>> width = 4
>>> x = 5
>>> print("%0*d" %(width,x))
>>> 00005
これはPython 3.xで動作します。
>= Python 3.6
を使用する場合、最もクリーンな方法は f-strings と string formating を使用することです。
>>> s = f"{1:08}" # inline
>>> s
'00000001'
>>> n = 1
>>> s = f"{n:08}" # int variable
>>> s
'00000001'
>>> c = "1"
>>> s = f"{c:0>8}" # str variable
>>> s
'00000001'
クイックタイミング比較:
setup = '''
from random import randint
def test_1():
num = randint(0,1000000)
return str(num).zfill(7)
def test_2():
num = randint(0,1000000)
return format(num, '07')
def test_3():
num = randint(0,1000000)
return '{0:07d}'.format(num)
def test_4():
num = randint(0,1000000)
return format(num, '07d')
def test_5():
num = randint(0,1000000)
return '{:07d}'.format(num)
def test_6():
num = randint(0,1000000)
return '{x:07d}'.format(x=num)
def test_7():
num = randint(0,1000000)
return str(num).rjust(7, '0')
'''
import timeit
print timeit.Timer("test_1()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_2()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_3()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_4()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_5()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_6()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_7()", setup=setup).repeat(3, 900000)
> [2.281613943830961, 2.2719342631547077, 2.261691106209631]
> [2.311480238815406, 2.318420542148333, 2.3552384305184493]
> [2.3824197456864304, 2.3457239951596485, 2.3353268829498646]
> [2.312442972404032, 2.318053102249902, 2.3054072168069872]
> [2.3482314132374853, 2.3403386400002475, 2.330108825844775]
> [2.424549090688892, 2.4346475296851438, 2.429691196530058]
> [2.3259756401716487, 2.333549212826732, 2.32049893822186]
私は異なる繰り返しの異なるテストをしました。違いはそれほど大きくありませんが、すべてのテストでzfill
ソリューションが最速でした。
もう1つの方法は、長さをチェックする条件付きのリスト内包表記を使用することです。以下はデモンストレーションです。
# input list of strings that we want to prepend zeros
In [71]: list_of_str = ["101010", "10101010", "11110", "0000"]
# prepend zeros to make each string to length 8, if length of string is less than 8
In [83]: ["0"*(8-len(s)) + s if len(s) < desired_len else s for s in list_of_str]
Out[83]: ['00101010', '10101010', '00011110', '00000000']