Pythonでは、親関数内に子関数がある場合、親関数が呼び出されるたびに子関数が「初期化」(作成)されますか?関数を別の関数内にネストすることに関連するオーバーヘッドはありますか?
はい、毎回新しいオブジェクトが作成されます。あなたがそれをタイトなループにしない限り、それはおそらく問題ではありません。プロファイリングは、それが問題であるかどうかを教えてくれます。
In [80]: def foo():
....: def bar():
....: pass
....: return bar
....:
In [81]: id(foo())
Out[81]: 29654024
In [82]: id(foo())
Out[82]: 29651384
コードオブジェクトは事前にコンパイルされているため、一部にオーバーヘッドがありません。関数オブジェクトは呼び出しのたびに作成されます-関数名をコードオブジェクトにバインドし、デフォルト変数を記録します。
エグゼクティブサマリー:無料ではありません。
>>> from dis import dis
>>> def foo():
def bar():
pass
return bar
>>> dis(foo)
2 0 LOAD_CONST 1 (<code object bar at 0x1017e2b30, file "<pyshell#5>", line 2>)
3 MAKE_FUNCTION 0
6 STORE_FAST 0 (bar)
4 9 LOAD_FAST 0 (bar)
12 RETURN_VALUE
影響はありますが、ほとんどの場合、それは非常に小さいので心配する必要はありません。ほとんどの重要なアプリケーションには、おそらくこれよりも数桁大きい影響のパフォーマンスボトルネックがすでに存在しています。代わりに、コードの可読性と再利用性について心配します。
ここでは、ループを通して毎回関数を再定義するパフォーマンスを比較して、代わりに事前定義された関数を再利用するいくつかのコードを示します。
import gc
from datetime import datetime
class StopWatch:
def __init__(self, name):
self.name = name
def __enter__(self):
gc.collect()
self.start = datetime.now()
def __exit__(self, type, value, traceback):
elapsed = datetime.now()-self.start
print '** Test "%s" took %s **' % (self.name, elapsed)
def foo():
def bar():
pass
return bar
def bar2():
pass
def foo2():
return bar2
num_iterations = 1000000
with StopWatch('FunctionDefinedEachTime') as sw:
result_foo = [foo() for i in range(num_iterations)]
with StopWatch('FunctionDefinedOnce') as sw:
result_foo2 = [foo2() for i in range(num_iterations)]
OS X Lionを実行しているMacbook AirのPython 2.7でこれを実行すると、次のようになります。
** Test "FunctionDefinedEachTime" took 0:00:01.138531 **
** Test "FunctionDefinedOnce" took 0:00:00.270347 **
私もこれに興味があったので、これがどのくらいのオーバーヘッドを発生させるかを把握することにしました。 TL; DR、答えは多くありません。
Python 3.5.2 (default, Nov 23 2017, 16:37:01)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from timeit import timeit
>>> def subfunc():
... pass
...
>>> def no_inner():
... return subfunc()
...
>>> def with_inner():
... def s():
... pass
... return s()
...
>>> timeit('[no_inner() for _ in range(1000000)]', setup='from __main__ import no_inner', number=1)
0.22971350199986773
>>> timeit('[with_inner() for _ in range(1000000)]', setup='from __main__ import with_inner', number=1)
0.2847519510000893
私の本能はパーセント(with_innerは24%遅い)を調べることでしたが、実際には外部関数から内部関数の値を返すだけではないため、この数は誤解を招く可能性があります。実際に何でもします。
その間違いをした後、私はそれを他の一般的なものと比較して、これがいつ重要で重要でないかを確認することにしました。
>>> def no_inner():
... a = {}
... return subfunc()
...
>>> timeit('[no_inner() for _ in range(1000000)]', setup='from __main__ import no_inner', number=1)
0.3099582109998664
これを見ると、空の辞書( 速い方法 )を作成するよりも時間がかからないことがわかります。そのため、重要なことを行っている場合、これはおそらくまったく問題ではありません。
他の答えは素晴らしく、本当に質問によく答えます。 python forループの使用、関数の生成など)でほとんどの内部関数を回避できることを追加したいと思います。
次の例を検討してください。
def foo():
# I need to execute some function on two sets of arguments:
argSet1 = (arg1, arg2, arg3, arg4)
argSet2 = (arg1, arg2, arg3, arg4)
# A Function could be executed on each set of args
def bar(arg1, arg2, arg3, arg4):
return (arg1 + arg2 + arg3 + arg4)
total = bar(argSet1)
total += bar(argSet2)
# Or a loop could be used on the argument sets
total = 0
for arg1, arg2, arg3, arg4 in [argSet1, argSet2]:
total += arg1 + arg2 + arg3 + arg4
この例は少し間抜けですが、それでも私の要点を理解していただければ幸いです。多くの場合、内部関数は必要ありません。
はい。これにより、クロージャと関数ファクトリが有効になります。
クロージャーは、呼び出されたときに内部関数にその環境の状態を記憶させます。
def generate_power(number):
# Define the inner function ...
def nth_power(power):
return number ** power
return nth_power
例
>>> raise_two = generate_power(2)
>>> raise_three = generate_power(3)
>>> print(raise_two(3))
8
>>> print(raise_three(5))
243
"""