“最小惊讶”和可变默认参数

任何修改Python足够长的人都被以下问题咬伤(或撕成碎片):

def foo(a=[]):
    a.append(5)
    return a

Python新手会期望这个不带参数的函数总是返回一个只有一个元素的列表:。结果却大相径庭,而且非常令人惊讶(对于新手来说):[5]

>>> foo()
[5]
>>> foo()
[5, 5]
>>> foo()
[5, 5, 5]
>>> foo()
[5, 5, 5, 5]
>>> foo()

我的一位经理曾经第一次遇到这个功能,并称它为语言的“戏剧性设计缺陷”。我回答说,这种行为有一个潜在的解释,如果你不了解内部,它确实是非常令人费解和意想不到的。但是,我无法回答(对自己)以下问题:在函数定义而不是函数执行时绑定默认参数的原因是什么?我怀疑有经验的行为是否有实际用途(谁真正在C中使用了静态变量,而没有滋生错误?

编辑

Baczek举了一个有趣的例子。连同您的大部分评论,特别是Utaal的评论,我进一步阐述了:

>>> def a():
...     print("a executed")
...     return []
... 
>>>            
>>> def b(x=a()):
...     x.append(5)
...     print(x)
... 
a executed
>>> b()
[5]
>>> b()
[5, 5]

对我来说,设计决策似乎与参数范围的位置有关:在函数内部,还是与函数“一起”?

在函数内部执行绑定意味着在调用函数时有效地绑定到指定的默认值,而不是定义,这将带来一个深刻的缺陷:该行将是“混合的”,因为绑定(函数对象)的一部分将在定义时发生,部分(默认参数的分配)在函数调用时发生。xdef

实际行为更加一致:当执行该行时,该行的所有内容都会被评估,这意味着在函数定义时。


答案 1

实际上,这不是设计缺陷,也不是因为内部或性能。它仅仅来自这样一个事实,即Python中的函数是一类对象,而不仅仅是一段代码。

一旦你以这种方式思考它,那么它就完全有意义了:函数是根据其定义进行评估的对象;默认参数是一种“成员数据”,因此它们的状态可能会从一个调用更改为另一个调用 - 与任何其他对象完全相同。

无论如何,effbot(Fredrik Lundh)在Python中的默认参数值中对这种行为的原因有很好的解释。我发现它非常清晰,我真的建议阅读它,以便更好地了解函数对象的工作原理。


答案 2

假设您有以下代码

fruits = ("apples", "bananas", "loganberries")

def eat(food=fruits):
    ...

当我看到 eat 的声明时,最不令人惊讶的事情是认为,如果没有给出第一个参数,它将等于元组("apples", "bananas", "loganberries")

但是,假设稍后在代码中,我执行如下操作:

def some_random_function():
    global fruits
    fruits = ("blueberries", "mangos")

然后,如果在函数执行而不是函数声明时绑定了默认参数,我会惊讶地发现水果已经改变。我会感到惊讶(以一种非常糟糕的方式)。这将比发现上面的函数正在改变列表更令人惊讶的IMO。foo

真正的问题在于可变变量,所有语言在某种程度上都有这个问题。这里有一个问题:假设在Java中我有以下代码:

StringBuffer s = new StringBuffer("Hello World!");
Map<StringBuffer,Integer> counts = new HashMap<StringBuffer,Integer>();
counts.put(s, 5);
s.append("!!!!");
System.out.println( counts.get(s) );  // does this work?

现在,我的地图是在将密钥放入地图时使用密钥的值,还是通过引用存储密钥?无论哪种方式,有人都会感到惊讶;要么是试图使用与他们放入对象的值相同的值来获取对象的人,要么是似乎无法检索其对象的人,即使他们使用的键实际上是用于将其放入映射中的对象(这实际上是为什么Python不允许将其可变的内置数据类型用作字典键)。StringBufferMap

你的例子是Python新手会感到惊讶和咬人的一个很好的例子。但我认为,如果我们“修复”这个问题,那么这只会造成一种不同的情况,即他们被咬伤,而且这种情况会更不直观。此外,在处理可变变量时总是如此;你总是会遇到这样的情况,即有人会根据他们正在编写的代码直观地期望一种或相反的行为。

我个人喜欢Python目前的方法:在定义函数时会评估默认函数参数,并且该对象始终是默认值。我想他们可以使用空列表进行特殊情况,但这种特殊大小写会引起更多的惊讶,更不用说向后不兼容了。


推荐