史蒂夫·鲍尔默 (Steve Ballmer) 提出了一个游戏,他选择一个 1 到 100 之间的随机数字。他根据正确识别他选择的数字所需的猜测次数提供各种奖励。 玩家首先进行一次猜测,如果猜对,将获得 5 美元。 每次错误猜测后,玩家必须根据猜测的次数向史蒂夫支付逐渐减少的金额。 具体来说,直到第六次猜测,玩家每次猜测都会损失 4 美元,第七次猜测为 3 美元,第八次猜测为 2 美元,并且对于任何后续猜测都会损失 1 美元的初始赌注。 需要澄清的是,在最佳游戏过程中,潜在损失总额超过了游戏过程中的潜在收益。 史蒂夫声称,由于这些成本,游戏的预期价值为负,但他提出了一个有缺陷的论点。 通过采用二分搜索算法,玩家可以最大限度地减少损失。 二分搜索涉及将每一步的可能性范围减半,直到确定正确的选择。 使用递归二分搜索函数的 Python 脚本演示了游戏的预期价值约为 0.20 美元,而不是负数。 因此,尽管史蒂夫的说法与此相反,但游戏的预期价值仍然对玩家稍微有利。 史蒂夫似乎并不打算让六次尝试没有奖励,因为修改规则以包括连续六次尝试的 0 美元罚款会导致预期价值进一步降低。