新论文:“在大马士革逃避死亡”

||论文

在大马士革逃避死亡MIRI执行董事Nate Soares和Rutgers/UIUC决策理论家Ben Levinstein发表了一篇新论文介绍功能决策理论(FDT), MIRI提出的通用决策理论。

这篇题为《在大马士革逃避死亡,考虑了广泛的决策问题。在每一种情况下,苏亚雷斯和莱文斯坦都表明,在获得的效用方面,FDT优于所有早期的理论。抽象的写着:

证据决策理论和因果决策理论是理性行为理论的主要竞争者,但两者都面临着致命的反例。我们提出了一些新的反例,包括一个最优行为是由因果支配的反例。我们也提出了一个新的决策理论,功能决策理论(FDT),它同时解决了两组反例。

FDT agent不是考虑他们的哪种物理行为会产生最好的结果,而是考虑他们的决策函数的哪种输出会产生最好的结果。这个理论依赖于虚拟依赖的概念,即同一个数学函数的多个实现被认为(甚至是反事实的)具有相同的逻辑而非因果原因的结果。考虑到这些虚拟依赖关系,FDT代理可以在准确预测因子的存在等方面优于CDT和EDT代理。虽然在考虑经典决策理论问题时没有必要,但我们注意到,FDT的完整规范将需要逻辑反事实和算法相似性的非平凡理论。

“大马士革之死”是一个标准的决策理论困境。在这本书中,一个可信的预言者(死亡)承诺明天会找到你,让你死亡,无论你是留在大马士革还是逃到阿勒颇。逃到阿勒颇代价高昂,而且没有任何好处,因为死神预测了你未来的位置,然后只会在阿勒颇而不是大马士革来找你。

尽管如此,因果决策理论往往建议逃到阿勒颇——原因与它建议叛逃的理由大致相同两个囚徒困境个盒子,纽科姆的问题.CDT试剂认为死亡已经做出了它的预测,因此切换城市是不可能的导致死亡来了解你的新位置。尽管CDT代理承认死亡是不可避免的,但CDT代理的决策规则禁止在做出决策时考虑这一事实。因此,CDT代理将很高兴地在毫无意义的死亡之旅中放弃任意数量的效用。

因果决定理论在《大马士革之死》、《纽科姆的问题》、《孪生囚犯的困境》以及论文中描述的“随机硬币”、“奥林匹斯之死”、“小行星”和“谋杀损伤”等困境中都失败了因为它的反事实只追踪它的行为对世界的因果影响,而不是世界上其他的因果(和逻辑等)结构。

虽然证据决策理论在这些困境中是成功的,但它在一个新的决策问题上却失败了,即“异或讹诈”。1FDT一贯优于这两种理论,为所有已知决策问题提供了规范行为的优雅解释。


FDT的基本思想是agent的决策过程可以被认为是一个数学函数。该函数将决策问题中描述的世界状态作为输入,并输出一个动作。

在“大马士革之死”的问题中,FDT代理人认识到他们的行动是不可能的导致死亡的预言会改变然而,Death和FDT agent在某种意义上是在计算相同的函数:他们的行为是相关的,就像FDT agent在回答一个数学问题一样,Death可以通过计算相同的数学函数来预测FDT agent的答案。

这个简单的概念“什么变量取决于我的行为?”,避免了EDT所依赖的虚假依赖。将决策过程视为多重可实现的函数并不要求我们将相关性与因果关系混为一谈。与此同时,FDT跟踪CDT忽略的现实世界的依赖关系,使其能够在比CDT更多样化的决策问题集中有效地作出响应。

这个决策理论的主要皱纹是FDT的依赖概念需要一些“反逻辑”或“反可能”的推理。

FDT的规定是,agent将他们的决策过程视为一个确定性函数,考虑该函数可能具有的各种输出,并选择与最高期望效用结果相关的输出。然而,说一个确定性函数“可能”有不同的输出是什么意思呢?虽然人们可能不确定某个函数的输出,但在现实中,对于给定的输入,函数只有一个可能的输出。试图推理“世界将会是什么样子”,根据不同的假设,一个函数在某种输入下的输出,就像试图推理“世界将会是什么样子”,根据不同的假设,在集合{1,2,3}中哪个是最大的整数。

在普通的反事实推理中,人们只是想象一个不同的(内部一致的)世界,展示出不同的物理事实,但有着相同的逻辑法则。所需counterpossible推理的说“如果我呆在大马士革,死亡将在这里找到我”以及“如果我去阿勒颇,死亡会找到我”——尽管这些事件中只有一个在逻辑上是可能的,在一个完整规范的决策过程和环境——一个需要想象世界的地方不同的逻辑真理持有。数学家们大概是以某种启发式的方式来做这件事的,因为他们必须权衡支持或反对不同猜想的证据;但目前还不清楚如何以实际的方式将这种推理形式化。2

函数决策理论是它的继承者永恒的决策理论(第一次讨论2009年),这是MIRI高级研究员Eliezer Yudkow亚博体育官网sky提出的理论,该理论错误地将条件作用于观察结果。FDT是戴伟理论的推广updateless决策理论3.

我们将会在正式的认识论车间这是一个跨学科会议,展示认识论、科学哲学、决策理论、统计基础和其他领域的成果。4

更新4月7日Nate在随后的对话中详细阐述了功能性决策理论提出的解释性问题:决策是为了使坏的结果不一致

2019年11月25日更新:本文的修订版已通过审核哲学杂志.的JPhil版本是在这里,而2017年版本的少数在这里


注册以获得最新的MIRI技术结果

每发表一篇新的技术论文,就会得到通知。


  1. 正如苏亚雷斯的《大马士革之死》和莱文斯坦的论文帮助澄清了CDT的特定失败点一样,XOR讹诈比以往的决策问题更精确地剖析了EDT的失败点。特别是在吸烟损伤问题中,EDT不能像被修改为吸烟那样被修改为避免XOR讹诈。
  2. 逻辑归纳是为数学猜想分配合理概率的方法的一个例子;但是从这里还不清楚如何定义决策理论可以计算出不一致的预期效用场景.因此,逻辑不确定性下的推理问题不同于定义反逻辑推理的问题。
  3. “UDT”这个名字已经被用来挑选出许多不同的想法,包括“UDT 1.0(戴秉国的提议)UDT 1.1”,和各种proof-based决策理论的方法(这是有用的玩具模型,但不是任何人都提倡遵守的决策理论)。

    FDT抓住了这些观点之间的很多(但不是全部)共同点,并打算作为一个更一般的伞类,比UDT作出更少的哲学承诺,更容易解释和交流。亚博体育官网MIRI的研究人员确实倾向于持有更多的哲学承诺,这些承诺在推理上与决策理论主流(关注更新性和逻辑先验概率)进一步,UDT的某些变体可能是我们最好的具体理论,但没有一个特定的决策理论模型是完全令人满意的。

  4. 感谢Matthew Graves和Nate Soares帮助起草和编辑这篇文章。