新论文:“功能决策理论”

||论文

功能决策理论

Miri高级研究员Eli亚博体育官网ezer Yudkowsky和执行董事Nate Soares在决策理论上有一个新的介绍论文:“功能决策理论:一种新的工具理性理论”。

抽象的:

本文介绍并激励了一种新的决策理论功能决策理论(FDT),与因果决策理论和证据决策理论不同。

功能决定理论家认为,行动的规范原则是将一个人的决定视为回答问题的文件的输出,“这个非常职能的输出会产生最佳结果?”坚持这个原则提供了许多好处,包括在CDT和EDT的一系列传统决策理论和游戏理论问题中最大化财富的能力。使用一个简单和连贯的决策规则,功能决策理论家(例如)在Newcomb问题上比CDT实现更多的效用,比吸烟病变问题更多的效用,而且比在Parfikhiker问题中的更多效用。

在本文中,我们定义了FDT,探讨了它在许多不同决策问题中的规定,将其与CDT和EDT进行了比较,并给出了FDT作为一种规范决策理论的哲学论证。

我们之前关于FDT的介绍性论文,"在大马士革欺骗死亡,“专注于将FDT的性能与CDT和EDT的表现相当相当高的术语。Yudkowsky和Soares的新论文对FDT的力学和动机进行了更大的重点,使“功能决策理论”是最完全独立的理论介绍。1

内容:

1。概述。

2。Newcomb的问题和吸烟病变问题。在获得的效用方面,传统EDT在Newcomb 's问题上优于CDT,而在吸烟损伤问题上则不如CDT。因此,CDT和EDT都不符合预期效用理论,两者之间的争论一直处于僵局。然而,FDT提供了一个优雅的标准来匹配EDT在前一类困境中的性能,同时也匹配CDT在后一类困境中的性能。

3.虚拟语气的依赖。FDT可以被认为是CDT的修改,依赖于依赖于因果依赖性,而是在更广泛的阶级解除特殊情况下包含因果依赖关系的依赖关系。

4.帕菲特的《银河系漫游指南》。在帕菲特搭便车问题中,CDT和EDT的表现都不如FDT,可以更容易地看出FDT的新特性。Yudkowsky和Soares指出,与传统理论相比,支持FDT的理由有三个:一个来自预先承诺的论据,一个来自信息价值的论据,以及一个来自效用的论据。

5.形式化EDT, CDT和FDT。Yudkowsky和Soares定义了实现每种理论的算法,以精确地证明给定的决策理论规定了给定的行动。

6.比较三个决策算法的行为。Yudkowsky和飙升然后重新审视Newcomb的问题,吸烟病变问题,以及Parfit的搭便车的问题,手中的算法。

7.诊断EDT:作为反事实的条件句。EDT和CDT的核心问题是他们所考虑的假设场景是畸形的。EDT是通过对联合概率分布的条件作用来工作的,当相关性是虚假的时,这会导致问题。

8.诊断CDT:不可能的干预措施。与此同时,CDT通过考虑严格的因果关系,这在错误地治疗不可避免的相关性时会出现问题,尽管它们可以被破坏。

9:全球视角。FDT的反可能推理形式允许代理尊重比CDT更广泛的现实世界的依赖集,同时排除了EDT的虚假依赖。我们可以理解FDT反映了一个“全球视角”,在这个视角上,决策理论的代理人应该寻求拥有最理想的决策类型,而不是最理想的决定令牌。

10.结论。

我们用"功能决策理论”,因为FDT引用了这样一个观点,即决策理论的代理可以被认为是实现从目标和观察历史到行动的确定性功能。2我们可以清楚地看到这个功能纽科姆的问题,在哪里渡友代理商 - 让我们称之为菲奥娜,如纸纸 - 就是如下所示:

知道我要做的决定,它们在相同的输入条件下计算相同的决定函数,然后用这个函数的输出来决定要填多少个盒子。然后,假设我正在实现的决策函数输出“一个盒子”。同样的决策函数,在Omega中实现,也必须输出“一个盒子”。在这种情况下,将填满不透明的盒子,我将得到它的内容。(+ 1000000美元。的)

或假设我拿两个盒子。在这种情况下,我的决策功能输出“双箱”,欧米茄将留下不透明的盒子,我会得到两个框的内容。(+ 1,000美元。的)

第一场景具有更高的预期效用;因此,我的决定函数在此输出“一箱”。

与CDT代理将自身限制为纯粹的因果依赖关系不同,Fiona的决策能够考虑Omega的行动和她的推理过程本身之间的依赖关系。因此,菲奥娜往往会比CDT特工赚更多的钱。

同时,FDT避免了EDT遇到的标准陷阱,如吸烟损伤问题。吸烟损伤的问题有几个特点,例如代理商有可能诉诸于埃勒里鳗的“防痒”;但我们可以更清楚地说明EDT的局限性XOR勒索问题,痒痒防御对EDT没有帮助。

在XOR勒索问题中,一个代理人听到了一个谣言,说他们的房子被白蚁侵扰,修理费用为100万美元。第二天,代理收到一封来自可靠的预测者ω的信:

我知道你是否有白蚁,我已经发给你这封信IFF究竟是真的:(i)谣言是假的,你将在收到这封信后支付1,000美元;或(ii)谣言是真的,你不会在收到这封信时付钱给我。

在这种困境中,EDT代理支付了费用,理由是如果得知他们有白蚁,这将是一个坏消息——尽管事实上,他们的白蚁数量并不取决于他们是否支付费用,无论是因果还是其他原因。

相比之下,FDT代理菲奥娜的推理方式与她在纽科姆问题中的推理方式类似:

既然欧米茄的决定是基于我是否会付款的可靠预测,欧米茄和我必须都在计算相同的决策函数。然后,假设我的决策函数在输入“letter”时输出“don 't pay”。在我有白蚁的情况下,Omega会寄给我这封信,我不会付款(−1000000美元);如果我没有白蚁,欧米加就不会寄这封信(- $ 0.)。

另一方面,假设我的决策函数在输入“letter”时输出“pay”。然后,在有白蚁的情况下,Omega不会发送字母(−1000000美元),在我没有白蚁的情况下,欧米茄会寄信给我,我支付(−1000美元)。

我的决定函数决定了我是否有条件地支付和omega是否有条件地发送信件。但白蚁没有预测我,根本没有计算我的决策功能。因此,如果我的决策函数的输出是“支付”,那就不会改变白蚁的行为,并且根本不会让我受益;所以我不付钱。

与EDT代理商不同,FIONA正确考虑到,支付不会增加她在XOR Blackmail困境中的效用;与CDT代理商不同,FIONA考虑了一个拳击增加她在Newcomb问题中的效用。

因此,FDT提供了一个优雅的替代传统理论,同时为我们提供了一个更简单和更普遍的预期效用最大化的实践规则,并在原则上为理性决策提供了一个更令人满意的哲学解释。

对于FDT的其他讨论,我建议“决定是为了使坏的结果不一致“探索反向直观事实的对话,以便决定输出的行动,决策者代理必须能够考虑其确定性决策功能的假设方案,而实际上它输出了它输出的东西。3.

注册以获取新的Miri技术结果的更新

每次发布新技术文件时都会通知。


  1. “功能决策理论”最初起草了“在大马士革欺骗死亡“在我们收到哲学社区的各种反馈之前,并显着更长。“大马士革欺骗死亡”是由从早期草稿中切割的材料制成的;其他切割材料包括讨论基于证明的决策理论以及一些“大马士革之死”(Death in Damascus)的变种,因为对CDT实施了不必要的残忍,而被扔在了剪辑室的地板上。
  2. 为了在这种情况下涵盖混合策略,我们可以假设给代理的一个感觉输入是随机数。
  3. 许多agent必须考虑的假设在内部是不一致的:一个确定性函数对于一个给定的输入只有一个可能的输出,但是agent必须基于许多不同“可能”操作的预期效用来做出决策,以选择最佳操作。例如,在Newcomb的问题中,FDT和EDT agent必须评估two-box的预期效用,以便权衡他们的选择并最终做出决定,尽管这样的agent与two-box是不一致的;同样地,CDT必须评估CDT代理一盒的不可能假设的预期效用。

    虽然从理论上理解得很差,但这种障碍推理似乎在实践中完全可行。尽管虚假猜想典型地意味着所有命题,但数学家通常以一种有意义和非暴力的方式定期推理,其中猜想具有不同的真实值。然而,如何最好地代表正式环境中的逆向上学推理的问题仍未解决。