有限因素套装

||yabo app

这是谈话引入有限因子集的编辑成绩单。对于大多数读者来说,它可能是学习因素集的最佳起点。

视频:

(轻编辑)幻灯片://www.hdjkn.com/files/factored-set-slides.pdf.


(第一部分,标题幻灯片)···有限因素套装




(第1部分,动机)··一些背景


斯科特:所以我想从一些背景开始。对于不熟悉我的工作的人:

  • 我的主要动机是降低存在的风险。
  • 我试图通过试图弄清楚如何做到这一点对齐先进的人工智能。
  • 我努力做到通过努力成为更少的困惑关于智能,优化,代理以及集群中的各种事物。
  • 我这里的主要策略是制定一种代理理论嵌入式在他们优化的环境中。我认为这样做有很多打开的艰难问题。
  • 这让我做了一堆奇怪的数学和哲学。这个谈话将成为一些奇怪的数学和哲学的一个例子。

对于那些人的人我对我的作品已经很熟悉了,我只想说,根据我个人的审美观,这次演讲的主题是关于逻辑归纳,这就是说我真的很兴奋。我真的很兴奋这位观众;我现在很高兴能够给这个谈话。

阅读更多 ”

5月2021年通讯

||新闻稿

节约时间

||yabo app

注意:这是一个有限因子集的前导码,我将在未来几周内发布的序列。这个星期天在中午太平洋时间,我将放大谈话(关联)推出有限因子集,这是一个框架,我在技术上发现作为逻辑归纳的技术上有趣。

更新5月25日:一个介绍有限因子分解集的视频和博客现在可用这里.)


在过去的几年里,我的大部分研究动机已经旨在节省时间保存的概念,例如,从决策理论问题创建亚博体育官网的所有奇怪的因果环。这篇文章希望解释为什么我非常关心时间,以及我认为需要修复的。

为什么时间吗?

我尽量简短地描述一下时间是因果关系.例如,在一个Pearlian Bayes网络中,您从较早的节点绘制到较晚的节点的边。在某种程度上,我们想要考虑因果关系,那么我们就需要理解时间。

重要的,时间是学习和承诺发生的基材.当代理商学习时,他们会随着时间的推移学习。时间的流逝就像一个仪式机会被摧毁,知识被创造.我认为很多学习模式都被微妙地混淆了,因为它们是基于令人混淆的时间概念。

时间对于思考代理也是至关重要的。我对代理最好的简短定义是代理就是时间旅行.代理是一种机制,通过它,未来能够影响过去。代理为其行为的未来结果建模,并在这些结果的基础上选择行动。在这个意义上,结果原因那个行动尽管在标准的物理意义上,动作来得更早。

问题:时间是循环

时间出现问题的主要是“掠夺”。

关于Newcomb问题的主要令人困惑的是,我们希望考虑我们在填充盒子之前“之前的决定,尽管它在物理上追求。这是暗示,也许我们希望除了物理时间之外,我们还希望了解其他“逻辑”时间。

然而,当我们尝试这样做时,我们遇到了两个问题:首先,我们不知道逻辑时间从何而来,或者如何学习它;其次,我们遇到了一些明显的时间循环。

我将留下第一个问题并专注于第二个问题。

最简单的方法看看我们遇到时间循环的原因是注意到它似乎是物理时间至少有一点点与逻辑时间纠缠在一起。

想象一下,有人在运行一个纽科姆问题的物理模拟,并跟踪所有原子的所有细节。从这个角度来看,似乎有一种有用的感觉,即在代理人决定是一盒还是两盒之前,先填满盒子。然而,与此同时,这些原子组成了一个代理,它不应该做出决定,就好像它无力改变任何事情一样。

也许这里的解决方案是,想象有许多不同类型的“前”和“后”,“原因”和“结果”,等等。例如,我们可以说,从代理优先的角度来看,X在Y之前,但从物理优先的角度来看,Y在X之前。

我认为这是对的,我们想要把时间看作是许多不同的系统(希望是可以预测地相互联系的)。亚博体育苹果app官方下载但我不认为这解决了整个问题。

考虑一对FairBot在开源囚徒困境中成功地执行了一次Löbian握手合作。我想说的是,每个agent的合作在某种意义上导致了其他agent的合作。我可以说,相对于每个主体而言,因果/时间顺序是不同的,但我认为在这个例子中,循环是结构的重要组成部分。(我甚至不确定我想要把时间的哪个方向与哪个代理联系起来。)

我们也旨在以其他原因在我们的时间/因果关系中放回循环。例如,当在持续时间持续存在的系统中建模反馈回路时,我们可能会绘制看起来很像贝叶斯网的结构,但不是亚博体育苹果app官方下载acclic(例如,pomdp)。我们可以将此视为另一个系统的投影,其中包含时间额外的时间,但它是一个有用的投影。亚博体育苹果app官方下载

解决方案:抽象

我主要希望通过抽象来恢复一个连贯的时间概念并解开这些时间循环。

在主体根据结果来选择行为的例子中,我认为存在一个抽象的结果模型它先于行为的选择,先于实际的物理结果。

在纽科姆的问题中,我想说的是,在盒子被填满之前,有一个行为的抽象模型。

在开源囚徒困境中,我想说的是,在代理人员的实际程序跟踪之前,有一个抽象的合作证明。

所有这些都指向同一个方向:我们需要让结构的粗糙抽象版本出现在不同的时间,而不是相同结构的更精细版本。也许当我们正确地允许不同层次的描述在因果链中具有不同的联系时,我们便能够解开所有的时间循环。

但如何?

不幸的是,我们对时间最好的理解是Pearlian因果关系,而Pearlian因果关系并不适合抽象。

珍珠有一堆变量的贝叶斯网,但是当其中一些变量是其他变量的粗摘要版本时,我们必须允许确定主义,因为我们的一些变量将是彼此的确定性功能;珍珠的最佳部分与决定言做得很好。

但问题远不止于此。如果我们在确定性函数的方向上画一个箭头,我们将画一个时间箭头,从这个结构的更精细的版本到这个结构的更粗糙的版本,这与我们所有例子的方向相反。

也许我们可以避免将此箭头从更精细的节点从更精细的节点绘制到较粗糙的节点,而是从较粗糙节点到精制节点的路径。但是,我们可以刚刚制作另一个粗糙节点的副本,这些节点在更精细的节点的下游确定,不添加新的自由度。然后停止我们从交换较粗糙节点的两个副本?

总的来说,在我看来,Pearl还没有准备好一些节点是其他节点的抽象版本,我认为需要修复,以便节省时间。


讨论:LessWrong

我们有史以来最大的捐款,以及Vitalik Buterin的主要加密支持

||新闻

我很激动到Miri宣布两项重大捐款!

首先,一位长期的支持者给了MIRI迄今为止最大的一笔捐款:在接下来的四年里每年增加250万美元,在2025年增加560万美元

这种匿名捐赠来自加密货币投资者以前捐赠yabo体育官网下载ios2017年ETH到Miri $ 1.01米。他们令人惊讶的新捐款以3001 MKR,治理代币的形式提供MakerDAO,Ethereum区块链上的Stablecoin项目。收到后,MIRI将捐赠的MKR换算为15yabo体育官网下载ios,592,829美元。通过这种捐款,匿名捐赠者成为我们最大的历史支持者。

这项捐款受到时间限制的约束,Miri可以在接下来的四个日历年,2021-2024中每次最多花费2.5米。剩下的5,592,829美元可在2025年获得。

第二,其他令人惊讶的消息,以太坊的发明者和联合创始人Vitalik Buterin昨天给了我们一个惊喜,价值1050 ETH$ 4,378,159

这是迄今为止对Miri的研究计划的第三大贡献,开放慈善事业之后亚博体育官网至2020年拨款770万美元和上面的匿名捐款。

Vitalik先前捐赠了超过100万美元的Miyabo体育官网下载iosri,包括我们2017年筹款司机的主要支持。

我们无法感谢这两个前所未有的个体礼物!两个捐助者都感谢你的衷心感谢。

4月2021年新闻通讯

||新闻稿

3月2021年3月通讯

||新闻稿

2021年2月通讯

||新闻稿

2021年1月通讯

||新闻稿