我很高兴地宣布Nate Soares和Ben Levinstein的大马士革死里逃生已被接受出版哲学杂志(之前投票second-highest-quality在哲学杂志)。
在其他新闻中,MIRI研究员Buck S亚博体育官网hlegeris已经就MIRI相关的各种话题写了超过12000字的文章在EA论坛AMA.(示例主题:给软件工程师的建议;结盟计划是什么样的;和决策理论.)
其他的更新
- 亚伯兰Demski的自动预测的寓言是一本很好的读物:它所涵盖的预测器/优化器问题很深入,但我希望有相当广泛的读者喜欢它,并从中得到一些东西。
- 埃文Hubinger的梯度黑客描述以前没有连接的重要故障模式。
- 凡妮莎Kosoy的LessWrong shortform最近讨论了一些与她的学习理论议程有关的特别有趣的话题。
- 斯图亚特·阿姆斯特朗的我只知道古德哈特构成了期望值最大化者意识到的良好概念进展古德哈特定律并试图避免它。
- 雷迪,德拉甘和莱文的论文模拟人类的意图Cites(所有的)《哈利·波特与理性方法》作为灵感。
新闻和链接
- 人工智能研究需要负责任的出版规范亚博体育官网: Crootof提供了一个关于这个问题的很好的评论法战.
- Stuart Russell的新书已经出版了:人类相容性:人工智能与控制问题(摘录).Rohin国王的审查出色地将Russell的观点融入到更大的人工智能安全生态系统中,Rohin强调了以下引文:亚博体育苹果app官方下载
幸运的是,任务并不如下:假设一台拥有高度智能的机器,想办法控制它。如果那是我们的任务,我们就完蛋了。一个被视为黑匣子的机器,一个既成事实,可能是来自外太空的。我们从外太空控制超级智能实体的几率几乎为零。类似的论点也适用于创造AI系统的方法,即保证我们无法理解它们是如何工作的;亚博体育苹果app官方下载这些方法包括全脑模拟——创建人脑的加速电子副本——以及基于程序模拟进化的方法。关于这些提议,我就不多说了,因为它们显然是一个糟糕的主意。
- 雅各布斯坦哈特释放一个AI对齐研究综述亚博体育官网.
- 帕特里克LaVictoire的AlphaStar:让人印象深刻的是RL的进步,而不是AGI的进步提出了一些重要的问题,关于当今最先进的系统的能力如何。亚博体育苹果app官方下载