12月2020年12月通讯
MIRI首席运营官Malo Bourgon回顾了我们过去的一年,并讨论了我们未来的计划2020更新和策略.
我们最新的更新是我们在我们所描述的新研究中取得了较少的具体进展亚博体育官网2018年更新:我们的新研究方向亚博体育官网.因此,我们正在缩减在这些研究方向上的工作,并寻找新的攻角,以更好地解决对齐问题。亚博体育官网
其他Miri更新
- 来自Miri研究员Evan Hubinger亚博体育官网的一篇新论文:“构建安全先进人工智能的11个建议概述."
- 去年的迟来的纸张公告:安德鲁克克里的“Löb定理的参数,资源有限泛化,以及开放源游戏理论的强大合作标准”,结果原本写道在MIRI工作期间,发表于象征逻辑杂志.
- Miri的Abram Demski介绍了学习规范:一个研究议程亚博体育官网.另见亚伯兰的新写作,规范性.
- 埃文Hubinger澄清内部对准术语.
- 生存和繁荣的基金(SFF)有颁发Miri $ 563,000最新一轮赠款!对SFF的补助金推荐人和资助者的巨大感激之情。
- 一个反映领土的地图是一本新的印刷书集收集2018年的Top Lesswrong论文,包括Miri研究人员Eliezer Yudkowsky,Abram Demski和Scott Garrabrant的散文。亚博体育官网
- Deepmind的rohin shah赋予他的概要斯科特盖拉德坦的笛卡尔框架框架。
新闻和链接
- 丹尼尔Filan发射AI X-Risk Rese亚博体育官网arch播客(AXRP)与集亚当闪耀那Rohin沙, 和安德鲁克克里奇.
- 深媒体alphafold.表示蛋白质结构预测的非常大的进步。
- Metaculus发射预测AI进步是一个开放的四个月锦标赛,以预测AI的进步,拥有50,000美元的奖池。
- 继续关于起飞的争论: Richard Ngo回应了Paul Christiano反对硬起飞的“改变选择压力”论点。
- Openai的Beth Barnes讨论了模糊的争论问题通过辩论进行AI安全:
以前,我们希望辩论/IDA能够验证存在这种人类可以理解的论点的任何知识,即使这些论点非常大。我们希望辩论者能够有策略地遍历隐含的大论证树的一小部分,从而表明整个树都是可信的。
混淆的论点问题表明,我们可能无法依赖撤销者在大争论中找到缺陷,以便我们只能通过调用随机递减的缺陷时信任参数。因为参数足够小,如果存在一个,我们可以找到一个缺陷,或者因为参数足够强大,除非它有很多缺陷,否则除非它是正确的。
- 一些AI研究领域亚博体育官网及其与存在性安全的相关性:Andrew Critch比较分销的鲁棒性,代理基础,多代理RL,偏好学习和其他研究领域。亚博体育官网
- Ben Hoskin发布了他的2020 AI对准文献综述和慈善比较.
- 开放慈善总结了它的AI治理授予迄今为止。