Miri高级研究员Sco亚博体育官网tt Garrabrant有一个重大的新结果,“有限的成员套装”,他将在中午太平洋时间在线谈话。(缩放链接。)对于结果上的上下文,请参阅Scott的新帖子“节约时间。“
在其他大消息中,Miri刚刚收到了它的两个最大的个人捐款!!Ethereum Inventor Vitalik Buterin向我们的研yabo体育官网下载ios究计划捐赠了〜430万美元的ETH,而匿名的长期支持者捐赠了MKR令牌,我们将令人震亚博体育官网惊地清算〜1560万美元。后者捐款受到限制,以便每年最多每年花费250万美元,直到2025年,如多年的补助金。
这两个捐助者都有大量的感谢这些令人难以置信的礼物来支持我们的工作!
其他Miri更新
- Mark Xu和Evan Hubinger使用“笛卡尔世界模型“将”后果代理“(将效用分配给环境状态,内部状态,观察和/或行动)”结构代理“(优化”(优化“),而不是该组可能的动作”)“),and “conditional agents” (which map e.g. environmental states to utility functions, rather than mapping them to utility).
- 在内部对准障碍的渐变,Abram Demski使三个“有争议的声明”:
- Eliezer Yudkowsky对关系之间的关系早期的AGI系统的可亚博体育苹果app官方下载对齐和能力。
新闻和链接
- John Pedworth宣布了一个项目测试自然抽象假设这归因于“人类使用的大多数高水平抽象概念”自然“,因此”广泛的架构将可靠地学习类似的高级概念“。
- 开放慈善的Joe Carlsmith问道:“正在寻求寻求的AI存在风险吗?“,卢克·穆赫豪斯师要求野外危险的例子(也在胜败)。
- 来自DeepMind的安全研究人员:亚博体育官网什么机制驱动代理行为?那语言代理的对齐, 和一种评估奖励功能的史诗方式。此外,Rohin Shah提供了他的关于进入该领域的建议。
- 欧文沉和彼得哈尔总结70篇最近的论文关于模型透明度,可解释性和解释性。
- Eli轮胎问:我们如何为最终紧张时间做准备?(我会添加一些警告:一些角色和情景意味着你会拥有的较少的对AGI前夕的影响,今天可能影响得多。对于某些人来说,现在可能现在的“最终紧缩时间”,并且后来的边际努力不足。此外,如果没有明确的警告拍摄或者,某些形式的“准备时间”将失败火警。)
- 保罗克里斯太亚诺推出了一个新的组织,即他的重点前进:对齐研究中心亚博体育官网。了解有关Christiano的研究方法的更多信息亚博体育官网我的研亚博体育官网究方法论在他最近的ama.。