2019年12月通讯

2019年12月5日,|Rob Bensinger|时事通讯

从现在到十二月底，美里的2019资金筹集活动是生活!查看我们的资金筹集帖子更新我们过去的一年和未来的计划。

我很高兴地宣布，我们最大的更新之一就是我们雇用了五个新的研究人员亚博体育官网，并将于2月加入我们。有关详细信息,请参见工作坊和扩大规模在筹款岗位上。

此外，Facebook的Giving Tuesday配对机会也是明天在第二天早上5:00 PT !看到投资银行部的文章有关如何让你的捐款配对的详情。

其他的更新

我们最近招的人。”学习优化带来的风险合著者埃文·哈宾格(Evan Hubinger)描述道他将在MIRI做什么．参见内特·苏亚雷斯的评论MIRI如何在违约情况下进行保密．
巴克Shlegeris讨论EA常驻是一个拓展的机会．
OpenAI版本安全的健身房，一组工具和环境，用于将安全约束纳入RL任务。
茶是寻求实习生；申请截止日期为12月15日。

研究团队的想法亚博体育官网

这个月，我尝试了一些新的东西:引用MIRI研究人员对最近人工智能安全报告的总结和想法。亚博体育官网

我省略了名字，这样这些名字可以被解读为人们印象的快照，而不是一个明确的“啊，研究员X相信Y!”亚博体育官网请记住，这些只是我最近交谈过的员工的一小部分想法，根本不像是共识。

再保险透明度会有助于发现欺骗吗?-“对一个重要话题的好的讨论。马修•巴奈特认为，透明度工具的任何弱点都可能使其成为有害的中间人，直接培训监管人员识破骗局可能更可取。”
再保险Chris Olah对AGI安全性的看法-“我非常同意Evan Hubinger的观点，即收集不同的视角——不同的‘帽子’——是一件有用的事情。克里斯·奥拉(Chris Olah)对透明度的看法很好。显微镜人工智能的概念似乎很有用，Olah关于ML领域如何有效转移的观点非常有趣。”
再保险定义AI有经验玩家-“斯图尔特·阿姆斯特朗试图从原则性上区分线头和古德哈特的其他部分。”
再保险有3年以上的领先有多普遍?-“对于人工智能进程模型来说，这似乎是一个非常有趣的问题。预期的提前时间和预期起飞速度的问题，在很大程度上影响了赢者通吃的动态是合理的。”
再保险实现Corrigible鲁棒对齐的想法-“Steve Byrnes提供了关于获取指针类型值的一些问题的一个不错的概述。”