12月2020年12月通讯

2020年12月30日|罗伯格林格|新闻稿

MIRI首席运营官Malo Bourgon回顾了我们过去的一年，并讨论了我们未来的计划2020更新和策略．

我们最新的更新是我们在我们所描述的新研究中取得了较少的具体进展亚博体育官网2018年更新：我们的新研究方向亚博体育官网．因此，我们正在缩减在这些研究方向上的工作，并寻找新的攻角，以更好地解决对齐问题。亚博体育官网

其他Miri更新

来自Miri研究员Evan Hubinger亚博体育官网的一篇新论文：“构建安全先进人工智能的11个建议概述．"
去年的迟来的纸张公告：安德鲁克克里的“Löb定理的参数，资源有限泛化，以及开放源游戏理论的强大合作标准”,结果原本写道在MIRI工作期间，发表于象征逻辑杂志．
Miri的Abram Demski介绍了学习规范:一个研究议程亚博体育官网．另见亚伯兰的新写作，规范性．
埃文Hubinger澄清内部对准术语．
生存和繁荣的基金（SFF）有颁发Miri $ 563,000最新一轮赠款！对SFF的补助金推荐人和资助者的巨大感激之情。
一个反映领土的地图是一本新的印刷书集收集2018年的Top Lesswrong论文，包括Miri研究人员Eliezer Yudkowsky，Abram Demski和Scott Garrabrant的散文。亚博体育官网
Deepmind的rohin shah赋予他的概要斯科特盖拉德坦的笛卡尔框架框架。

新闻和链接

丹尼尔Filan发射AI X-Risk Rese亚博体育官网arch播客(AXRP)与集亚当闪耀那Rohin沙，和安德鲁克克里奇．
深媒体alphafold.表示蛋白质结构预测的非常大的进步。
Metaculus发射预测AI进步是一个开放的四个月锦标赛，以预测AI的进步，拥有50,000美元的奖池。
继续关于起飞的争论: Richard Ngo回应了Paul Christiano反对硬起飞的“改变选择压力”论点。
Openai的Beth Barnes讨论了模糊的争论问题通过辩论进行AI安全：

以前，我们希望辩论/IDA能够验证存在这种人类可以理解的论点的任何知识，即使这些论点非常大。我们希望辩论者能够有策略地遍历隐含的大论证树的一小部分，从而表明整个树都是可信的。

混淆的论点问题表明，我们可能无法依赖撤销者在大争论中找到缺陷，以便我们只能通过调用随机递减的缺陷时信任参数。因为参数足够小，如果存在一个，我们可以找到一个缺陷，或者因为参数足够强大，除非它有很多缺陷，否则除非它是正确的。
一些AI研究领域亚博体育官网及其与存在性安全的相关性：Andrew Critch比较分销的鲁棒性，代理基础，多代理RL，偏好学习和其他研究领域。亚博体育官网
Ben Hoskin发布了他的2020 AI对准文献综述和慈善比较．
开放慈善总结了它的AI治理授予迄今为止。

2020更新和策略

2020年12月21日|Bourgon不全|Miri战略那新闻

MIRI的2020年是试验和调整的一年。为应对2019冠状病毒病(COVID-19)大流行，今年3月，我们在很大程度上将业务转移到农村地区，并更加重视远程工作。我们借此机会尝试了新的工作模式和研究方法，并且对结果非常满意。亚博体育官网

与此同时，2020年在研究中看到有限的进展，Miri领导以前最兴奋了：新的亚博体育官网亚博体育官网研究方向我们在2017年开始。鉴于我们迄今为止的进展缓慢，我们正在考虑对我们的战略进行一些可能的变化，而Miri的研究领导力正在转向他们对寻求更有前途的道路的大部分重点。亚博体育官网

阅读更多 ”

11月2020年新闻通讯

2020年11月30日|罗伯格林格|新闻稿

10月2020年通讯

10月23日2020年|罗伯格林格|新闻稿

2020年9月通讯

2020年9月10日|罗伯格林格|新闻稿

Abram Demski和Scott Garrabrant已经制作一个主要的更新至 ”嵌入式代理“，具有新讨论ε-勘探，纽康普罗斯问题，反思性奥克斯，逻辑不确定性，古老的法律，以及预测罕见的灾难，以及其他主题。

亚伯拉姆还概述了在没有贝叶斯更新的情况下看起来有什么好的推理：激进的盖然论．一个重复的主题：

[i]一般（即，没有任何特殊的事先，保证受限制观察模型的收敛)，贝叶斯算法依赖于可实现性假设(也称为真粒假设)来实现收敛，就像它对其他一些很好的性质所做的那样。激进的概率论不需要这样的假设就需要这些性质。

[…C]收敛指向激进概率主义者“客观性”的概念。虽然一个激进的概率主义者所做的个人更新可能到处都是，但这些信念最终一定会安定下来。推理的目的就是要尽快找到那个答案。

同时，红贝叶岛主义是一个新的正式框架，用于思考最佳推理，而无需推理的真实环境在其假设空间中。艾伯拉姆评论：“Alex Appel和Vanessa Kosoy一直在”红外贝叶斯主义“，这是一个新的RL的方法，旨在使其更容易（即，可能）来证明安全的定理（以及也是一种新方法更一般地到贝叶斯主义）。

其他Miri更新

Abram Demski对逻辑电感和贝叶斯人之间的差异表示寓言：贝叶斯暴君．
基础上的选择与控制区别，亚伯兰对比“mesa-search”和“mesa-control”．

新闻和链接

来自Openai的Stiennon等：学习总结人体反馈．Miri研亚博体育官网究员Eliezer Yudkowsky评论：

一个非常罕见的研究，直接，直接与真实对亚博体育官网齐问题相关！他们培训了对人类偏好的奖励功能然后测量在结果变得更糟之前，你能对训练过的函数进行优化的难度。

[... y] ou可以要求培训数据中最佳的第99百分位数的结果（a la jessica taylor's量化主意）。询问训练有素的奖励功能率的东西比这更好，而且它开始从系统外部寻找“漏洞”亚博体育苹果app官方下载;训练有素的奖励功能与您的真实偏好不好的地方，而不是您真实偏好对高奖励的地方。
Chi Nguyen写道保罗Christiano迭代扩大研究议程介绍亚博体育官网这寻求成为第一个“易于理解的和[给出]完整的图片”的第一个这样的资源。帖子包括Christiano的内联评论。
预报员分享可视化他们的AI时间表LessWrong。

8月2020年8月通讯

2020年8月13日,|罗伯格林格|新闻稿

2020年7月简报

7月8日，2020年7月8日|罗伯格林格|新闻稿

2020年6月通讯

2020年6月8日|罗伯格林格|新闻稿

12月2020年12月通讯

2020更新和策略

11月2020年新闻通讯

10月2020年通讯

2020年9月通讯

8月2020年8月通讯

2020年7月简报

2020年6月通讯

搜索

浏览

订阅

其他Miri更新

新闻和链接

其他Miri更新

新闻和链接

其他Miri更新

新闻和链接

其他Miri更新

新闻和链接

Miri更新

新闻和链接

其他Miri更新

新闻和链接

其他的更新

搜索

浏览

订阅