以下是机器智能研究所发布的论文清单的不完整列表,这些论文已经大幅编辑,因为他们首先将在线放入。亚博体育官网根据最初发布的年度列出了论文。


2019年

高级机器学习系统中学到的学习优化风险亚博体育苹果app官方下载

作者:Evan Hubinger,Chris Van Merwijk,Vladimir Mikulik,Joar Skalse和Scott Garrabrant。

arxivv1(2019年6月5日)和v2之间的差异(2019年6月11日)。

嵌入式机构

作者:Abram Demski和Scott Garrabrant。

arxiv对于V1(2019年2月25日),V2(25,2020)和V3(10月6日,2020年)之间的差异。

本文基于2018年幻灯片和博客帖子系列更详细有关更改的说明


2017年

在大马士革欺骗死亡

作者:Benjamin A. Levinstein和Nate Soares。(v1的作者:Nate Soares和Benjamin A. Levinstein。)


2016年

逻辑归纳

作者:斯科特Garrabrant,Tsvi Benson-Tilsen,安德鲁克克,Nate Soares和Jessica Taylor。

arxiv对于V1(2016年9月12日),V2(2016年9月19日),V3(2016年10月2日)和V4(2017年12月13日)之间的差异。

逻辑诱导(删节)

(V1的标题:“逻辑归纳:删节版,早期草案。)

作者:斯科特Garrabrant,Tsvi Benson-Tilsen,安德鲁克克,Nate Soares和Jessica Taylor。

安全中断的药剂

作者:Laurent Orsseau和Stuart Armstrong。


2015年

渐近逻辑不确定性和Benford测试

作者:Scott Garrabrant,Tsvi Benson-Tilsen,Siddharth Bhaskar,Abram Demski,Joanna Garrabrant,George Koleszarik和Evan Lloyd。(V1的作者:斯科特Garrabrant,Siddharth Bhaskar,Abram Demski,Joanna Garrabrant,George Koleszarik和Evan Lloyd。)

价值学习问题

作者:nate飙升。

正式地形成现实世界模型的两个问题

作者:nate飙升。


2014年

用于将机器智能与人类利益对准的代理基础:技术研究议程亚博体育官网

(v1和v2的标题:“与人类兴趣的高度对齐:技术研究议程。”)亚博体育官网

作者:Nate Soares和Benya Fallenstein。(V1和V2的作者:Nate Soares和Benja Fallenstein。)


2012年

我们如何预测AI或未能

作者:Stuart Armstrong和Kaj Sotala。

  • V1 - 2012年11月5日:发表在超越AI:人为梦想
  • V2 - 2017年10月3日:原始调查结果基于一个数据集错误。在草案中加入了一个注释,以警告读者这一点。


2010年

永恒的决策理论

作者:Eliezer Yudkowsky。