以下是机器智能研究所发布的论文清单的不完整列表,这些论文已经大幅编辑,因为他们首先将在线放入。亚博体育官网根据最初发布的年度列出了论文。
2019年
高级机器学习系统中学到的学习优化风险亚博体育苹果app官方下载
作者:Evan Hubinger,Chris Van Merwijk,Vladimir Mikulik,Joar Skalse和Scott Garrabrant。
看arxivv1(2019年6月5日)和v2之间的差异(2019年6月11日)。
嵌入式机构
作者:Abram Demski和Scott Garrabrant。
看arxiv对于V1(2019年2月25日),V2(25,2020)和V3(10月6日,2020年)之间的差异。
本文基于2018年幻灯片和博客帖子系列更详细有关更改的说明。
2017年
在大马士革欺骗死亡
作者:Benjamin A. Levinstein和Nate Soares。(v1的作者:Nate Soares和Benjamin A. Levinstein。)
- V1 - 2017年3月18日:在正式的认识论研讨会上提出(少数)2017年。
- V2 - 2019年11月25日:编辑为哲学杂志117:5。也提供在这一点j网站。
2016年
逻辑归纳
作者:斯科特Garrabrant,Tsvi Benson-Tilsen,安德鲁克克,Nate Soares和Jessica Taylor。
看arxiv对于V1(2016年9月12日),V2(2016年9月19日),V3(2016年10月2日)和V4(2017年12月13日)之间的差异。
逻辑诱导(删节)
(V1的标题:“逻辑归纳:删节版,早期草案。)
作者:斯科特Garrabrant,Tsvi Benson-Tilsen,安德鲁克克,Nate Soares和Jessica Taylor。
- V1 - 2016年8月6日:草案循环在线的。
- V2 - 2016年9月12日:Miri 2016-2技术报告。
- V3 - 2016年9月12日:编辑。
- V4 - 2016年9月19日:编辑。
- V5 - 11月30日,2020年:编辑。
安全中断的药剂
作者:Laurent Orsseau和Stuart Armstrong。
- V1 - 2016年6月1日:在第32次关于人工智能的不确定性会议上提出。也提供在UAI网站上。
- V2 - 2016年10月28日:非UAI副本编辑。
2015年
渐近逻辑不确定性和Benford测试
作者:Scott Garrabrant,Tsvi Benson-Tilsen,Siddharth Bhaskar,Abram Demski,Joanna Garrabrant,George Koleszarik和Evan Lloyd。(V1的作者:斯科特Garrabrant,Siddharth Bhaskar,Abram Demski,Joanna Garrabrant,George Koleszarik和Evan Lloyd。)
- V1 - 2015年10月12日:Miri技术报告2015-11;arxiv:1510.03370 [cs.lg]。也提供在Miri网站上。
- v2 - 2016年6月12日:编辑为AGI-16会议。
价值学习问题
作者:nate飙升。
- V1 - 2015年1月29日:Miri技术报告2015-4。
- V2 - 2016年3月5日:编辑,随后在IJCAI-16伦理中呈现人工智能研讨会。在2018年重印人工智能安全和安全。
正式地形成现实世界模型的两个问题
作者:nate飙升。
- V1 - 2015年1月22日:Miri 2015-3技术报告。
- v2 - 2016年6月17日:编辑。
2014年
用于将机器智能与人类利益对准的代理基础:技术研究议程亚博体育官网
(v1和v2的标题:“与人类兴趣的高度对齐:技术研究议程。”)亚博体育官网
作者:Nate Soares和Benya Fallenstein。(V1和V2的作者:Nate Soares和Benja Fallenstein。)
- V1 - 2014年12月23日:Miri 2014-8技术报告。
- v2 - 2015年6月25日:编辑为技术奇点:管理旅程(2017年5月发布)并提前放在网上。
- V3 - 2016年7月15日:编辑和重命名(以区分此议程)高级机器学习系统对齐亚博体育苹果app官方下载“ 议程)。改变加入了技术奇点版本。
2012年
我们如何预测AI或未能
作者:Stuart Armstrong和Kaj Sotala。
- V1 - 2012年11月5日:发表在超越AI:人为梦想。
- V2 - 2017年10月3日:原始调查结果基于一个数据集错误。在草案中加入了一个注释,以警告读者这一点。
2010年
永恒的决策理论
作者:Eliezer Yudkowsky。
- V1 - 2010年11月12日: 工作文件。
- v2 - 2018年5月4日:编辑。