用于将机智与人类兴趣的代理基础

技术研究议程亚博体育官网


机器情报研究所的使命是确保创建智慧比人机智力具有积极的影响。亚博体育官网虽然此类系统可能是多十年之后亚博体育苹果app官方下载,但早期开始调查是谨慎的:涉及安全性和可靠性工作所涉及的技术挑战显得强大,并且唯一的结果。

我们的技术议程讨论了六个研究领域,我们认为今天的基础研究可能会使未来更亚博体育官网容易开发与人类兴趣可靠地对齐的超级核状系统。亚博体育苹果app官方下载由于对这种系统的设计或实施细节知之甚少,但下面描述的研究侧重于AI对准研究的正规代理基础 - 即开发最有可能对工程有用的基本概念工具和理论是强大的亚博体育苹果app官方下载有益的亚博体育官网亚博体育苹果app官方下载未来的系统。

我们的议程概述纸张由六篇论文提供支持,依次激励每个主题。许多贸易公开问题均在整个讨论中,我们希望可以作为研究人员渴望在AI对齐工作的早期工作的指导下。亚博体育官网该数据包缩短了一个注释的参考书目,总结了每个地区最近的研究(截至2015年1月)。亚博体育官网


用于将机智与人类兴趣的代理基础
Nate Soares和Benja Fallenstein(2014年)


正式化现实世界模型的两个问题
Nate Soares(2015)
走向理想化决策理论
Nate Soares和Benja Fallenstein(2015年)
逻辑不确定性下推理问题
Nate Soares和Benja Fallenstein(2015年)
Vingean反思:自我修改代理商可靠推理
Benja Fallenstein和Nate Soares(2015年)
易燃
Nate Soares,Benja Fallenstein,Eliezer Yudkowsky和Stuart Armstrong(2015年)
价值学习问题
Nate Soares(2015)

与人类兴趣对齐过度智力:
一个注释的书目

Nate Soares(2015)