AI对齐论坛导致β!
与发射同步,MIRI研究人员Scott Garrabrant和Abr亚博体育官网am Demski将发布一个新的序列,介绍我们在未来一周的研究,从这里开始:嵌入式代理.(短插图版在这里.)
其他的更新
- 论坛的新帖子:合作的神谕;当一厢情愿的想法奏效时;(a→b)→a;寻求新的影响措施;在逻辑时间中,所有游戏都是迭代游戏;EDT用条件预言解决了5和10
- 火箭对准问题Eliezer Yudkowsky考虑了一个没有微积分和天体力学知识的假想世界,以说明MIRI的研究以及我们认为的目前世界对AI对齐的理解水平。亚博体育官网(还在LessWrong.)
- 更多关于MIRI的AI安全攻角:论决策理论.
新闻和链接
- DeepMind的安全团队推出了自己的博客,并在上面发表了第一篇文章规范、健壮性和保证.
- 将迈克阿斯克尔探讨了道德的不确定性在FLI的人工智能安全播客上。
- 谷歌大脑宣布无限制对抗性例子挑战.
- 的80000小时工作公告栏有很多新的帖子,包括业务主管富士重工,首席运营官BERI,项目经理玩cs游戏的人。同时申请者:夏季实习机会在CHAI,和一个奖学金项目从FHI。