MIRI获得了迄今为止最大的一笔拨款- Open Philanthropy与加密货币交易平台BitMEX的联合创始人本·德洛(Ben Delo)合作,在两年内分享7703750美元!
我们还获得了伯克利存在风险倡议(Berkeley Existential Risk Initiative)(30万美元)和长期未来基金(Long-Term Future Fund)(10万美元)的慷慨资助。感谢所有参与的人!
其他的更新
- MIRI的Buck Shlegeris和CHAI的Rohin Shah讨论了Rohin 2018-2019年对技术AI对准研究的概述亚博体育官网在AI对齐播客上.
- 来自MIRI的Abram Demski:思考过滤的证据(非常!)硬和贝叶斯Evolving-to-Extinction.Evan Hubinger说:综合放大和辩论.
- 来自OpenAI的贝斯·巴恩斯、保罗·克里斯蒂安诺、欧阳龙和杰弗里·欧文:通过辩论取得的人工智能安全进展.
- 放大:电路介绍OpenAI的Olah, Cammarata, Schubert, Goh, Petrov和Carter认为,“特征是神经网络的基本单元。它们与(神经元激活空间中的)方向相对应。特征由权重连接,形成电路。类似的功能和电路会在不同的模型和任务中形成。”
- DeepMind的Agent57似乎达到了人工智能的一个标准AI impact 2016年调查,“在不使用游戏特定知识的情况下,雅达利所有游戏的表现都超过了专业游戏测试人员”,这比NeurIPS/ICML作者的预测要早。
- 来自DeepMind安全研究:亚博体育官网规范游戏:人工智能独创性的另一面.