更新
- 本步伐总结道第二轮AI对准写作日帖子。
- zettelkasten方法:Miri研究亚博体育官网员Abram Demski描述了一个注释的系统,对他的研究生产力产生了巨大的积极影响。亚博体育苹果app官方下载
- Macaskill会写一个详细功能决策理论的批判;Abram Demski(1那2) 和马修坟墓评论中的回应。
新闻和链接
- 最近的AI对准帖子:Evan Hubinger要求“最小的电路欺骗性吗?“,保罗基督教博描述战略窃取假设,魏戴列出了他的解决了关于迭代蒸馏和扩增的混淆。另见rohin shah's比较AI对齐的递归方法。
- 同样在失败:a关于Lecun,Russell,Bengio,Zador等乐器融合的辩论。
- FHI的Ben Gen Gen Gen Garfinkel和Allan Dafoe认为国家之间的冲突往往展出“冒犯性的 - 防守缩放“。
- Openai版本A.后续报告在GPT-2上,注意到几个群体“已明确采用类似分阶段释放方法”到Openai。
- NVIDIA应用深度学习研究训练了一个似乎的模型亚博体育官网基本上复制了GPT-2,5.6倍的参数,稍微更好的wikitext困惑,略微更差的兰卡达准确性。本集团选举日期分享其培训和评估代码,但不是模型权重。
- Openai.微调GPT-2对于包含人体反馈的文本继续和总结任务,注意到“我们的动机是将安全技术移动到”与人类交谈的机器“的一般任务,我们认为是提取有关人类价值观信息的关键。”