MIRIx的新现场指南

||新闻

我们刚刚释放了a现场指导MIRIx小组,以及其他想要参与其中的人AI对齐亚博体育官网研究。

MIRIx是一个mii帮助想要解决人工智能安全公开问题的外部团体支付基本费用的项目。你可以创建自己的小组,或者在网站上查找现有的聚会信息www.hdjkn.com/mirix

几个MIRIx小组最近都在加紧他们的活动,包括:

  • 加州大学欧文分校Daniel Hermann在加州欧文市成立了一个MIRIx小组。联系他如果你愿意的话。
  • 西雅图MIRIxSeattle是一个正在重新启动和增加其活动的小组织。联系普帕夏如果你感兴趣。
  • 温哥华安德鲁·麦克奈特埃文Gaensbauer我们正在寻找更多愿意参加MIRIxVancouver活动的人。

新的对齐领域指南旨在为MIRIx小组提供提示和背景模型,基于我们的经验,是什么倾向于使一个研究小组成功或失败。亚博体育官网

导游开始:


序言I:决策理论

你好!您可能会注意到您正在阅读一个文档。

这一事实带有一定的含义。比如,你为什么要读这个?你会完成它吗?你最终会做出什么样的决定?接下来你要做什么?

请注意,无论你最后做什么,很可能会有几十个甚至数百个与你非常相似的人,处于非常相似的位置,他们会遵循与你非常相似的推理,做出与你相匹配的选择。

鉴于此,我们建议你通过以下几个问题来做决定:“如果所有与我相似的代理人都遵循什么样的政策,会产生最好的结果?在我的特殊情况下,这种政策意味着什么?”这不是一个试图为所有与你非常相似的代理做出决定的问题(这可能会导致你出于内疚或压力而做出错误的选择),更像是“如果我”在我的引用类中,我将如何处理这个类的实例我的具体特征?”

如果这种想法能让你进一步阅读,那就太好了。如果它引导您建立MIRIx章节,那就更好了。与此同时,我们将继续这样做,仿佛阅读这份文件的人只有那些有理由认为它相当有用的人。

序言II:表面积

想象一下,您的任务是移动一个边长为一米的实心铁立方体。考虑到这样一个立方体的重量约为16000磅,一个普通人可以举起约100磅,一个naïve的估计告诉你,你可以通过150个愿意的朋友来解决这个问题。

当然,一平方米的立方体最多能容纳10个人。它不如果你有理论上的能力来移动立方体如果你不能以一种有效的方式来承受这种能力。这个问题受到它的限制表面积

MIRIx的章节是增加人们思考和研究AI对齐技术问题的表面积的最好方法之一。正如这将是一个坏主意法令”发生在10人目前是最接近金属立方体是唯一允许考虑如何思考这个问题”,我们不希望米里成为瓶颈或权威什么样的思维可以而且应该做的领域嵌入式代理以及其他相关领域的研究。亚博体育官网

希望你和其他像你一样的人能够真正帮助解决问题,而不仅仅是遵循指示或阅读已经写好的东西。本文档旨在支持那些对自己做真正的开创性研究感兴趣的人。亚博体育官网

(了解更多)