桑铎·维尔斯的自主特工

||对话

桑德尔维尔肖像教授桑德尔维尔在匈牙利出生并接受教育,是一名应用数学家。他于1983年完成随机系统动力学建模博士学位,并从事计算机控制系统的工业工作。亚博体育苹果app官方下载1987-1988年,他连续两次获得奖学金伦敦帝国理工学院而在Linacre牛津大学

从1989年到1999年,他是哈佛大学的讲师电子电气工程系伯明翰大学主要从事系统辨识、自适应亚博体育官网控制、嵌入式亚博体育苹果app官方下载电子控制系统等方面的研究。2000年,他加入了南安普顿大学从事主动振动控制系统、自适应和学习系统、卫星编队飞行和自主控制等领域的工作。亚博体育苹果app官方下载自2002年以来,他一直担任控制系统工程的主席和董事长亚博体育苹果app官方下载自适应和学习系统技术委员会亚博体育苹果app官方下载

在南安普顿,他建立了复杂自主系统工程中心亚博体育苹果app官方下载他现在是那里的客座教授。目前,他的主要研究兴趣是基于a亚博体育官网gent的控制系统亚博体育苹果app官方下载自主系统和机器人集团亚博体育苹果app官方下载在自动控制部门谢菲尔德大学自2013年以来。他发表了大约200篇论文,撰写了4本书,并与人合著了许多软件包。

路加福音Muehlhauser:在“由理性代理人进行的自主小行星探索(2013),你讨论了在自治或半自治操作是关键的上下文中使用的各种代理架构,特别是在外太空,在那里机器人和地球上的人类操作者之间有很长的通信延迟。在我们讨论理性的特别是代理架构,您能否从您的角度解释一下什么是“代理”架构,以及为什么它在许多情况下优于其他设计?


桑德尔维尔首先我想说的是,我不确定所有类型的代理架构都是“优越的”。然而,一些代理范式作为一种组织复杂软件系统的方式具有优势,该软件系统控制一个智能机器,如机器人。亚博体育苹果app官方下载我最喜欢一些代理架构的特性是当他们展示拟人化类型的操作,这样他们可以处理关于世界在时间和空间方面,过去和未来,表达可能性和必需品,行为规则,知识的其他代理的知识,包括人类,能够处理关于情况的意图和信念。如果这些结构是软件的一部分,而不是从其他类型的软件翻译过来的,那么就编程而言,事情就会变得更简单。我们也希望机器人与我们分享他们关于世界的知识,我们也与他们分享我们的知识。如果我们分享我们的推理方式,这是一个优势,如果以拟人化的方式编程,机器人可以更容易理解和控制。


路加福音:在这篇论文你写“创建一个新的自主机器人控制软件体系结构有显著的好处是一个困难的问题当周围有优秀的软件包…”什么样的软件架构对于自治机器人控制,以及他们是普遍适用的?


桑德尔所谓优秀的软件包,我指的是一些机器人操作系统基础,如亚博体育苹果app官方下载ROS对于Linux和CCR可以在Windows上构建机器人程序。它们都有大量的库可供我们编程机器人技能。对于自主行为的编程agent-oriented编程定义精确Yoav Shoham于1993年所著到目前为止,有一些书只是回顾了代理编程的许多方法。也有CLARAty喷气推进实验室是不断重新规划的,而不是以agent为导向的。总结,GofAI在过去的30年里已经转变成各种基于逻辑的、包容的、多层的和信念-愿望-意图的机器人编程方法,所以在机器人软件架构上有一个漫长而有趣的努力历史。


路加福音你认为自动驾驶机器人的未来会如何发展?


桑德尔:我希望不久不仅代理程序语言将可用,而且标准化代理将用于机器人的各种应用。然后,可以对它们进行进一步编程,或者在部署到应用程序之前进行简单的进一步培训。最终,这些代理能够为机器人的自主操作提供高水平的完整性、能力和安全性。下一步将是使这些具有物理能力的代理成为真正的社交代理,使它们以适当的方式行为,并在需要时进行合作。


路加福音我们如何为关键安全应用获得高保证的自主代理?


桑德尔到目前为止,决定论是数字计算的一个基本特征,尽管我们在机器人上进行的一些并行计算中存在随机现象。软件的确定性的优势在于我们的机器人也是确定性的。目前,我们尽一切努力使机器人总是以适当的方式作出反应,解决问题,并在经常复杂和令人不安的环境中是可预测的。它们越聪明,就能处理越复杂的环境。然而,更复杂的环境也意味着更难以正式验证和测试所有可能的确定性响应。因此,机器人需要在代理软件的复杂性和智能的“决定论”之间进行权衡,即机器人在任何时候都要做出适当的动作。虽然代理是确定性的,但它们使用的传感器可能不可靠,这使得它们的响应在某种程度上具有概率性。因此,我们面临的挑战是建立复杂环境的概念抽象,使我们的机器人代理能够做出可靠的决策。关于这在实践中是否总是可行的问题,目前尚无定论。


路加福音:自主能力的研亚博体育官网究进展是否会超过安全研究的进展?


桑德尔这是一个非常好的问题,我相信这很有可能发生。然而,高水平的能力将降低机器人不适当响应的概率,只要它伴随着一个正式的可验证的决策过程的代理。对于代理开发,我们能做的最多就是让它“完美”,这意味着它永远不应该故意做错误的动作,或者在硬件失败的情况下,它应该总是采取最有可能的积极的行动。这说起来容易做起来难,因为环境会对机器人的反应产生相互冲突的要求,在这种情况下,机器人需要表现得像一个道德行为人。道德行动者可以使用更广泛的情境模型,并在广泛的知识范围内应用原则。未来的道德行动者可能需要受过教育的成年人的知识。


卢克:谢谢,桑德尔!