马丁·希尔伯特对世界信息容量的看法

||对话

马丁·希尔伯特肖像马丁·希尔伯特采用多学科方法来理解信息、沟通和知识在复杂社会系统发展中的作用。亚博体育苹果app官方下载他拥有经济学和社会科学博士学位和传播学博士学位,终身担任联合国秘书处经济事务干事,并在加州大学戴维斯分校任教。在加入UCD之前,他创建并协调了联合国拉丁美洲和加勒比区域委员会信息社会方案.他为20多个国家的总统、政府专家、议员、外交官、非政府组织和公司提供实际技术援助。他写了几本关于数字发展的书,并在《科学》、《心理学通报》、《世界发展》和《复杂性》等公认的学术期刊上发表。他的研究亚博体育官网成果曾在《科学美国人》、《华尔街日报》、《华盛顿邮报》、《经济学人》、美国国家公共电台(NPR)和英国广播公司(BBC)等知名媒体上发表。

路加福音Muehlhauser:你领导一个正在进行的项目亚博体育官网研究项目旨在“评估全球存储、交流和计算信息的技术能力”。你的研究结果已经发表在科学还有其他日记,我们大量利用了你的成果计算的世界分布.关于你计划通过这个项目发布的接下来几项研究,你能提前分享些什么?


马丁·希尔伯特当我们刚开始的时候,我们很惊讶在量化我们的信息和沟通能力方面所做的工作是如此之少。我们有关于一切的统计数据,知道有多少汽车和树木,也估计了鞋子销售和碳排放的社会和经济影响,但生活在一个信息时代,只有很少的先驱性研究做了多少信息1.我们认为,应该对这个问题进行更连贯的处理。所以我们设定了三个基本阶段:

首先,创建基本数据库:有多少?存储多少,交流多少,我们能计算多少?这是迄今为止最繁琐的部分,并导致了一个300页的方法附录,其中列出了我们联合创建的1100多个源和数据库这些数字.我们在这里发现了一些有趣的事情,比如自20世纪80年代以来,我们的计算能力比我们的信息和通信能力增长了2到3倍。这不仅对机器智能界来说是好消息,对整个人类来说也是好消息:虽然目前看起来我们被淹没在了一个信息超载,源于持续25 - 30%的年增长率信息存储和通信能力,我们应该能够利用计算能力(每年60 - 90%的速度增长),并最终控制所有这些信息。

第二,我们如何描述它?我们在这里发现了一些令人惊讶的事情。数字革命文献中一些最基本的假设以一种全新的方式出现。例如,人们通常认为,数字革命提高了全球通信的平等性。这一结论的问题在于,它是基于数字设备的数量和订阅量作为主要指标,因此,由于现在的手机数量比上世纪80年代(目前全球手机普及率为90%)更多,所以通常得出的结论是,男女平等程度肯定提高了。然而,现在并不是所有的手机都是一样的。所以,看看通信能力的分布,我们发现1986年的通信能力实际上比20世纪90年代和21世纪初分配得更加平均!20世纪80年代只有固定电话,但每个人都“同样少”。此后,无数的通信技术加剧了国家之间和国家内部的不平等。就我们的比特容量而言,我们只是在最近才重新建立1990年以前的平等水平。换句话说:虽然我们在绝对价值上都比以前好得多(“我们都拥有更多”),但在信息能力方面的相对信息不平等随着每一次新的创新而不断扩大(“我们不会自动变得更平等”)。数字鸿沟原来是一个移动的目标!我们还不知道国家之间和国家内部这种不断变化的信息和通信能力不平等的社会、经济和长期政治后果。

另一个关于数字革命文献的传统假设是,我们现在生活在一个多媒体时代,移动视频和音频的份额是前所未有的。看看世界上信息内容和传播能力的演变,我们实际上发现文本和静止图像所占的相对份额比数字时代之前更大!在1986年,通过全球信息渠道传输的(最优压缩)比特中,文本仅占0.3%,但在2007年增长到了近30%。在数字时代之前,文本主要出现在纸上,而电话渠道则充斥着音频(声音),许多家庭在VHS图书馆中囤积了大量的视频资料等。数字时代的一种现象,在网络和庞大的数据库中,字母数字文本的激增。数字时代被证明是一个“文本和图像时代”,这对从更容易分析的文本和图像数据中提取智能的大数据分析师来说是个好消息。

最后一个例子,我们可以解析出来全球信息和通信的爆炸有多少是由更多,又有多少是由更好的技术驱动的.我们发现,技术进步对全球比特容量的贡献比额外的技术基础设施高出两到六倍。虽然基础设施实际上似乎已经达到了一定的饱和水平(人均大约20个存储设备,人均2到3个电信订阅),但信息容量仍在迅速扩大。我们还发现,除了更好的硬件方面的进步,用于信息压缩的软件被证明是一个重要的、但经常被忽视的驱动因素,推动了全球以技术为媒介的信息和通信能力的增长。我们估计,仅仅是更好的压缩算法就能使我们的通信容量增加两倍:由于压缩,在21世纪初,我们通过同一个信道发送的信息是20世纪80年代的3倍。这强调了直接用比特和字节来衡量信息和通信能力的重要性。国家电信或科学主管部门(如FCC或NTIA)提供的传统统计数据只计算设备和用户。但这一指标不再能说明很多问题。

在这一相当描述性的工作之后,作为自然的第三步,我们目前正在努力加深我们对这一信息和通信洪流的社会、经济和政治影响的理解。第一个问题是:对什么有影响?根据定义,通用技术(如数字技术)影响人类行为的所有方面,这让我们可以自由选择影响的领域。共同的主题是,这种社会变化是由信息产生的,所以我们必须涉及[位度量]。有了它,我们可以用[美元/kbps]来衡量经济影响,或用[参与率/kbps]来衡量民主参与度。这些措施告诉我们,有些人比其他人更有效地利用了相同的沟通能力。反过来,我们也可以询问[kbps/US$],并试图理解为什么有些人在相同的经济资源下拥有更多的沟通能力。然后,我们可以微调[位度量],并分析通信容量如何与容量本身的附加属性相关(例如,移动或固定;个人或共享;私人或公共; always-on or sporadic, etc.), or to different content. It will enable us to take a more systematic approach to ideas like the information overflow: how much of which kind of content, from which kind of technology has which kind of impact on what? How does the supposed curve of “decreasing returns to information” look like empirically and in which task? More elaborate indexes and models can even integrate an arbitrary combination of these variables with communication capacity, just as economist have come up with a myriad of ways to evaluate the distribution of monetary currency with a society. In the statistical analysis of economics the unifying ingredient is naturally $, while in the statistical analysis of technologically mediated communication the unifying ingredient is naturally the bit. Obviously, bits only say “how much”, not “how good”. Once we understand the impact of “more” or “less” bits, we can then even go on and ask about “better” or “worse” bits (or more of less suitable kinds of bits). The “better” or “worse” will appear as an unexplained “residual” in our impact studies. In other words: instead of actively defining what is good and what is bad, we corner it by at least taking out the co-founder which stems from “more” or “less”. Our main argument is that “quantity” is the lower hanging fruit, and that it must precede any question about quality. Otherwise we will helplessly confuse more- with better- information, and the other way around. So any impact must be normalized on the amount = [impact / bit], and for this we need to start measuring bits and bytes. Which brings us back to the reason why we started all of this…


路加福音:到目前为止,在您的研究过程中,您发现与信息和信亚博体育官网息技术相关的哪些趋势在某一时期大致呈指数增长,以及您发现了哪些趋势指数周期?


马丁社会系统过于复杂,亚博体育苹果app官方下载无法识别纯粹的分布和动态,但在这些限制范围内,它们都是“大致”指数级的。在我们的样本中,在过去的几十年里,机器计算特定应用程序信息的人均能力大约每14个月就翻一番,而世界上通用计算机的人均能力每18个月就翻一番。全球人均电信容量每34个月翻一番,而世界人均存储容量大约需要40个月。人均广播信息大约每12.3年就翻一番,但仍呈指数增长。一方面,这源于纯粹的技术进步,比如摩尔定律。另一方面,这源于技术通过社交网络的传播。这种扩散机制遵循逻辑s形曲线,从指数增长开始,直到拐点,然后饱和转变为反向指数过程。所以实际上我们有两个指数过程(技术进步和社会扩散)。

在一个最近的研究我已经证明,这两个指数过程结合在一起,可以在技术设备的数量及其性能之间产生真实的幂律分布(所谓的幂律、无标度、Pareto或Zipf分布由两个指数分布组成)。我用超级计算机的分布说明了这一点:具有指数级大计算能力的超级计算机呈指数级少,而具有指数级低计算能力的超级计算机呈指数级多。两者的排列顺序令人毛骨悚然,例如,如果某种超级组织者向美国能源部订购一台性能为x的超级计算机,而洛斯阿拉莫斯实验室、IBM和几所大学订购一些性能恰好为x的超级计算机等。当然,不存在这样的超级组织者,但社会复杂性导致了这种稳定的秩序,这是由两个互补的指数过程发展而来的。认识到这种社会模式是有用的,因为它提供了对高度不确定的技术市场演变的预测洞察力。


路加福音:在未来的5年里亚博体育官网,你最希望看到哪个研究调查(在这一行),无论是由你自己还是别人进行的?


马丁一项非常有用的贡献将是不断报告我们的信息存量和信息能力的增长和性质。与我的合著者Priscila Lopez一起,我们创造了一个长达20年的时间序列,涵盖了60多个技术家庭,但这是两个人的努力,主要是出于好奇。我们没有考虑持续维持这一努力所需的资源。清单的详细程度和范围也应扩大。

例如,对于存储和通信,我们将可用的最优压缩级别上的信息量归一化。这让我们能够洞察信息的总量,而不仅仅是可用的硬件基础设施(相同的带宽可以存储/交流不同数量的信息,这取决于内容压缩的程度)。然而,在计算的情况下,我们只能使用MIPS,这是一个硬件度量。当然,在最近几十年里,计算算法也变得更加高效。同样的硬件当然可以比20年前更快地解决一些同样的问题。我们没有足够的资源来研究这个区别。不断努力记录我们信息容量的增长和性质,必将成为理解数字世界现实的重要基石,因此是不可或缺的。

除了这些经验主义的努力,我认为我们深化对社会组织和社会动力学目前正在被“算法化”的方式的理论理解是很重要的。社会程序、惯例、习惯、风俗以及法律一直是文明的中心基石。这些数据目前正在数字化,有些更严格,有些则不那么严格。大数据在这里很重要,基于agent的计算机模拟和各种决策支持系统也是如此。亚博体育苹果app官方下载这导致了社会构成的深刻变化。我们仍然缺乏对这一正在进行的社会创造性破坏进程的优势、机会和威胁的更深层次的了解。


路加福音例缺乏信息可能是这类研究的主要障碍。亚博体育官网有时,您想要收集的数据根本没有被任何人记录下来,或者可能它被记录了但从未公开发布。如果你能如愿以偿,关于信息和信息技术的数据记录和传播方式会发生什么变化?如果有足够的推动力,这些变化是否可以在政策级别、行业级别或其他级别执行?


马丁我认为这种缺乏记录和数据的观念是错误的。

信息和通信技术方面的数据确实可以改进,过去15年来,我在联合国秘书处的大部分工作都集中在将信息和通信技术问题纳入全球家庭和企业调查中。我们在这方面已经取得了相当大的进展,取得了重要的进展。2

然而,经过多年经常令人厌倦的国际政策对话(想象一下:你不是唯一一个游说将“再问一个问题”纳入全国家庭调查的人!),考虑到集体政策动态往往导致最低公分母(往往是过时的指标……),我得出的结论是,从零开始创建一个替代数据库并通过示例来引导可能更容易。这是我们事业的起点,最终包括了1100多个不同的数据库、业务记录和统计数据。当我第一次提出要对"世界存储、交流和计算信息的技术能力的时候,我们甚至会收到一些愤世嫉俗的评论,这些评论甚至来自于我们在该领域的朋友(和非常知名的)同事。人们的反应包括“乌托邦式的自大狂”等概念(这也导致了《科学》杂志上的致谢,其中写道,我们感谢“那些通过怀疑这项事业的可行性来激励我们的同事”,第65页)。然而,信息和通信技术的信息比我们想象的要多,同样的数字时代经常允许我们用代理来做出非常好的估计。大数据范式不容小觑。大数据范式鼓励我们拥抱混乱的非结构化数据,寻找高度相关的代理,并通过互补来源的冗余来弥补它。在大数据世界中,“不完整/非结构化/混乱”的资源的丰富往往胜过缺乏一个干净和集中的资源。这也解释了“数据化”本身的大数据革命!

话虽如此,如果我“能实现我的愿望”,当然,如果最终这两种工作都能达成一致,也就是说,如果全球统计机制也开始把“信息”视为值得持续衡量的东西,那就太好了。到目前为止,联合国和其他国家已经开始考虑这个问题(例如,见《联合国宪章》第5章衡量信息社会),但还没有完全接受这个想法。然而,我认为要实现这一目标,还需要很多努力,我们必须积极主动,并表明(a)这是可能的;(b)值得;(c)哪些数据是有用的,哪些是无用的试错法


路加福音:谢谢,马丁!


  1. 参见《希尔伯特特别篇》。如何衡量“多少信息”?社会科学的理论、方法和统计挑战。介绍。《国际传播杂志》6(2012),1042-1055。
  2. 衡量信息通信技术促进发展伙伴关系- - - - - -全球信息社会:统计观点