绿色人工智能的学术基础(人工智能学术生态的介观尺度图谱)
导语
近几十年来,人工智能的知识、工具和实践已经成为科学研究的支柱,而且在应用方面也迅速扩散到各个学科中。通过构建人工智能研究领域的关键词共现网络和作者合作网络,这篇文章重构了人工智能生产在整个科学生态系统中扩散的时间动力学,并描述了人工智能应用的学科介观尺度格局。作者最后发现,那些主要开发人工智能的学者和那些应用人工智能的学者之间很少有合作,只有一小群研究人员能够逐渐在这些社区之间建立桥梁。
关键词:人工智能,知识图谱,科学学,复杂网络
论文题目:A meso-scale cartography of the AI ecosystem
论文链接:https://arxiv.org/abs/2212.12263
从材料科学到新药研发,从量子物理到医学影像,人工智能越来越被认为是技术和科学创新的载体,可以从目前几乎所有科学和技术领域中的数据源提取信息,掌握隐藏模式和关系,并且不断扩散到其他学科领域,在这些学科中实现了向数据沉浸式科学的普遍范式转变。
这一现象背后的共同想法是,人工智能正在从其设计关键工具的“原生”学科(主要是计算机科学、数学和统计学)向各个知识领域的一系列应用扩散。那么,人工智能作为一个研究领域的学科结构是怎么样的?人工智能知识是如何动态地嵌入到传统科学领域的?
为了回答上述两个问题,这篇文章作者通过微软学术图谱(MAG),构建了人工智能研究领域的关键词共现网络和作者合作网络,分析了人工智能研究领域的介观尺度结构,并分析了人工智能嵌入到科学生态系统的动态过程。
1. 人工智能研究的核心-边缘结构作者构建了人工智能关键词网络的 K-Shell 结构(图1),并将其划分为三个层面:超级核心、核心和外围。其中超级核心包含一般的人工智能类别(“人工智能”、“机器学习”、“深度学习”、“神经网络”)和非常流行的方法类别(“随机森林”、“支持向量机”)。核心也包含一般的方法(如“聚类分析”、“粒子群优化”、“随机梯度下降”),但它们之间的联系较少,而且分层次地取决于超核心术语(即只通过超核心术语与语料库相连)。外围部分主要包含特定的算法和特定的方法,它们之间没有联系,只是与更核心的核心相连。
图1. 人工智能研究领域关键词网络的核心-边缘结构。
通过社区检测算法,作者确定了15个中尺度结构的存在,这些结构对应于网络在专业层面的划分(图2):专家系统、自然语言处理、降维、数据挖掘、分类器、神经网络、机器人学、遗传算法、语音识别、逻辑编程、人脸识别、图灵机、强化学习、计算机视觉和深度学习。
图2. 人工智能的专业性及其关系。
由于一般的科学创新可以被视为一个累积过程,其中新颖性来自现有构建模块的重组,人工智能的动态定义可以被视为其构建模块重组的结果,即通过人工智能基本术语的重组形成其专业。跨学科交流在科学创新中也发挥着核心作用,提出新的可能构建模块(如人工神经网络与认知科学的重组),从而开启科学发现的“相邻可能”。
2. 人工智能随时间的扩散为了衡量人工智能的扩散过程,作者使用了学科排名变得相当稳定排名雅卡德相似度指标,在图3中,可以观察到一些典型的学科轨迹,这些学科的排名从20世纪90年代至今发生了重要变化。
图3. 人工智能应用的学科时间性景观。
一些学科(首先是社会科学)经历了强烈的下降,确实与符号人工智能和专家系统等人工智能专业的下降密切相关。像物理学和生物学这样的学科在人工智能应用方面显示出周期性的增长(有一个恒定的趋势),而其他学科,如神经影像学和绿色及可持续发展技术,自其创建以来显示出排名的突然攀升。
图4. 人工智能领域的合作。
(A)作者的人工智能得分的分布。(B)各组作者之间的合作情况。(C)各组作者的惯性矩和学科间距离的箱形图。(D) 排名前10位的学科。
人工智能领域的作者的人工智能分数的分布显示出两个明显的峰值(图4A),一个是 0 左右(作者从未在人工智能期刊上发表过论文),另一个是 1 左右(作者只在人工智能期刊上发表过论文)。
这凸显了做人工智能研究的学者和用人工智能做研究的学者之间的明显分离。人工智能在其他学科的应用主要不是由具有不同背景的作者之间的直接合作推动的。只有一少部分群体的作者构成了人工智能的理论发展和学科应用之间的桥梁。
刘志航 | 作者
邓一雪 | 编辑
商务合作及投稿转载|swarma@swarma.org◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com