郑南宁:面对人工智能挑战,人才培养的下一步该如何走-资讯-知识分子

郑南宁:面对人工智能挑战,人才培养的下一步该如何走

2020/06/28
导读
在我们的星球上,生命诞生至今已有40 亿年,所有的生命是按照有机化学的规则改变或者进化,但是今天,由于人工智能出现,改变了这一规则。也就是说,我们今后有可能出现有机生命(就是我们人类)和人工智能共同构造的无机智慧型的生命形式并存,生命可以根据计算机智能设计,超越原先有机化合物的限制。这就给人类社会带来了巨大变革。

微信图片_20200619101824


人工智能是一门什么样的学科


在我们的星球上,生命诞生至今已有40 亿年,所有的生命是按照有机化学的规则改变或者进化,但是今天,由于人工智能出现,改变了这一规则。也就是说,我们今后有可能出现有机生命(就是我们人类)和人工智能共同构造的无机智慧型的生命形式并存,生命可以根据计算机智能设计,超越原先有机化合物的限制。这就给人类社会带来了巨大变革。


人工智能作为一门学科独立存在,到今天已经历经60 余年了。我们从学术发展基本规律来看,已经经历了三个阶段,我们现在正在走向第四个阶段。从这四个阶段来看,最开始是20 世纪 60 年代到 80 年代,人工智能的一些主要研究是如何构建面向应用领域的专家系统,让机器掌握人类的一些知识、规则,在一定程度上替代人类思维或者完成任务。


20 世纪 80 年代到 2000 年左右,由于神经网络的出现以及计算能力的提升,我们开始想到让机器帮助我们提取特征,或者说我们将特征、答案交给机器,让机器学习。进入2000 年以后,由于互联网的出现与普及,大数据的获取变得很容易,我们将原始数据和答案交给机器进行深度学习,在语音、图像等分类任务方面,机器的能力已经超过了人类。那么人工智能发展的下一个阶段是什么?我想应该是人类将目标交给机器,让机器去完成。


也就是说它不是简单的一种感知或数据的计算,我们给它一个模型,它只是按照模型做;而是我们把任务的目标交给机器,机器去完成,并让机器具有“学习的学习”能力,像人一样去思考和学习。这是我们人工智能研究领域追求的一个理想目标。


在60 余年人工智能发展过程中,学术上形成了各种技术流派。这里简单提一下较为主要的五个流派。符号主义不用多说,是形式化的,使用符号、规则和逻辑来表征知识和进行逻辑推理,其基本观点是认知即计算。之后又出现仿生学派(又称为连接主义),20 世纪 40 年代提出的单层感知模型,就是基于这样的思想技术, 这个流派的基本观点是认知就是网络。还有行为主义学派,主要基于“感知—行动”的行为智能模拟方法,或者说在行为中反馈,我们知道作为能够适应环境的系统而言,是需要有反馈的,反馈控制、遗传算法、蚁群算法、强化学习等属于这一类学派。还有贝叶斯方法,这也属于人工智能方法中的一大类,通过获取发生的可能性来进行概率推理,形成对不确定事件的描述。最后一类称之为类推学派,这类方法是采用SVM,支持向量机,根据约束条件来优化函数。以上五大流派能解决我们所有的问题吗?显然有其局限性。先看符号化人工智能的局限性,符号化人工智能首先要对问题本身抽象出一个数学精确意义上的模型,给出这个模型以后,我们还要给出一个确定的算法。显而易见,算法确定后,我们就没有办法去应对在我们建模的时候没有考虑到的问题,也没有办法去描述现实世界问题所固有的不完备性或测不准性。还有一点,图灵意义下的可计算问题都是可递归的,可递归意味着问题的描述是有序的。以上是我们称之为传统的人工智能或者说符号化人工智能时代的局限性,因为按照计算就是认知,它实际上把所有问题归结为一种形式化描述,或者我们换一种说法来讲,只要能够进行形式化描述,这个问题就可以得到解决。我们再来看深度神经网络的局限性,深度神经网络需要通过大量的标注数据来训练,过度依赖训练数据在一定程度上约束了网络的泛化能力。还有一点,当我们要构建一个拥有非常强大算力的深度神经网络,能够达到我们人类能力几乎不可能的分类,但是它缺乏人类认知的核心——推理——对事实的因果关联的表达能力,因此最近几年里,很多研究者致力于把符号规则引入深度神经网络,使其能够根据知识来建立对数据的因果关联。以上是从模型的意义上谈的,但是实际上从计算角度来看,我们还无法在这种架构下实现有效的注意力机制,进行高效的图像检索。现实世界中我们有很多问题需要基于一种事件的描述或者是通过事件的驱动来求解。因此,在处理的算法层面上我们希望有一种新的模型。例如,在计算过程中,如何把任务分成子任务或者在计算的过程当中使用一个注意力机制来表征数据或分配计算负载。注意力不仅仅是“看”,同时在导引计算的过程,它的路径就是通过引入注意力的机制来提高计算的效能。


在现实生活中,我们所面对的许多问题具有不确定性、脆弱性、开放性,比如无人驾驶,就是这样一种非常典型的任务。今天的人工智能是建立在形式化和演绎逻辑基础上的,而我们为所有对象建立模型显然是不可能的。这个不可能来源于我们不可能枚举出一个行为所有的先决条件,也就是说我们不可能对一个问题具体描述出所有的边界条件。另外,也不可能枚举出一个行为的所有隐性结果,或者说我们要进行预测时,不可能在一个没有办法完全建模的情况下,让系统给出正确的解。


因此,我们要研究或者发展一种受脑认知和神经科学启发的人工智能,这是非常有意义的研究方向,也是我们未来人工智能的发展方向。受脑认知和神经科学启发的人工智能,目标是实现具有泛化能力的人类认知信息加工机制。从2016年开始,中国工程院对新一代人工智能做了非常深入的战略研究和讨论,明确了人机混合智能是人工智能未来的发展方向。我们按照这样一个思路,在AI2.0 中把人机协同混合增强智能作为AI2.0 中非常重要的方向,而且它的重要性不仅仅是概念上的,它能够将多个学科交叉汇聚在一起,形成中国对人工智能未来发展作出重要贡献的一个方向。


未来人工智能的形态是什么


前面说得很清楚,无论机器的智能发展到什么程度,它总是需要人类来使用。人是智能机器的服务对象和最终“价值判断”的仲裁者,因此,人类对机器的干预是贯穿始终的。所以人机协同的这样一种混合智能必然会出现,它是人工智能或机器智能今后发展一种可行的、重要的成长模式。


2018 年年初在美国新奥尔良召开了美国人工智能协会(AAAI)会议,大会主席做了一个大会报告,题为“Challenge of human aware AIsystems”,这个报告指出面对拥有人类意识的人工智能系统发展,我们人类面临着什么样的挑战。他提出,长期以来很多学者一直在研究人工智能是替代人类劳动还是增强人类劳动,这个问题现在基本明确是在增强人类劳动,因此现在人工智能系统需要与人类更好地协同工作,要设计出具有人类意识的AI系统,要构建人在回路中“心智”状态模型。这一观点与我们在 2016 年提出的观点可以说是不谋而合。


人机协同发展这样一种新一代人工智能要回答两大基本问题:第一,什么是人类智力所独有的特征;第二,要做到像人类一样拥有智能,计算机需要什么能力。当然我们也经常讲,人类经常只用较少的数据,就能够在广泛问题上表现出智能的行为,其实我们的大脑在进化过程中已经经过了大数据的训练,只是这个训练时间比深度网络大得多,周期非常长。但是,通过计算可以把人类在某个领域长周期的训练在短短几个小时内完成,这就是机器的威力。机器具有可重复性,可以完成规范性的任务,同时因为现在的机器是以形式化语言来描述的,所以具有逻辑性;而人,具有想象和创造的能力,这是人类作为高级生物所独有的特征,正是由于想象和创造,使得大脑处于动态,想象与创造再加上动态就构造了一个非常复杂的系统。现在的问题是,我们应该用何种方式来描述大脑跟外界的交互。因为从计算的角度而言,首先我们要定义这个问题是可计算的,然后在可计算的基础上给出计算的复杂度,如果计算复杂度是机器难以承受的,那么这个问题实际上是得不到求解或者得不到应用的。因此我们探讨人机协同的混合系统,首先要看看模型怎么构造,然后在这个基础上,用什么样的物理形式来实现这个模型的计算。


谈到可计算,我们还需要弄清楚大脑的工作机理。大脑是一种具有涌现性的复杂自组织巨系统,它拥有约860亿个神经元,每个神经元有数千个突触,神经元之间通过突触连接,构成了自然界一个极为复杂的网络。大脑的工作依赖于突触之间信息的传递,神经递质担当了突触传递中的“信使”。


实际上人的学习发生在突触的间隙之中。我们知道有抑制性的神经递质也有兴奋性的,多巴胺是兴奋性的,而 γ- 氨基丁酸、去甲肾上腺素是抑制性的。我们现在把神经元看成一个物理计算过程,实际上人的大脑中突触之间的变化是一个极其复杂的电化学过程,因此在计算模型的构建上,我们不仅需要模型具有认知计算的机理,也需要模型满足神经生物学的保真度。现在的深度网络能够给出一个函数的优化拟合,大脑实际上不是通过统一的、没有分化的神经网络来实现单一的全局优化,而是通过各个独特且相互作用的子系统来实现认知。


从研究角度来看,从以上的讨论我们能够提出什么样的科学问题?其实进行大的研究项目,首先是要凝练科学问题。这里所讨论的科学问题我们可以这样看:第一,大脑是如何实现优化的?在计算的层面如何实现这样的优化?第二,脑网络监督训练信号从哪里来?它们体现不同任务的成本函数?另外,在不同神经功能连接区域中,存在什么样的有效连接来约束和优化与任务相关的成本函数,以有效寻找特定问题的解决方法。(大脑存在三种连接:结构连接、功能连接、有效连接。所谓“有效连接”,是指在执行任务中,在功能连接区神经元的连接是抑制还是兴奋的变化。)


前面我们谈到了神经生物学,从脑的神经网络结构来看,脑网络连接的变化表现为人的认知行为。人类理解或描述物理世界时,大脑总会形成一种对时间的“可视化”图像,能够抽象出概念,形成常识。常识往往是我们日常生活当中判断事物的一种出发点或者衡量标准。因此现在我们需要思考怎么能够在一个人工智能系统中引入常识,把符号规则引入一个神经计算之中。我们在日常生活当中大量使用常识,但我们现在还没有迈进怎么使机器具有常识这样一个门槛里面。近年来直觉推理的研究已经开始有一些算法出现了,包括AlphaGo实际上就是一种直觉推理。使用代价空间、决策树、认知地图、模型匹配迭代,我们就可以给出一种直觉推理的简单的机器实现。直觉推理从数学解析空间来看,是人能够在复杂问题的解空间当中寻找全局的最优解,我们称之为最好的“猜”。


前面谈到了直觉推理,下面简单说一下认知推理。认知推理可分为物理层面的认知推理和心理层面的认知推理。物理层面的认知推理可以使我们能够跨越时间与空间追踪事物的发展轨迹;心理层面的认知推理是学习方向受到心理状态的引导。认识推理对事物或者数据的因果关联分析,这是人工智能研究面临的一大挑战。因果模型既要满足认知任务中的物理因果关系产生的物理约束,又要满足以机器为“本我”,理解在当前认知任务下设计的因果关联。


直觉推理、认知推理乃至因果关联分析,这三者怎么构建一个可计算的智能机器?使机器像人一样对物理世界直观理解。实现物理层面的推理主要有三个基本要素,首先对物体或对象的特征进行识别,并形成记忆,然后给出物体之间相互关系与作用的直观理解,就是建立相关和因果关联。这两者完成以后,我们需要预测怎么能在一个不完整模型下,给出一个适合当前约束和先决条件的合理行为,这就要构造一个基于想象力的行为模型。这样一种计算框架可以应用于无人驾驶和自主停车等多种场景。


当前我们正在研究怎样把视觉深层神经网络模型和语义学的吸引子网络模型相结合,使得网络能够同时实现物理外观的识别和物体属性的语义理解。这个研究方向很有意义,包括自然语言理解,可以使视觉属性与更抽象的语义信息相互作用。前面已谈到,我们构造模型既要有生物的保真性,同时也要有认知的保真性。欧洲的蓝脑计划在生物保真性方面做得很好,但是缺乏在认知层面上的可解释性。我们需要把对认知计算的研究以及以数据驱动的生物计算模型结合起来,这是人工智能未来的新方法。


人工智能未来面临着诸多问题与挑战,这也是与我们后面课程的设计密切关联的。特别是让机器在没有人类教师的帮助下学习,让机器像人类一样感知和理解世界,使机器具有自我意识、情感以及反思自身处境的能力;还有今后服务机器人进入家庭并具有一定的情感,等等。我们要应对人工智能带来的深刻的社会问题。


人工智能给教育和学习带来什么样的变化


人工智能可以使教育成为一个可追溯、可视化和可计算的过程,这是混合智能的一个重要应用。教育要追求个性化,这是大势所趋。人工智能技术会渗透到高等教育的各个层面,根据学生的知识结构、智力、知识掌握程度,对学生进行个性化的教学和辅导,这不是学生也不是教育工作者可以阻挡的一个趋势。学生与在线学习系统的交互,是一个动态的建构过程,可以根据不同学习者的能力和反应给出不同的学习规划,也可以给出学习空间。学生是个性化、群体性、社会性和交互性的集合,


四个特性构成了教育情境的基本要素。人工智能能够将其变成一个可回溯的多层次行为建模,给出个人成长、知识掌握、教育资源优化配置的一些因果关联。人工智能不仅仅实现个性化教育,实际上对我们提高高等教育质量以及迎接新的社会变革到来,发挥着不可替代的作用。所以人工智能赋能教育不是简单地把学生数据收集起来,而是要改变当前的传统教育模式与人才培养体系,但现在大学里,一些教师上课依然是20多年前的模式,显然是和我们当前的追求目标不一致的。


人工智能人才培养如何应对国家重大战略需求


什么是国家重大战略需求?我们在面对这个问题的时候,应当思考怎么能够提升我国在人工智能领域的竞争力,怎么能够形成在未来的人工智能领域的竞争优势。就技术发展而言,人工智能可以走向很远,但是我们无法确定人工智能最终是否具有人类敏感性的天赋。人工智能可以完成人类赋予它几乎所有的任务,甚至超过人类,但灵魂和精神总是来自人类。人工智能只能是人类的伟大助手。


人工智能是一种“赢者通吃”的技术,这意味着获得优势的国家将会长期享有优势。目前我国在人工智能领域与国际最先进水平仍有相当大的差距,主要集中在芯片、工具和平台等方面。芯片、工具和平台的背后,需要新的模型、新的算法作为支撑,这显然对人才培养提出了新的挑战。中国是人口大国,人工智能13为我们带来了丰富的数据,这些数据只要用好就会形成我们的优势。2017年 7 月,我国发布了《新一代人工智能发展规划》,因此我们要在国家重大发展规划的引导下,根据本校的优势和特点建立人才培养的体系,并通过国内人工智能领域学者的通力合作,形成更大的共同研究和人才培养的平台。


大家知道,对于一个计算模型而言,当算力确定了,不断提升模型复杂度,或者说提升算法的密度,整体性能是提高不了的,这就是受算力所约束,所以从计算机角度而言需要研究怎么提供更强大的算力;但是从算法角度而言,我们怎么能够通过模型改造降低算法密度,依然达到约束条件下最优的结合点,这就是算法的威力。我们人工智能在许多场合要用新的模型、新的算法,来发挥智能的效果,这也是我们人工智能人才培养需要高度重视的领域。


人工智能人才培养的课程体系


早在 1986 年西安交通大学就设立了人工智能与机器人研究所,研究所是“视觉信息处理与应用国家工程实验室”的支撑单位,拥有“模式识别与智能系统”国家重点学科,每年在读硕士、博士研究生约 170 人,是西安交通大学培养高层次人才的重要基地,经过 33 年的发展,可以说西交大的人工智能研究和高端人才培养走在了全国前列。


2017 年开始,西交大制订了人工智能拔尖学生培养计划。在这个人才培养方案中我特别加了一句——培养一流的工程师,因为人工智能本身是一种技术和工程,当然我们的工程师不是作坊里的,我们要培养具有科学家素养的一流工程师。我们培养的宗旨就是为学生今后成为人工智能领域的一流工程师、科学家和企业家奠定知识和创新能力的基础。


2018 年秋季,我校的人工智能试验班开始正式招生。其中高考招生选拔20人,校内新生选拔 25 人,少年班选拔 10 人,共计招生 55 人。实验班采用动态进出的管理机制,保证人才培养质量。


在课程设置方面,我们经过一年的充分和深入研讨,设计了人工智能人才培养课程体系,涵盖八大课程群,分别是:人工智能核心课程群、计算机科学核心课程群、数学与统计课程群、认知与神经科学课程群、人工智能平台与工具课程群、人工智能伦理课程群、先进机器人学课程群、科学和工程课程群。每个课程群由一名教授担任群长,由群长组织课程群的任课教师研讨教学。我们把过去行之有效的教学组、教研室的作用充分发挥出来,邀请校内外相关学科优秀教师参与人工智能人才培养工作。


在人工智能核心课程群中,设置有“人工智能的现代方法 I”和“人工智能的现代方法II”两门大课,“人工智能的现代方法 I”课程包括问题表达与求解,“人工智能的现代方法II”课程包括机器学习、自然语言处理、计算机视觉等。认知与神经科学课程群,包括“认知心理学”和“神经科学基础”,“人类的记忆与学习”“语言与思维”以及“计算神经工程”等课程。先进机器人学课程群,包括“先进机器人控制”“认知机器人”“机器人规划与学习”“仿生机器人”等课程。人工智能伦理课程群,包括“人工智能、社会与人文”和“人工智能哲学基础与伦理”等课程。


前文谈到了平台和芯片的重要性。所以,在这些课程中,结合我校的特点,特别是人工智能与机器人研究所30多年来在这方面的研究,开设了人工智能平台与工具课程群,包括“群体智能与自主系统”“无人驾驶技术与系统实现”“游戏设计与开发”“计算机图形学”“虚拟现实与增强现实”等一批特色课程,部分课程还邀请企业参与设计与教学。因为人工智能很多新的算法需要在交互游戏中得到验证,人工智能很多方法也可以运用于游戏之中,所以我们在人工智能平台与工具课程群里设置了“游戏设计与开发”课程,是 2 学分选修课。


同时,我们积极拓展办学资源,加强与人工智能领域领军企业合作,深化产教融合、校企协同育人,并通过国际合作办学、国际一流学者讲学、组织高水平国际会议、资助学生国际交流学习等,建立高层次、立体化的高端国际合作培养体系,形成国际化培养氛围,培养具有国际化视野和国际竞争力的一流学生。


新一代人工智能的发展需要脑科学、神经科学、认知心理学、信息科学等相关学科的实验科学家和理论科学家的共同努力,寻找人工智能的突破点,同时必须要以严谨的态度进行科学研究,让人工智能学科走在正确、健康的发展道路上。作为教育工作者,我体会到教育是一种缓慢而优雅的过程。我们需要定下心,稳住神,坚持立德树人,才能提高教育的质量,走出一条各个高校都具有自己特色的人才培养之路。我们不能搞成千校一面,即便我前面讲到我们设置的这些课程,对其他高校而言或许是不合适的,因为每一所学校的学科发展都有自己的历史底蕴和教师专长,所以需要把历史底蕴、教师专长和科研特点整合起来,我们就能设置出非常好的适合因材施教的课程体系。另外,支持“好奇心驱动的研究”,支持“相信且追寻自身直觉的科学家”,是一个成功的创新生态系统的必备要素,也是回答“钱学森之问”的关键条件。我们有责任为社会作出我们自己的贡献!


注:本文转载自公众号人工智能人物。本文根据作者在首届全国高校人工智能人才与科技莫干山论坛上的报告录音整理。

参与讨论
0 条评论
评论
暂无评论内容
知识分子是由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,致力于关注科学、人文、思想。
订阅Newsletter

我们会定期将电子期刊发送到您的邮箱

GO