高文院士:从“乡村教师”到人工智能掌舵者的40年科研路
「今天产业界都觉得人工智能大风来了,赶快前进不要掉队。但是如果你冷静下来想想,人工智能在研究方面还是有很多问题没有解决。比如,人工智能方法现在主要的不足,是机器学习的理论还很初级,很多好结果是靠大数据训练出来的,与人举一反三的学习能力和创造性思维相比还相差甚远。」
撰文 | 小德
成为一名工程师,是高文从小以来的梦想。在那个物质匮乏的年代,怀着对梦想的执着,高文从初中开始,便和周围的朋友一起玩无线电、摆弄收音机。凭借着这份单纯的执着,从哈尔滨工业大学计算机应用博士、东京大学电子学博士,到IEEE Fellow、全国政协委员,再到中国工程院院士,高文一路走了下来。
大学教育与计算机相关领域科研,是他几十年来的生活。荣誉等身,却依旧脚踏实地。这背后,是他几十年如一日的思考、实践,攀向高处同时面向未来的坚持。
30年漫漫科研路
上世纪70年代,在大连一座海岛上的小学,高文开启了他的教学生涯。彼时不足20岁的高文站在讲坛前,依旧有些青涩。
对于高文来说,教课只不过是“上山下乡”里要从事的工作之一,除此之外,他还兼职挑水、种庄稼、施肥。但是对于闭塞小岛上的学生们来说,这可能是唯一一种获取知识的途径了。
刚刚阔别高中不久的高文,深知一位优秀老师对于学生的重要意义。而高中老师对自己的循循善诱,不仅激发了高文对待知识的热情,还让他懂得了“一位好老师真正的样子”。这也是他多年教师之路上内心责任感的源泉。
慢慢地,高文逐渐融入了岛上村民的生活。他不仅担负起教书育人的责任,其它各项工作也开展得有声有色,到村里当广播员搞宣传,去大队当电工,为老乡修收音机和钟表。
短短几年,高文与村民结下了深厚情谊,以至于高文主动放弃了摆在自己前面回城打工名额。后来,高文还是回到了家乡大连,进入一家生产电冰箱的工厂里做学徒。这段经历,也成为了高文日后重要的人生转折点。
工厂里的师傅以生产晶体管为主,对计算机有大致的了解。在高文准备填报大学志愿的时候,师傅们纷纷建议他报考计算机专业。尽管计算机在当时还并不普及,但是人人都有一种“前途不可限量”的感觉。
听从了师傅们的建议,高文在23岁那年,成功考入了哈尔滨科技大学计算机专业。因为年龄在班里偏大,高文很难交到朋友,便一门心思将全部精力用在了学习上。这也使他以第一名的身份完成了79级的考试,并在跟学校申请后,以优异成绩完成了78级的考试。平日里刻苦好学的高文仅用了3年就完成了本科学习。
1985年,高文进入哈尔滨工业大学攻读硕士学位。在导师的推荐下,高文进入日本东京大学访问研修。当时东京大学的科研环境比国内要先进很多,之前许多只能在文献里看到的操作,现在也可以亲手操作。
尽管各项条件比国内领先不少,但高文却陷入沉思。“什么时候国内能达到这样的科研条件?什么时候中国的学术水平可以跟国外比肩?”在日本求学的高文生活得并不轻松,面对高昂的生活压力,他不得不一边学习一边打工。只不过,高文的业余工作是帮别人编程而不是刷碗。
良好的天赋和好学的性格使高文在班上成绩十分突出,也令他的日本导师念念不忘,甚至在高文学成回国后,他的日本导师专程造访哈工大,提出让高文回到日本再读一个医学博士的想法。如果同时拿到医学和工学两个博士学位,对于当时的中国来说,可以说是十分罕见。
后来,高文再次回到日本,准备走一条工学医学跨界的学术之路。只不过,在计算机专业顺风顺水的高文,面对活生生的动物,却有晕血的问题。高文不得不放弃了学医的想法,转而继续攻读电子工学博士学位,这也意外为他打开了人工智能研究的一扇门。
在读第二个博士学位的后期,高文进入日本一家有名的电信公司,从事人工智能研究。1991年,高文在哈工大的博士联合副导师李仲荣病重,在病榻前郑重地把哈工大一个新的做计算机应用的博士点托付给高文。
面对导师的请托,高文放弃了日本公司优厚的待遇,决定回国接手这一新成立的博士点。原因在于中国和国外先进水平的差距,让高文深感痛心。回国做好一个先进的计算机博士点,也算是为国家发展尽一份绵薄之力。
刚刚成立的博士点一无所有,高文不得不带领团队主动筹措科研经费。无论是发展模式还是发展前景,都令他有一种“摸着石头过河”的感觉。在他看来,探索与挫折都是理所应当,因为所有开创性的工作需要的都是:动脑子、下功夫。
他不说一句渲染成就的话,履历却透露光彩:不管是科研,还是教学,都在高文的“确立目标、坚持行动、自然而然”中一点点爬坡。他也欣慰于能在对的时间回来,参与进国家计算机行业高速发展与信息化浪潮之中,为建设科技强国培养人才、做好研究。
从无到有实现国际主流标准
高文研究的领域涉及人工智能、模式识别与多媒体计算、视频编码与分析、计算机视觉等等。主持了20多个国家级科研项目,发表顶级学术论文200篇,上过他课的本科生不计其数,他带过的博士也有百余人。
研究成果的达成,不仅来自高文的研究兴趣和努力,更来自国家发展的强烈需求,AVS就是一个典型。
AVS标准是《信息技术先进音视频编码》系列标准的简称,是我国具备自主知识产权的第二代信源编码系列标准,也是数字音视频产业的共性基础标准。通俗来讲,“AVS是希望能够把视频编码得比较小,进而降低传输、存储成本。”
高文近二十多年的工作大都围绕图像、视频处理领域展开,AVS只是其中的一部分。2002年6月,数字音视频编解码技术标准(AVS)工作组成立,高文担任组长。他的研究方向聚焦在两个点:一是对图像、视频的理解,二是图像压缩、编码。
AVS的产生主要源于国家的两个需求:一是国家希望有创新的东西,二是解除一些困境。我国一直强调自主创新,没有自己的创新产品,就只能做一些外围的东西。技术竞争中,专利的东西占据比较有利的产业位置。
AVS起步的时候,国际上,MPEG标准体系已经建立了十余年,并得到广泛应用。但高昂的专利收费严重阻碍我国相关产业的发展,国家对核心技术、自主知识产权的渴望越来越强烈。在这样的背景下,2002年的“DVD专利案”,也就是第二个需求中的“困境”,成为了推动AVS产生的导火索。
对此,高文带领数字视频编解码技术国家工程实验室风雨兼程,在完全没有舶来品,完全自主创新的坚持下,实现了目标。在发展过程中,AVS也遇到过一些困难,但高文带领团队一路坚持了下来。这样的成果,如果没有对做事的信仰,定然是坚持不下来的。也正是因为对创新的执着态度,AVS才等到了现在这开花结果的时刻。
作为中国拥有自主知识产权的标准,AVS对我国数字化音频、视频相关产业的发展无疑是个福音。AVS通过这样的开放共赢机制,可以吸引、联合许多单位共同参与,使得标准最终性能达到与国际标准相当的水平,成为国家必备标准。
AVS也是我国从“制造大国”向“创新性国家”转变的成功范例。在技术多元化与经济全球化的国际大背景下,AVS标准已经成为国际上三个主流标准之一,并获得了国内外所有主流音视频解码芯片厂商的支持。今后新出的数字电视机和机顶盒几乎都将内置AVS解码功能,AVS以独特的方式进入市场、进入家庭,进入我们的生活。
数字视网膜
在智慧城市建设中,城市大脑是不可缺少的一个决策支持系统。它的目的,就是把所有的传感器,不管是头像、视频或其他方方面面声音的,各种各样的数据全都汇总到城市的语音系统,最后由计算得出一个结果,去驱动对应的响应。
中国工程院院士高文在CCHI 2018作题为《类脑视觉计算》的报告
现阶段智慧城市建设的现状是“有眼、有脑”,但作为“眼睛”的摄像头功能过于单一使得“脑强眼弱”,其根源在于传统监控摄像机网络所采用的技术体系是为存储而不是分析设计的。尽管近期有些智能摄像头具有车牌或人脸识别功能,但是这种单纯强调“边缘计算”的方案仍然无法解决“眼脑合一”的问题。
高文认为,现在的系统必须进行进化和演进,必须向人学习,做人工的视觉系统。这样使得现在单一功能的摄像头尽快把它淘汰掉,换成多功能、多模式的摄像头,一个摄像头可以做编码,还可以做识别等等。
人类视觉系统经过千百万年的进化,使得我们的眼睛和大脑高效有机联动实现视觉认知。其中,眼睛负责感知光信号,完成视觉神经编码,然后经过视神经网络将编码传导给大脑视觉野,最终形成认知。
尽管我们对人类系统的完整模型与工作流程的科学发现尚未最终完成,但这并不会完全影响我们对其进行功能仿真。与人类视觉系统相比,现有人工视觉系统则是由摄像头负责采集光学信号,转换成数字信号后经压缩传递给计算机进行处理,包括特征提取与识别、分析等。人类视觉系统与人工视觉系统最大的差别在于效率,包括认知效率和系统认知单位能耗比。
为了提高人工视觉系统的认知效率,解决目前阻碍智慧城市系统功能快速演进的难题,在对人类视觉系统演进路径成因分析的基础上,高文提出了借鉴人类进化了数十万年的视觉系统之“人类视网膜同时具有影像编码与特征编码功能”这一特性,研究与设计数字视网膜(digital retina),使之具有统一时间戳和精确地理位置,能同时进行高效视频编码和紧凑特征表达的联合优化,并有效支持云端大规模监控视频分析与快速视觉搜索等功能。
具体来说,除了常规的视频编码以外还要做特征编码、组块编码、时空编码。数字视网膜基于现有系统,摄像头不需要换,只需要更换摄像头后面的芯片,在芯片上做集成,最后就能达到这个功能。
整个数字视网膜实际上包含了三种核心技术:基于背景模型的场景视频编码、视频特征的紧凑表达、视频编码与特征编码的联合优化。
与传统监控视频技术体系相比,数字视网膜具有高性能、高效率、可伸缩、隐私保护、可软件定义等几大特点。
我国已明确提出“到2020年,基本实现全域覆盖、全网共享、全时可用、全程可控的公共安全视频监控建设联网应用”,但是如果没有重大技术突破,数千万摄像头根本无法实现“全网共享”的实时数据汇聚,更不可能实现“全时可用”的联网分析识别,“数据大”变不成“大数据”,巨大潜在价值无法发掘。
数字视网膜是应对上述挑战的一种可行的颠覆性技术发展方向。因此,高文认为应加大在数字视网膜相关基础理论、方法与关键技术的研究,并布局与推进相关标准制定、芯片与硬件实现、支撑软件开发与软硬件开源社区,最终目标是构筑服务于智慧城市的“慧眼”,并与城市大脑一起来支撑城市的精细化运营和动态管理。
人工智能,未来已来
随着人工智能越来越成为民间热词,人工智能时代是否已经来临也成为一个颇为流行的问题,作为人工智能领域的行业专家,高文也总会在不同场合被问到这个话题。
在高文看来,“今天产业界都觉得人工智能大风来了,赶快前进不要掉队。但是如果你冷静下来想想,人工智能在研究方面还是有很多问题没有解决。比如,人工智能方法现在主要的不足,是机器学习的理论还很初级,很多好结果是靠大数据训练出来的,与人举一反三的学习能力和创造性思维相比还相差甚远。”
虽然有很多不确定性,但是高文仍看好人工智能的发展机遇。“人工智能总体来说,不管你是否接受,不管你是否看好,这件事就要发生了。我们现在要做的是,如果这件事发生了,我们怎么去应对它。”
而面对人工智能、面对高速发展的科技带来的不确定,高文觉得,一方面要知其所以然,另一方面也要开阔眼界,保持开放,望向未来,让技术服务于更宏大的人类福祉。做好眼前事,也更要着眼大目标。
参考资料
【1】《大气方能成大器——访中国工程院院士高文》,北京大学官网,2011-12-10
【2】《高文:行向高处》,《人民政协报》,2017年12月18日
【3】《高文:智慧城市的最新发展——数字视网膜》
文章头图及封面图片来源:iheima.com
本文经授权转载自德先生公众号