地址:
近年来,人工智能的发展如火如荼,正在迅速改变着世界。人工智能也成为包括我国在内的世界主要国家的重大发展战略。尽管人工智能发展得很快,但距离真正的人类智能还非常遥远,因为当前人工智能的主要范式是监督学习(即需要大量的人工标注指导机器从数据中发现规律),而人类的主要学习方式是无监督的。2015年,图灵奖获得者Lecun、Bengio和Hiton在《自然》杂志上指出:“人和动物的学习很大程度上是无监督的,我们通过观察发现世界的结构,而不是对每个物体命名”。同监督学习相比,无监督学习存在巨大挑战,因此几十年来其进展十分缓慢。在国际上,无监督学习的研究是小众的,张宪超就是敢于挑战无监督学习难题的学者之一。
01
求知——乐于独立思考
敢于面对挑战
张宪超出生于辽宁西部的一个山村,是村里出来的第一个重点大学学生。1990年,他以优异的成绩考入国防科技大学系统工程与数学系应用数学专业,成为一名大学生的同时也成为一名军人。在这所大学里,他既要努力学习专业知识,又要接受艰苦的军事训练。他一直感谢自己的母校,认为国防科技大学不仅培养严格的科学素养,更培养坚强的意志品质。1994年,他考上本系的研究生,成为著名计算数学学者蒋增荣教授的关门弟子。1995年,在部队锻炼一年后的他回到母校攻读研究生。
1997年,导师拿给他一篇题为《算术傅里叶变换》的论文,让他作为毕业题目开展研究。傅里叶变换是信号分析的基础数学工具,著名的快速傅里叶变换算法开启了人类的信息时代。算术傅里叶变换是一位美国学者从二百年前的文献中挖掘出来的另一种傅里叶分析的计算形式,计算结构简单,乘法运算少,在设计超大规模集成电路方面具有优势。但是这给张宪超带来巨大挑战,因为他导师的主要研究方向是加密解密的数学基础——大整数分解的快速计算,他两年的专业课都是学习这个方向。现在导师给了他这个题目,首先此前没接触过,其次可参考的资料太少。接到任务后,他马上到校图书馆去查资料,复印了可怜巴巴的四五篇论文,开始了一头雾水的研究工作。
半年后,导师问他进展如何,他摇摇头说毫无头绪。面对一个全新的领域,导师心里也没底,说:“你论证一下这个方向是不可行的,也可以毕业“。但是性格坚毅的他非要做出点成绩来,于是他提出要出去查资料。那个年代科研经费很少,开明的导师还是支持他去了。在亚洲最大的上海图书馆,他查到了十几篇最新论文,如获至宝地复印了一大包,在回程的火车上就开始阅读起来。很快,他发现了算术傅里叶变换抽样插值计算精度问题,并提出了一个巧妙的解决办法。在接下来半年时间里,他又陆续研究了离散傅里叶变换、离散余弦变换和算术傅里叶变换之间的联系,使算法和实际信号处理问题接轨。硕士阶段他在国内顶级期刊《电子学报》上发表了3篇论文,在《电子与信息学报》上发表了1篇论文。
读研过程中,张宪超逐渐形成了自己的研究兴趣——计算机的基础性算法,并希望在这个方面继续深入研究。国防科技大学在计算机体系结构方面是国内顶尖的高校,但算法领域导师较少。于是在查资料的过程中,他顺路拜访了其他著名高校的算法名家,最后决定师从中国科技大学的陈国良教授攻读博士学位。陈国良教授是我国高性能计算的奠基人,于2003年成为中国科学院院士。
1998年,张宪超来到中国科技大学,成为导师陈国良教授当时承担的国家863项目组的一员,研究淮河流域的防洪防污调度问题,这个项目2001年获得国家科技进步二等奖。1999年,陈国良教授承担了国家首批973课题的任务,研究难解问题的高效算法。这是国家在基础研究方面的重大举措,陈国良教授非常重视,迅速组织由1名青年教师、5名博士生和一批硕士生组成的课题组,张宪超就是其中一员。陈国良教授既是科学家,也是教育家,2003年他当选中科院院士的同时,也入选了首届国家教学名师。他特别注重培养学生的独立探索精神,允许课题组自选题目。于是,一群“初生牛犊”的小伙子们选了旅行商问题、装箱问题、网络流问题等世界级难题。
张宪超选择的是网络最大流问题,这是美国兰德公司首先提出的。通过著名的最大流—最小割定理,最大流问题将线性规划和组合优化建立了联系,是很多现实应用问题的重要基础。但是最大流问题难度巨大,包括多位图灵奖获得者在内的很多国际著名算法大师都为之做过努力。此前通用网络上最好的结果是1988年图灵奖获得者塔扬和他的学生提出的,复杂度仍然很高,但10多年间再没有任何进步,显然在通用网络上继续研究难于登天。
但张宪超善于另辟蹊径,他认为现实的网络都有显著的特征,充分利用这些特征可以降低算法复杂度,提高效率。他首先考虑在交通、VLSI等领域常出现的平面图。在平面图上,如果仅考虑网络边的容量,最大流问题可以转化为最短路径问题,复杂度降低一个量级。如果进一步同时考虑边的容量和节点容量,则图的平面性会被破坏,无法转化为最短路径问题,这是一个持续了30年的难题。张宪超经过潜心研究,找到了保持图平面性的新的转化方法,解决了这个难题。
张宪超又在近似平面图、小容量网络等方面进行了一系列研究,博士阶段发表了10余篇论文,包括国内计算机三大学报(《计算机学报》、《软件学报》、《计算机研究与发展》)和国际期刊《Journal of Computer Science and Technology》,用不到三年的时间获得博士学位。他的高效率也鼓励了当时面对难题士气低迷的课题组,后来课题组其他同学都成绩斐然。
02
科研——拒绝跟从热点
坚持自成体系
2000年,很多国外信息技术公司开始进驻中国,10万的年薪远高于当时社会平均水平,也吸引了大批计算机博士的眼球。2001年,张宪超以接近当时博士平均3倍的年薪加入香港一家著名公司的上海机构,从事银行软件系统研发。2002年,他又受聘于一家在北京的美资公司担任经理,从事交换芯片研发。在软硬件都研究过的近三年的企业工作中,张宪超意识到企业研发和科学研究有着很大的不同,而他更喜欢科学研究。
2003年,张宪超加入大连理工大学,成为刚成立两年的软件学院第一个有博士学位的老师,专业教师里的第一个副教授,并任软件工程系主任(当时只有一个系)。在当时的情况下,他的首要任务是组织教师队伍,研究教学工作。他利用在企业工作的经验,主导建立了理论实践并重的软件工程专业培养体系,主持申请了网络工程专业并建立了培养体系,为软件学院的人才培养奠定了基础。2009年,他作为主要成员的软件学院教学成果获得辽宁省优秀教学成果一等奖。
在组织教学工作的同时,张宪超又迅速组建了软件学院的第一支科研团队(发展为现在的机器学习研究所),着手布局科研工作。当时的研究热点是无线网络、信息检索等,在这些领域更容易发表论文和获得引用。但张宪超在研究方面有自己的想法,他不追逐热点,更注重研究的体系化和问题的重要性。他从最大流问题延伸到图聚类问题,进而深入到一般性的数据聚类问题。
现在人工智能是最火热的领域,但2003年正处于最低谷。人工智能的核心是机器学习,机器学习包括监督学习和无监督学习。监督学习的主要任务是分类,无监督学习的主要任务是聚类。在低谷时期,全世界研究机器学习的学者都比较少,而无监督学习更是小众的。张宪超就是在这个时间开始对聚类问题进行研究的。
方以类聚,物以群分。聚类的目标是在没有任何外界信息的条件下,挖掘数据的潜在结构,是处理大数据的先决条件,也是人和动物认知世界的主要形式。聚类早期是统计学的重要课题,当前也是人工智能的重要任务。对低维空间中的高斯联合分布数据,经典的k-均值算法可以取得良好的效果。但是现实的数据不可能那么理想化,大数据时代的数据高维度、多模态、复杂分布,给聚类任务带来巨大挑战。
张宪超首先从图数据入手,第一个课题是用最大流最小割算法解决互联网的社区发现问题,他的方案很快得到国家自然科学基金的支持,这也是软件学院首个国家级项目。接下来,他又陆续开展了一系列研究。在高维数据聚类方面,他解决了高维数据中子空间和聚类的循环依赖难题;在针对复杂数据的谱聚类方面,他率先提出了自适应图构造问题并给出了灵活的方法;在不确定数据聚类方面,他证明经典算法存在缺陷并给出了正确的算法。
随着互联网、物联网等产生更多更复杂的大数据,多任务学习、多视角学习成为了新的挑战。在多任务聚类方面,他率先提出了不对应多任务聚类问题并给出相应算法,使理论和实际问题接轨。在多视角聚类方面,他率先提出了视角间完全不映射的多视角聚类问题,并采用少量约束信息加以解决。2017年,他基于自己的研究工作,结合国内外相关研究,在科学出版社出版了《数据聚类》一书。由于国内数据聚类方面的著作很少,本书的出版让很多相关学者和学生受益,得到了读者的广泛赞誉。
图片
2016年,阿尔法狗战胜了人类围棋世界冠军,掀起了深度学习的热潮。他开始指导部分学生开展深度学习方面的研究,重点仍然是解决无监督学习问题,提出了生成对抗网络的一个全新的框架。2019年,他梳理了国内外相关研究,在科学出版社出版了长达900多页的《深度学习》上、下两部著作。该书是科学出版社年度重点推荐书籍,获得了读者的高度评价。
图片
迄今他的这些研究工作已经获得8项国家自然科学基金的支持,发表论文160余篇,其中包括AAAI、IJCAI、CVPR、TKDE、TNNLS等顶级会议和期刊30余篇。2016年,他带领团队获得教育部自然科学二等奖,实现软件学院省部级奖零的突破。2017年,他的团队又获得了辽宁省自然科学二等奖。
张宪超非常重视国家重大需求,尤其是军人出身的他更注重国防需求。2012年,张宪超到学校科研院挂职副院长,负责重大国防科研项目的策划和组织工作;2018年起,他任学校国防院专职副院长。他本人也积极从事国防领域信息化和智能化相关研究,承担了总装12.5重点预研项目、军委科技委基础加强项目、创新特区项目和军事理论项目。同时,他受聘担任装备发展部某领域专家、军委科技委某重大工程专家,并应邀担任中国指挥控制学会智能可穿戴专委会副主任。
03
育人——尊重个体发展
鼓励原始创新
师出名门的张宪超非常有团队意识。2003年刚到大连理工大学软件学院的时候,博士毕业刚满三年的他就开始组建科研团队,定期组织科学研讨。他尊重每个团队成员的兴趣,鼓励他们根据自己的意愿发展。18年来,团队培养过青年教师近30人,有的发展出新的研究方向,有的继续从事机器学习研究。他们全部成为教授或副教授,承担了国家自然科学基金等大批国家级项目,为相关领域发展做出了出色的贡献。
张宪超在指导研究生方面更是继承了自己两位导师的风格。他一般只给博士生或硕士生指明一个方向,最多提出一个问题,让学生独立思考和探索。他很少追问学生的进度,但他特别善于激发学生的科研兴趣和志向,因此他的学生在导师不追进度的情况下反而特别努力,每个人都取得非常好的科研成果,三分之一的学生能够在本领域顶级会议上发表论文。和学生帮助导师做实验不同的是,他培养的学生个个具备独立科研能力,毕业后大部分很快成为百度、阿里、腾讯、字节跳动等大厂的业务骨干,或者在国内外著名机构从事科研工作。
科教融合是张宪超特别重视的。在担任软件工程系主任的10年时间里,他经常组织教师研究教学工作,鼓励教师注重培养学生实践能力和独立思考能力。在软件学院工作18年来,他一直主持“数据结构与算法”这门专业核心课程的教学工作。他注重启发式授课,在课堂上不断给学生出各种思考题。他十分注重教学内容和教学方式的设计,带领的教学团队承担了多项国家和校级教学改革项目,把“数据结构与算法”建设成为辽宁省一流课程。2012年,他针对软件工程专业特点,组织教学团队编写了《数据结构、算法与应用》教材,由科学出版社出版,入选高等教育十二五规划教材。2021年,他又组织出版了该教材的第二版,在原版基础上大幅增加了算法思想和大数据、人工智能等最新内容,帮助学生在打好基础的同时扩展视野、强化思考,增强解决问题的能力。
图片
在实现通用人工智能方面,人类还有太长的路要走。监督学习和无监督学习如何协同工作?如何实现具有举一反三能力的类人小样本学习?如何让机器理解并生成自然语言?如何让机器学习并使用数学定理、物理定律等学科知识?太多的难题摆在面前。张宪超认为,当前以深度学习为主的人工智能技术发展已经遇到瓶颈,应该更多地从生物智能尤其是人类智能方面获得借鉴。于是,一本本厚厚的神经科学、认知科学、心理学书籍摆在案头,他要从交叉学科中探索出一条全新的道路。
雄关漫道真如铁,而今迈步从头越。一个敢于挑战难题并乐此不疲的探索者,又开始了他在人工智能领域新的征程。
标签:院庆,研究,探索者,学习,人工智能,算法,聚类,张宪超 From: https://www.cnblogs.com/devilmaycry812839668/p/18212625