机器学习的三大疑难杂症,因果学习是突破口
发布时间:2022-07-29 09:06:56 所属栏目:大数据 来源:互联网
导读:重庆和许多西部城市一样,常常被诟病为互联网荒漠,但它却有着很好的物联网土壤。 有数据显示,重庆有着近2000家物联网相关企业,其中核心企业超过600家,且在物联网产业细分领域实力强劲、影响力大。 而除了企业之外,重庆还有一支特殊的物联网技术力量:由
重庆和许多西部城市一样,常常被诟病为“互联网荒漠”,但它却有着很好的物联网土壤。 有数据显示,重庆有着近2000家物联网相关企业,其中核心企业超过600家,且在物联网产业细分领域实力强劲、影响力大。 而除了企业之外,重庆还有一支特殊的物联网技术“力量”:由刘礼负责的重庆大学物联网体感大数据实验室。 刘礼,现为重庆大学大数据与软件学院教授,博士生导师。 而他在2018年成立这个实验室,是希望搭建因果学习与机器学习之间的桥梁。 这个方向也是目前包括Bengio、Pearl等大牛也在重点投入的领域。 从更具体的应用角度来看,刘礼相信,这个目标实现之后,AI和大数据分析技术能在医疗、教育、制造业等领域有更大的用武之地。 我们有幸和他进行了一次深入对话。 图片 一位典型学者的“三步走” 对于刘礼来说,一直有一个明确的方向指引着自己的职业成长,那就是将自己的所学与国家层面的重大实际问题相结合。 尤其是近几年国家曾多次针对大数据、人工智能、工业互联网等推出重磅举措,希望能够实现人、机、物的深度互联,实现全要素、全价值链的连接,进而推动新的工业生产制造和新的服务体系。 而重庆就是老牌工业城市,由此,刘礼回国牵头在重庆大学成立了物联网体感大数据实验室,旨在围绕国家重大的需求,展开大数据分析特别是因果学习的基础研究和应用。 图片 事实上,建立物联网体感大数据实验室之前,他已经和大数据打了数十年的交道。 本科和硕士阶段,刘礼师从兰州大学李廉教授。 李廉教授是国内计算机教育的领军人物,长期以来坚持推动以计算思维为核心的计算机人才理念和新模式,也因此在2020年获了CCF杰出教育奖。 受他的影响,刘礼本科后半段和硕士阶段参加了中国教育科研网格项目,网格可以视为云平台的前身,解决数据的存储和处理问题。 这段经历奠定了他的思维方式:以计算思维为主导,围绕数据的存储和处理来解决问题。 但他更真正树立起自己的科研梦想,是在异国他乡求学时。 2007年,刘礼在巴黎十一大读博期间,诺贝尔物理学奖花落巴黎十一大教授吉勒阿尔贝·费尔,当时全校沸腾,这个消息振奋了全校的师生,包括刘礼。 刘礼说到: 这让我对选择学术之路更加坚定了。 当时巴黎十一大名校已经走出了2个诺贝尔奖,4个菲尔兹奖。学校提倡以科学问题为导向的基础研究方式。 更重要的是,这些问题不一定是全来自应用方向,反而多是基础方向的。 与此同时,法国整体轻松自由的环境,让他能有更多时间去自主思考基础研究和技术应用之间的疏同。刘礼回忆道: 法国春天有各种假期,到了夏天不论职业贵贱所有人都会去度假,秋天开始罢工,到了冬天又开始准备圣诞了。 这种氛围下,在塞纳河畔边晒晒太阳,时间就这么过去了。有时我们中国学生晚上想去实验室多做一会儿,警察还要来问加班权益有没有得到保障,没有特殊的审批还不能加班。 这种氛围的熏陶下,我们也沉下心来思考自己应该如何做基础研究。 图片 在那之后,刘礼已经完成了计算思维的树立,基础研究的认可。但是他又在一个新的坐标上找到真正属于自己的一片天地。 告别浪漫悠然的巴黎,在热带国家新加坡,刘礼与新加坡国立大学计算机院长David S. Rosenblum院士共同开启了一项名为“舒适计算”(FelicitousComputing)的研究。 这个概念的要义是根据不同的场景去调整计算的能力。 此时,计算已经变得比刘礼刚刚接触大数据分析时要更丰富了。不但延伸至无处不在,还呈现出以人为中心的人、机、物三元融合的特点。 如何处理这些新的大融合大数据,成为了刘礼和他的同事们最关注的问题。 期间他和所在团队也做出了不少代表性的研究,例如From action to activity: sensor-based activity recognition这项研究中。 他们便创新性地将人的短时动作(action)数据和更广时空维度上的活动(activity)数据关联起来,弥合了人的动作和人的活动之间的差距,成功编码了动作之间的时间相关性,并捕获活动的内在属性。 也正是在这个阶段,刘礼真正确立了自己要深耕的研究方向,即围绕物理世界和人本身的数据进行采集和分析。 从计算思维的树立、基础研究的认可到确立具体方向,期间的多元化经历,也让他对大数据乃至数据科学有着更立体的视角和感受。 这也是为什么重庆大学的这个物联网体感大数据实验室,会有着如此具象的一个名字。 刘礼认为,从应用角度来理解大数据分析,可以把它看成一台车: 这台车里面必须有很多部件来支撑大数据分析,发动机就是CPU、GPU等算力平台;有了算力之后要跑起来,就要有油,就是数据;而车轮就像应用,即到底车往哪开,朝着什么目标前进。 实现这些应用、达到目标,就需要有方向盘,也就是用算法指挥所有的这些东西。 用他的话来说,这些年自己所做的工作既涉及发动机、油、车轮,也涉及方向盘,包括早期写了大量数据处理的底层框架。 但在这个新的实验室,自然不会全是自己经历过的、熟悉的研究,依然还有很多事情需要从0开始做,甚至还不乏和学生们一起自己动手DIY适配物联网研究的手套和手表。 对于整个团队来说,远方还有一个更大的目标,那就是建起因果学习与机器学习之间的桥梁。 机器学习的3大“疑难杂症”,因果学习是突破口 目前,机器学习和大数据已经发展到了你中有我、我中有你的交融阶段。 尤其以深度学习为代表的机器学习已经取得了很好的进展。与此同时,这类方法的“缺陷”也日益突出。 特别是这几个最主要的问题:可解释性、可泛化、稳健性。 (编辑:阜新站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |