2024年1月2日,我校工程系邀请澳大利亚阿德莱德大学吴琦副教授和浙江大学计算机学院博士后景宸琛博士分别做了题为“Human-Computer Conversational Vision-and-Language Navigation”和“开放世界下的视觉理解”学术报告,是深北莫大学电子与计算机科学前沿系列讲座的首场报告,线下和线上60多位师生聆听了学术报告,武玉伟长聘副教授主持了这场报告会。
吴琦博士任职澳大利亚阿德莱德计算机系副教授、澳大利亚机器学习研究中心视觉和语言实验室主任,他是Image captioning、VQA以及Vision-language navigation研究方面的国际知名专家,在TPAMI、CVPR、ICCV、ECCV等著名会议和期刊发表论文100余篇,他还担任过 CVPR、ICCV 和NeurIPS的领域主席。吴琦教授首先给师生带来人机对话式视觉语言导航这一国际学界的热点和前沿话题,介绍了他的团队近期在该领域的最新研究成果,给出了该领域的关键核心和挑战以及未来发展趋势,特别是他们搭建的实验平台和视觉语言回话式无人机平台,引起了与会师生的浓厚兴趣。
景宸琛博士从当前国内外学界就人工智能领域的通用基础模型这一前沿热点问题开始,介绍了通用基础模型的百花齐放,以及为实现开放世界下的视觉理解带来的新机遇与挑战。视觉基础模型的强大的表征能力为实现通用感知奠定了基础,多模态基础模型则使得开集理解成为了可能。报告中,景博士也展示了他在该领域的许多工作进展,分享了他对开放世界下视觉理解的一些深刻的思考,得到了与会师生的广泛共鸣和讨论,受益匪浅。景宸琛博士分别于1997年和2022 年获得北京理工大学计算机科学与技术学士学位和博士学位,获北京理工大学优秀博士学位论文奖。目前在浙江大学 CAD & CG 全国重点实验室从事博士后研究工作,主要研究方向包括计算机视觉、多模态理解与推理以及开放世界的理解,在IEEE-TMM、PR、CVPR、ICCV、AAAI、MM等人工智能及计算机视觉领域国内外高水平会议期刊上发表论文十余篇。