4月24日,应工程系首席科学家Alex Kot院士邀请,北京大学计算机学院施柏鑫教授莅临我校访问交流,并作题为《音频同步与全景表征的视频生成》的学术报告。本次报告会由陈昌盛教授主持。
施柏鑫教授深耕视觉感知与生成式智能领域,秉持问题导向、实践赋能的科研范式,立足产业实际痛点与技术发展前沿,深度融合计算成像、物理机理建模与新一代生成式 AI,构建多学科交叉融合的创新研究体系。报告系统展示团队前沿研究成果,围绕音视频协同生成、全景视频表征优化等核心内容展开详细阐述,通过结合物理光影、空间几何与时序约束条件,基于通用基座模型开展轻量化改造与增量式创新,采用分阶段训练、小参数微调等策略提升模型训练效率与生成质量。他指出,精准可控生成是视频 AIGC 的核心发展趋势,需兼顾音视频时序对齐、物理逻辑合理性与空间连续性,同时依托事件相机、计算成像、视觉感知等底层基础研究,实现感知技术与生成模型的双向赋能。
报告非常精彩、内容精深,兼具前沿视野与启发意义。互动交流环节氛围热烈浓厚,与会师生紧扣研究难点、技术瓶颈、学科发展等问题深入探讨。施柏鑫教授逐一细致答疑解惑,并结合自身科研阅历,就研究生科研素养培育、学术研究路径规划、博士学位论文凝练撰写等关键议题,分享独到见解与宝贵经验,为青年学子成长成才提供深刻指引。
报告结束后,工程系主任贾云得教授陪同施柏鑫教授参观工程系人面机器人实验室、具身智能实验室、人工智能安全实验室,深入了解平台建设、科研方向与人才培养现状,为后续常态化学术往来、跨域科研协作与优势资源互补奠定基础。

施柏鑫,北京大学长聘副教授、博导,计算机学院视频与视觉技术研究所副所长;北京智源学者,北大-智平方具身智能联合实验室主任。研究方向为计算摄像学与计算机视觉,发表论文270余篇(包括TPAMI论文37篇,计算机视觉三大顶级会议论文110余篇)。论文获评CVPR 2024最佳论文亚军、ICCP 2015最佳论文亚军等,获日本大川研究助成奖(2021)、中国电子学会青年科学家奖(2024)。担任TPAMI、IJCV等国际顶刊编委,及CVPR、ICCV、ECCV等顶会领域主席。科技部新一代人工智能国家科技重大专项首席科学家,国家级青年人才。