校务公开

首页 > 校务公开 > 讲座预告 > 正文

讲座预告

SMBU

[讲座预告]融合知识表征学习的视觉语言导航研究

作者:工程系    发布时间:2024-09-23    阅读次数:

时间:9月23日下午15:00

地点:主楼536会议室

报告摘要:近年来,得益于计算机视觉技术和自然语言处理技术的蓬勃发展,使用视觉与语言等多模态数据进行综合推理成为了人工智能领域关注的焦点之一。在此基础上,结合了机器人动作预测的视觉语言导航任务被提出来,将问题拓展到了视觉-语言-动作的方向上来。该任务要求机器人理解自然语言形式的导航指令,并通过执行一系列导航动作到达指定地点。该任务涵盖了自然语言理解、导航策略设计和多模态数据融合等多个科学问题,解决这些问题是迈向视觉推理的必经之路。本次学术报告将介绍融合知识表征学习的视觉语言导航研究,重点探讨如何在视觉语言导航任务中提升导航器的推理能力与可解释性。研究的主要创新包括:提出物体信息融合方法,增强导航器对简洁指令的感知能力;通过设计高阶场景信息编码器,注入房型提示信息,提升导航器的场景感知能力;基于大规模语言模型,构建可解释的导航推理算法,提升导航器的泛化能力和推理效率。

主讲嘉宾简介:詹昭焕,男,广东汕尾人。本科就读于东北大学自动化专业,硕士就读于四川大学信息与通信工程专业,博士就读于中山大学计算机科学与技术专业。主要从事多模态人工智能、具身智能和计算机视觉等研究,以第一作者身份在相关领域知名期刊上发表多篇论文,包括IEEE TCSVT、Neurocomputing等。另以主要参与人的身份在多个国内外知名期刊或会议上发表论文逾10篇。担任IEEE TCSVT,Information Fusion,ACM Mm等国际期刊或会议审稿人。曾作为主要参与人参与国家自然科学基金面上项目和深圳市基础研发重点项目,曾荣获四川大学优秀硕士。

关闭

地址:深圳市龙岗区大运新城国际大学园路1号

电话:0755-28323024

邮箱:info@smbu.edu.cn

深圳北理莫斯科大学版权所有 - 粤ICP备16056390号 - 粤公网安备44030702002529号

返回顶部