嘉宾介绍
徐行,电子科技大学计算机科学与工程学院研究员,主要研究方向为多模态信息感知与计算、跨媒体智能分析。近五年已在多媒体、计算机视觉及人工智能相关领域的中科院JCR一区/CCF A类论文60余篇,ESI高被引/热点论文10余篇。获得2022年吴文俊人工智能自然科学一等奖、国际多媒体大会ACM MM (CCF-A) 2017最佳论文奖,IEEE多媒体汇刊TMM 2020最佳论文奖,国际多媒体展览会IEEE ICME(CCF-B)2017最佳会议论文铂金奖和2022最佳学生论文奖等国际期刊奖项。获得2019年度IEEE计算机协会大数据技术委员会“杰出青年研究员”荣誉和2020年电子科技大学“学术新人奖”。主持包括国家自然科学基金优秀青年基金项目和四川省科技厅重大专项,并参与10余项国家及省部级科研项目。
报告介绍
报告题目:视频-文本跨模态时序对齐与内容检索
报告摘要:随着互联网基建的快速发展,视频数据正在逐渐成为人们生活中的主要信息介质。作为一种典型的时序多媒体数据,视频相较于单一模态数据(音频、文本、图像等),不仅有更强的多模态信息承载能力,还有着更复杂的时间序列信息,面临模态复杂、信息冗余和标注困难等技术难题。我们致力于深入研究视频-文本的时序对齐,利用自然语言从复杂的视频数据中理解和检索所需的内容/事件,改善当前多媒体信息检索系统的用户体验。同时,我们还针对视频时序信息标注困难的特点,结合弱监督学习深入探究视频文本时序对齐的新技术范式,力争实现视频内容检索的降本增效。本次报告将介绍我们近年在视频文本内容检索中关于多模态融合、对齐和协同学习的系列工作,主要涉及视频与文本的时序对齐学习、弱监督学习、对比学习和高效率检索等具体研究内容,并对未来基于文本的视频内容检索任务的发展作进一步的展望。
直播信息
直播时间
8月8日(星期二)19:00-20:00
腾讯会议室
会议号:411-3792-7818
请添加会议官方微信:CSIG_1990,备注“云讲堂”获取入群邀请
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190