CSIG图像视频通信专委会“青年学者沙龙”（第五期）成功举办

学会动态

CSIG图像视频通信专委会“青年学者沙龙”（第五期）成功举办

发布时间：2024-05-06 来源：拉斯维加斯手机娱乐网站分享：

CSIG图像视频通信专业委员会“青年学者沙龙”在线学术报告会（第五期）于2024年4月25日成功举办，该活动由CSIG图像视频通信专业委员会承办，中国图象图形学报协办。本次学术报告会邀请到了武汉大学计算机学院叶茫教授，报告题目为“多模态目标检索与语义理解”，报告会在中国图象图形学报视频号、B站（图图Seminar）、蔻享学术三个直播平台进行同步直播。

本次报告会由武汉工程大学计算机科学与工程学院、人工智能学院院长卢涛教授担任主持人。在报告会开场环节，CSIG图像视频通信专委会委员卢涛教授首先介绍了中国图象图形学报以及相关系列活动。接着，卢涛教授详细介绍了本次汇报人叶茫教授。最后，对本次报告分享进行了整体介绍。

叶茫教授介绍本次分享主题

在报告环节，叶茫教授首先对人工智能大模型的发展历程和通用大模型的基本原理与分类进行了介绍，包括语言大模型、视觉大模型、多模态大模型等。然后叶教授针对行人的跨模态检索任务，介绍了行人重识别中的多模态数据与无人机场景下的行人重识别难点，并提出了旋转不变transformer方法框架以增强对无人机场景下目标角度变化的泛化能力。接着叶教授介绍了可见光-红外跨模态行人重识别任务，以及自己团队使用通道增强的方法和无监督设置下的方法，均取得了国际领先水平。然后叶教授介绍了使用CLIP模型将文本模态引入行人重识别任务的方法、使用素描或照片进行识别的方法、面向不确定模态的方法、多任务联合学习方法框架、组合图像检索、文本引导的时尚图像生成以及姿势引导的图像生成。最后，叶教授介绍了多模态语义理解，包括视觉意图理解、多模态情感识别和多模态情感语义理解基础模型，并提出了上下文增强对比学习方法框架。在之后的讨论交流环节，在线参与本次学术报告会的专家学者提出了多个专业问题，叶教授对这些问题逐一进行了解答，本次报告会取得圆满成功。

学术报告环节

提问讨论环节

本次在线学术报告会引起了广泛的关注，共计5540余位专家、学者、工程技术人员通过三个直播平台线上参与了报告会，并进行了热烈的学术讨论，图像视频通信专委会的多位委员也通过腾讯会议方式出席了本次学术报告会。

CSIG图像视频通信专委会“青年学者沙龙”视频回放地址：

中国图象图形学报视频号

B站（图图Seminar）