图1 讲习班现场
2023年5月28日,由拉斯维加斯手机娱乐网站 (CSIG)主办、北京工业大学信息学部、北京人工智能研究院、拉斯维加斯手机娱乐网站 机器视觉专业委员会承办的第23期CSIG图像图形学科前沿讲习班(IGAL23)在北京工业大学圆满闭幕。本期讲习班主题为“2020s深度学习技术”,由北京工业大学贾熹滨教授和马伟副教授担任学术主任,来自全国各地的专家和学者齐聚一堂,会场气氛活跃。
图 2 彭宇新教授致辞
图 3 杨震教授欢迎致辞
图 4 尹宝才教授开班致辞
在5月27日上午举行的开班仪式上,拉斯维加斯手机娱乐网站 理事,副秘书长彭宇新教授代表学会致辞,北京工业大学信息学部副主任杨震教授和北京人工智能研究院院长尹宝才教授分别进行了欢迎致辞和开班致辞。
图 5 贾熹滨教授介绍各位报告嘉宾
贾熹滨教授作为主持人,对本期讲习班的主题及报告嘉宾进行了介绍,并代表讲习班承办组全体成员对各位嘉宾及学员的到来表示感谢。本次讲习班旨在探讨未来深度学习技术的研发和应用研究思路,使学员在了解学科热点、提高学术水平的同时,增近与计算机视觉认知计算与应用领域科研顶尖学者和企业创新人才之间的学术交流。
图 6 彭宇新教授作报告
27日上午,北京大学王选计算机研究所彭宇新教授带来题为“细粒度多模态协同感知、认知与生成”的报告。本报告从细粒度辨识增强、多模态关联、多模态协同、跨模态生成四个方面介绍彭宇新教授团队在细粒度图像分类、细粒度跨模态检索、文本到视觉生成等方面的最新研究进展,并进行了相关系统展示。
图 7 李玺教授作报告
上午的第二场报告,由浙江大学计算机科学与技术学院李玺教授围绕“视觉结构建模和特征学习”进行分享。本报告主要围绕数据驱动的人工智能学习方法,进行大规模图像/视频数据的视觉特征学习,从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析,并引入了大规模视觉特征学习所涉及的主要研究问题和技术方法。然后系统地回顾了视觉特征表达和学习领域的不同发展阶段,介绍了近年来利用视觉特征学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。
图 8 查红彬教授作报告
27日下午,北京大学人工智能研究院查红彬教授进行了主题为“动态视觉与 SLAM 在线学习方法”的报告。该报告围绕基于在线学习的SLAM问题,介绍了其团队近来的一些想法和尝试,主要内容包括 面向自监督视觉里程计的序列对抗学习方法和具有在线自适应能力的自监督SLAM学习,并在最后探讨了自监督学习面临的相关问题。
图 9 王啸副教授作报告
接下来,北京航空航天大学王啸副教授介绍了“图神经网络的‘共性’与‘个性’”。王啸老师围绕“如何研究神经网络架构的内在统一性并指导图神经网络的设计”以及“图神经网络的个性特点”这两个问题,对两类典型的图神经网络展开了初步思考,梳理不同架构或操作之间的联系,为审视与改进现有图神经网络带来新的视角。
图 10 胡永利教授作报告
28日上午,北京工业大学胡永利教授进行主题为“从多源/多视数据表征到跨媒体智能”的报告。胡永利教授在回顾现有多源异构数据融合分析研究工作的基础上,介绍团队在图像视频等高维数据的非线性表征、多源/多视数据的乘积流形融合表示、跨时空数据关联建模等多源/多视数据表征方面的研究进展,并结合当前人工智能跨媒体智能领域的进展,介绍近年来在图文检索、视觉问答和多模态文档分类等方面的研究成果,并展望了未来的研究方向。
图 11 卢志武教授作报告
随后,由中国人民大学高瓴人工智能学院卢志武教授带来了“ChatGPT对多模态通用生成模型的重要启发”的报告。卢志武老师首先讲述了ChatGPT带来的研究范式革新和多模态通用生成模型的最新进展,介绍了其团队在多模态通用模型上的成功实践,包括语言生成工具ChatImg、视频剪辑与生成以及实体机器人等产品,最后总结了其团队在多模态通用生成模型上遇到的挑战与机遇并对其未来发展进行了展望。
图 12 常建龙研究员作报告
接下来,华为云研究员常建龙带来主题为“视觉微调概述和前沿探索”的报告,本次报告总结了当前视觉大模型的微调技术,可通过仅仅更新少量模型参数实现比全量微调更优越的性能。此外,报告对视觉大模型的预训练、微调范式、人机交互、优化等未来发展方向做出了详细的分析和讨论。
图 13 王春雨研究员作报告
28日下午,微软亚洲研究院主管研究员王春雨带来了主题为“人体姿态估计”的报告。本报告在回顾现有人体姿态估计算法的基础上,介绍研究员王春雨及其合作者在人体姿态表达、模型设计等方面的最新进展,以及这些方法在处理严重遮挡时取得的新的突破。
图 14 黄岩副研究员作报告
最后一场报告是由中科院自动化所副研究员黄岩带来的“图文匹配研究进展”。图文匹配是视觉-语言理解领域的基础任务之一,与传统跨模态检索的主要区别之一在于其弱监督的数据标注。本报告首先梳理该任务的相关代表性方法,然后总结目前的主要技术难题,并探讨相应的解决思路和未来研究方向。
图15 马伟副教授主持结营仪式
所有嘉宾的报告结束后由马伟副教授主持了结营仪式,再次向各位报告嘉宾及参会学者表示感谢,祝贺第23期CSIG图像图形学科前沿讲习班圆满完成。
图16 学员与嘉宾积极交流互动
第23期“2020s深度学习技术”前沿讲习班得到各位报告嘉宾、学者以及学会各级领导的大力支持。讲习班内容精彩、丰富,学员们踊跃提问、收获颇丰,不仅加深了对专业领域的认知,更拓宽了视野和思维。此次讲习班促进了广大专家、学者之间的交流与合作,取得了圆满成功。
图17 结营合影
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190