CSIG图像图形中国行—西北工业大学-138_拉斯维加斯手机娱乐网站

学会活动

CSIG图像图形中国行—西北工业大学-138

发布时间：2024-12-10 来源：拉斯维加斯手机娱乐网站分享：

2024年12月1日，“CSIG图像图形中国行”来到了西北工业大学，谢琦、牛超越、张磊等9位专家学者分享了他们在人工智能、计算机视觉、机器学习等领域的最新研究成果，通过学术交流开拓视野，激发科研潜力，进一步助力计算机学科的持续发展。本次活动由拉斯维加斯手机娱乐网站（CSIG）主办，CSIG成像探测与感知专业委员会、西北工业大学计算机学院计算机学院承办，CSIG成像探测与感知专委会委员、西北工业大学计算机学院副院长夏勇教授担任执行主席。

图片1.jpg

图 1 会议开幕式

活动开始，西安交通大学谢琦副教授作了题为“参数化卷积方法及其应用”的主题报告，强调常用的离散形式卷积核无法灵活进行变换，功能上仍具有局限性，不适用于旋转与尺度不变性刻画、卷积核动态调整和非网格卷积等操作，介绍了一种适用于底层视觉任务的参数化卷积方法，并以旋转等变卷积算子的构造为代表，介绍一系列参数化卷积方法的应用。

图片2.jpg

图 2 谢琦副教授作报告

上海交通大学牛超越助理教授作了题为“生成式大小模型协同学习初探”的主题报告。指出一方面大模型可以向小模型降维输出必要的垂直领域知识，另一方面小模型负责靠近应用场景、用户和数据源的高实时推理，同时基于本地用户数据得以个性增强，并向大模型升维集成新知识，构建生成式大小模型有机循环的新体系。分享了在大小模型样本协同与特征协同方面的进展，并探讨在任务协同、参数协同、协同优化等方面的潜在研究机会。

图片3.jpg

图 3 牛超越助理教授作报告

西北工业大学张磊教授为大家带来“跨域小样本学习挑战与思考”的主题报告，强调在跨域场景下，模型往往面临数据稀缺的问题，即小样本学习(Few-Shot Learning)的挑战。指出跨域小样本学习不仅要求模型能够在有限的数据下进行高效学习，而且要求模型具备跨越不同领域的泛化能力，对推动人工智能技术广泛应用与持续发展具有重要意义。报告深入探讨跨域小样本学习的挑战，并提出相应的思考和建议。

图片4.jpg

图 4 张磊教授作报告

华为公司技术专家胥皇为大家带来“华为云数字人技术和应用”的主题报告，指出深度学习模型在实际业务场景中距离稳定商用水平还存在巨大差距，特别是在对质量和精度要求高的ToB 场景中，绝大部分模型都无法满足业务需求。报告以数字人技术商用的落地进程为例，在数字人重建和驱动领域，介绍了相关学术研究和工业落地之间的GAP，工业落地的要求和技术指标的GAP，并阐述了实现 Al 规模商用的体会。

图片5.jpg

图 5 华为公司技术专家胥皇作报告

中国人民大学胡迪副教授作了题为“多模态学习的回头看：我们真的把数据都利用好了么”的主题报告。报告首先对不同模态的差异化学习现象、产生原因和潜在影响进行介绍，揭露“平衡多模态学习(Balanced Multimodal Learning)”的问题。然后从具体的实验观察出发，指出“模态间的拮抗作用”，从理论上介绍其对多模态学习质量的影响，并在优化手段、数据质量和学习目标等多层面提出了系统性的解决方案。最后，围绕具身动态交互下的“模态时变性”研究进行介绍。

图片6.jpg

图 6 胡迪副教授作报告

VIVO 影像算法研究部主管研究员张琦作了题为“Gaussion Splatting在三维重建中的应用”的主题报告，指出渲染过程中对连续信号的离散采样导致了走样(aliasing)问题，不仅降低了渲染图像的细节表现能力，也影响了可微渲染的优化过程，且3D Gaussion Splatting(3DGS)的重建过程中对场景几何及高光纹理无法做到很好的表达，从而限制了重打光性能，阻碍了神经渲染更进一步表达高真实感细节的能力。报告围绕着 3DGS 在三维重建中的应用展开，介绍了多种良好的三维表示及重建方案。

图片7.jpg

图 7 张琦研究员作报告

西北工业大学赵斌副教授为大家带来“大模型驱动的具身智能体”的主题报告，凝练了生物智能“思维计算-实体控制环境感知”的三元交互模式，重点介绍大模型驱动的具身智能体的相关研究，包括高层语义理解、自身技能认知与复杂任务执行等技术，为大模型时代的具身智能体发展提供新思路。

图片8.jpg

图 8 赵斌副教授作报告

西北工业大学闫庆森教授为大家带来“大模型时代下太空光学图像复原”的主题报告，首先介绍降质图像产生的原因以及深度学习的发展脉络，随后分别汇报利用特征信息作为先验条件的图像复原大模型方法，提升实际场景下图像的动态范围；然后汇报利用语义信息作为先验条件的图像复原大模型方法，解决极端条件下图像清晰化问题，以及汇报多模态信息作为先验条件的图像复原大模型方法，实现图像去模糊，提升细节质量，最后汇报图像复原在空间环境感知的应用。

图片9.jpg

图 9 闫庆森教授作报告

澳大利亚阿德莱德大学机器学习研究所博士后研究员谢雨彤为大家带来“语言的力量：驱动医学影像智能分析的多模态探索”的主题报告，聚焦语言驱动的多模态方法，通过文本提示与视觉信息的协同，探讨如何提升医学影像分析的理解、推理与生成能力，报告内容涵盖弱监督分割、医学视觉问答、医学报告生成、多模态预训练等关键任务。通过对相关技术的研究与实践，揭示语言在医学影像智能分析中的驱动作用，并展望未来的发展方向。

图片10.jpg

图 10 谢雨彤研究员作报告

参加本次活动的老师和同学认真聆听了报告，并与报告嘉宾热情地交流与互动，共同探讨学术内容。在活动的尾声，夏勇教授总结发言并对本次论坛活动进行了总结，感谢各位专家的精彩报告以及师生们的热情参与，最后祝贺本次活动取得了圆满成功！