2025年1月4日,由拉斯维加斯手机娱乐网站 (CSIG)主办、CSIG前沿科技论坛委员会承办的“小模型的曙光和机会之思辨”高峰论坛暨学科前沿讲习班在杭州圆满落幕。本次讲习班聚焦“小模型的技术方向与发展机会”,由浙江大学吴飞教授、赵洲教授担任论坛主席,吸引了来自全国高校、科研机构和企业的100余位专家学者,共同探讨小模型技术的前沿发展与未来机遇。讲习班现场座无虚席,气氛热烈。
论坛开幕,思想碰撞
图 1 讲习班开幕
1月3日上午,论坛开幕式隆重举行。CSIG理事、浙江大学吴飞教授在致辞中表达了对参与报告的嘉宾和与会人员的感谢。他指出,小模型在资源优化、效率提升等方面展现了巨大的潜力,希望本次论坛能为与会者提供启发,推动人工智能领域的进一步发展。
报告精彩纷呈,主题覆盖全面
图 2 讲习班开幕
开幕式后,多场主旨报告依次展开,涵盖生成式大模型、低比特量化、多模态状态空间模型、高能效扩散模型等当前热点问题,为与会者呈现了一场思想盛宴。
浙江大学吴飞教授作了题为“突破扩展定律的垂直领域生成式大模型”的报告。他深入分析了当前大模型扩展定律放缓的背景,提出了高质量数据和知识在垂直领域生成式大模型中的重要作用,并分享了团队的最新研究成果。
图 3 吴飞教授作报告
上海交通大学吴帆教授的报告“大小模型端云协同智能计算”,探讨了端云协同智能技术在实时性、隐私保护和个性化应用中的关键作用,展示了其团队在端侧推理与大规模联合学习中的进展。
图 4 吴帆教授作报告
香港理工大学杨红霞教授的报告“基础模型与专用模型的协作与演化”,提出了一种新型高效的连续预训练基础设施,结合领域模型优化,探索了人工智能开发民主化的可能性。
图 5 杨红霞教授作报告
上海交通大学卢策吾教授在“具身智能 Scaling Law 与可规模化数据”的报告中,分析了当前具身智能面临的解空间巨大与数据规模化难题,并提出了数据基因方法与硬件设备优化的解决方案。
图 6 卢策吾教授作报告
北京航空航天大学刘祥龙教授作了题为“大模型低比特量化”的报告。他详细介绍了神经网络压缩技术在降低算力消耗、提升推理效率方面的作用,并展示了团队在低比特量化领域的研究成果。
图 7 刘祥龙教授作报告
华中科技大学王兴刚教授的报告“轻量化多模态状态空间大模型”,从状态空间模型的线性复杂度出发,分享了在多模态扩展与推理效率上的应用,提出轻量化大模型的创新设计路径。
图 8 王兴刚教授作报告
复旦大学陈涛教授围绕“视觉深度模型的高效训练及压缩方法研究”,系统阐述了神经网络从设计到优化再到压缩的全流程解决方案,强调了模型在资源受限环境下的实际部署价值。
图 9 陈涛作报告
第二日,内容更为丰富
1月4日的报告内容同样精彩纷呈:
清华大学朱军教授以“扩散模型:不止于高维数据生成”为题,探讨了扩散概率模型在图像、3D生成、视频生成等领域的前沿进展,并介绍了其在强化学习中的创新应用。
图 10 朱军教授作报告
阿里巴巴吕承飞博士作了“淘宝端云协同系统平台研发和应用实践”的报告,分享了端云协同技术在电商领域的规模化应用经验及未来发展趋势。
图 11 吕承飞博士作报告
中国电信人工智能研究院白辰甲研究科学家在“大模型驱动的具身智能”报告中,将具身智能与大模型结合,探讨了环境感知、任务规划等多个方面的创新方向。
图 12 白辰甲老师作报告
中国科学技术大学黄振亚副教授的报告“人类认知经验启发的大模型推理与应用”,聚焦于提升大模型推理能力,分享了其在智能教育领域的应用案例。
图 13 黄振亚副教授作报告
清华大学唐彦嵩研究员的报告“高能效扩散模型及其应用”,提出了针对扩散模型高推理成本的优化方法,并展示了其在图像增强与动作生成等领域的实践成果。
图 14 唐彦嵩研究员作报告
苏州大学李俊涛教授在报告“可拓展的非自回归生成模型训练与优化”中,分享了团队通过双向注意力与建模路径优化提升生成任务性能的研究进展。
图 15 李俊涛教授作报告
北京航空航天大学邓欣副教授的报告“半光滑牛顿驱动的轻量化图像复原”,展示了其团队通过算法与神经网络结合实现图像复原任务的高效解决方案。
图 16 邓欣副教授作报告
交流与展望
此次论坛内容丰富,涵盖了小模型的多维研究方向,与会者纷纷表示受益匪浅。通过此次高峰论坛,学术界和产业界不仅加强了合作与交流,更为小模型技术的进一步发展提供了宝贵的思路。
图 17 现场交流热烈
未来,拉斯维加斯手机娱乐网站 将继续搭建高水平的交流平台,推动人工智能技术在小模型领域的创新与应用,为相关技术的可持续发展贡献力量。
图 18 与会人员合影留念
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190