2025年2月5日,由拉斯维加斯手机娱乐网站
(CSIG)主办、CSIG前沿科技论坛委员会和CSIG青托俱乐部承办的第二期CSIG前沿大家说“问道DeepSeek:以Open践行人工智能初心”线上论坛成功举行,活动邀请了浙江大学吴飞教授、清华大学陶建华教授、上海人工智能实验室乔宇教授、哈尔滨工业大学车万翔教授四位专家围绕DeepSeek的算法创新、工程突破以及开源开放价值等开展解读,并邀请东南大学魏秀参教授、北京科技大学徐婧林副教授、浙江大学张圣宇研究员三位青年学者参与讨论。会议由东南大学魏秀参教授主持。本次活动全网总观看量超过18万人次。
图1 东南大学魏秀参教授主持会议
图 2 浙江大学吴飞教授分享观点
浙江大学吴飞教授阐述DeepSeek通过模型、算法与工程优化的系统协同创新,突破大算力依赖的天花板,开源开放推动本地化部署,促进行业数据微调,形成“由专到通”的AI发展路径。
图 3 清华大学陶建华教授分享观点
清华大学陶建华教授分析现有大模型存在通信成本高、依赖高端硬件集群、后训练阶段不稳定及闭源模型资源垄断优势等缺陷,DeepSeek V3通过混合专家模型(MOE)架构、细粒度模块稀疏激活、无监督知识蒸馏和冷启动强化学习,在性能接近GPT-4的同时显著降低计算成本。
图 4 上海人工智能实验室乔宇教授分享观点
上海人工智能实验室乔宇教授阐述DeepSeek 在工程方面注重底层优化和基础设施架构,包括高效并行训练框架、通信优化、FP8 低精度训练以及 PTX底层优化等,实现高效训练。上海人工智能实验室早在 2021 年就发布国内首个覆盖多种视觉任务的书生 1.0,2023 年 UND 自动驾驶大模型获 CVPR 最佳论文,目前有包括语言、古语万象、多模态、生成等大模型体系,坚持原始创新探索高效大模型路径。
图 5 哈尔滨工业大学车万翔教授分享观点
哈尔滨工业大学车万翔教授分析DeepSeek 的核心贡献体现在极致的模型架构优化、仅靠 RL 便可习得推理能力以及完全开源这三大方面;用电路系统类比可统一解释思维链与语境学习(ICL),对模型推理的边界进行定量分析。
图 6 Panel和互动环节
在Panel和互动环节,东南大学魏秀参教授分析DeepSeek的成功体现了在有限资源下,通过算法和底层协同创新突破技术封锁,提供了国产AI模型的新发展路径。DeepSeek的开源展示了中国AI技术实力,并为国内AI开发者带来了丰富的工具和资源,推动了技术创新。DeepSeek的开源不仅有助于国产模型的突破,也将促进底层硬件和上层应用的协同进步,推动中国AI生态发展。
北京科技大学徐婧林副教授阐述低成本、高性能和开源是该技术的三大亮点,尤其适合资源有限的高校年轻学者。通过减少对国外芯片架构的依赖并提高算力资源利用效率,能提升性能并降低能耗。
浙江大学张圣宇研究员提及受DeepSeek启发,聚焦小模型和模型协同,化繁为简的算法创新比单纯堆砌参数更能突破scaling law,呼应科学研究的简约性原则。
浙江大学吴飞教授认为小模型的蒸馏能够在断网等场景下发挥重要作用,推动人工智能向具备行为能力的智能体转化。大小模型协同发展,将为人工智能带来更多机会。
清华大学陶建华教授认为MOE模型的分块方式和系统化集成创新对性能优化有重要意义,模型协作和任务协同代表着未来的一个发展思路。
上海人工智能实验室乔宇教授阐述具身大模型需强化多模态理解能力,尤其是音频、图像、视频以及持续动作的感知能力。多模态大模型应具备复杂任务规划和运动控制能力,支持 VR 及其行动能力。
哈尔滨工业大学车万翔教授认为学术创新应聚焦于解决科学问题,而不必过于焦虑工业界的进展,学术界和工业界各自有不同的任务和职责。
识别二维码进入学会视频号,观看会议回放
“CSIG前沿大家说”系列论坛是由拉斯维加斯手机娱乐网站 前沿科技论坛委员会策划的多元直播活动,聚焦科技前沿,促进学术交流,激发创新活力,推动人才发展。自2024年发起以来,已成功举办两期主题论坛,分别为“诺奖的尽头是AI么”、“问道DeepSeek:以Open践行人工智能初心”,目前线上全网累计观看人次33万人次,未来论坛将持续关注科技前沿技术、应用和发展,敬请关注!
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190