为促进学术交流、活跃学术思想,共同探讨视觉智能技术前沿发展热点,Visual Intelligence视觉智能前沿报告会暨期刊发展研讨会将于2024年11月1日在上海召开。本次会议由Visual Intelligence编委会主办,《视觉智能(英文)》编辑部、上海交通大学电子信息与电气工程学院协办。会议邀请多位知名学者做精彩报告,诚邀出席,期待莅临!
一、会议时间和举办方式
1. 会议时间
2024年11月1日8:30-18:00
2. 会议地点
上海交通大学电信学院电信群楼3号楼208会议室(上海市东川路800号)
3. 腾讯会议:832 564 487
4. 直播链接
学会官方视频号:
欢迎关注CSIG官方视频号,观看直播
蔻享学术:
https://www.koushare.com/live/details/38334
二、报名及注册
在线参会无需报名,免注册费
(现场空间有限,如参加线下会议,请联系会务组)
三、会议日程
四、联系方式
联系人:彭老师
联系电话:010-82544676、13911997306
报告嘉宾
查红彬
北京大学教授
报告题目:具身视觉与SLAM:在线学习的途径
报告摘要:具身智能的本质是实现心智功能与身体、行为、环境的多层次反馈闭环处理,强化智能体与环境的紧耦合。SLAM的主要功能是同步完成传感器即时定位与环境地图构建,是具身智能研究中不可或缺的核心要素。为了提高具身视觉系统在真实复杂场景中的泛化能力,我们应充分保证视觉系统的环境自适应性,而在线学习方法是达到这一目标的有效途径。该报告将围绕基于在线学习的SLAM问题,介绍我们近来的一些想法和尝试,主要内容包括:使用在线学习系统忘却机理的动态SLAM算法;基于单目视频处理的全景三维几何与实例语义重建;基于在线持续学习的自适应VIO系统;利用隐式地图全局性与不确定性表达能力的自主建图方法。
个人简介:查红彬,北京大学智能学院教授,机器感知与智能教育部重点实验室主任。主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、传感器即时定位与地图构建等方面取得了一系列成果。出版学术期刊及国际会议论文350多篇,其中包括IEEE T-PAMI,IJCV, IEEE T-VCG, IEEE T-RA等国际期刊以及ICCV, ECCV, CVPR等国际学术会议论文150多篇。
鲍虎军
浙江大学教授
报告题目:真实感图形的神经绘制技术与流水线
报告摘要:近年来,利用神经网络来表示和学习构建复杂对象或函数取得了极大的进展,有力推动了三维视觉和图形计算的跨越式发展。本报告将介绍我们在神经图形绘制技术和架构方面的最新研究进展,该架构通过解耦场景的全局光能辐射传输过程,利用全连接超网络来学习得到以物体为插入单元的环境光能传输变化模型,以Transformer架构学习建立了以光源为插入单元的光能辐射传输增量模型,创建了真实感图形的神经绘制流水线,有效突破了以英伟达RTcore为代表的GPU架构限制,在具有普通光栅化和AI推理能力的GPU上,即可实现全局光照效果的高效高质量绘制。报告最后将展望这一新技术框架的未来发展构想,包括图形绘制大模型的构建和微调、绘制流水线的计算流程和硬件映射等等。
个人简介:鲍虎军,国家杰出青年基金获得者,长江学者特聘教授,浙江省特级专家。主要从事计算机图形学和混合现实的研究。所领导的团队曾获国家创新研究群体科学基金的资助,并作为首席科学家,先后承担了虚拟现实和混合现实两项973计划项目的研究。在混合现实的景物三维建模、移动三维注册融合、自适应高保真绘制呈现和自然数字化身交互等方面取得了重要创新突破,主持研发了端云协同的混合现实软件平台,成功实现产业化应用。有关研究成果分别获国家自然科学奖1项和省部级科技奖4项。
吴建鑫
南京大学教授
刘敏
湖南大学教授
报告题目:智能手术机器人多模态感知
报告摘要:手术机器人等高端医疗装备核心技术的突破与全面智能化转型升级是面向世界科技前沿、面向国家重大需求、面向人民生命健康的重大国家战略任务,为打破欧美高端数字医疗装备的技术垄断提供决定性保障和有力支撑。现有手术机器人缺乏有效的多模态手术目标协同感知系统,严重制约了其在国防安全、疫情灾情等国家重大突发事件应急响应中的推广和应用。针对上述具有挑战性的问题,本报告深入介绍了手术机器人从术前、术中到术后的多模态感知的基本原理和关键方法,并展示了我们团队目前取得的一些进展,为减少我国医疗事故提供重要保障。
个人简介:刘敏,湖南大学二级教授,副院长。国家杰出青年基金获得者,教育部青年长江学者,国家重点研发计划首席科学家,国家自然科学基金创新研究群体核心成员。湖南省自动化学会副理事长,机械工业先进制造视觉检测与控制技术重点实验室主任,拉斯维加斯手机娱乐网站 会员发展与服务工作委员会副主任,任IEEE T-NNLS等期刊编委。先后主持国家重点研发计划项目2项、国家自然科学基金重点项目1项,第一、通讯作者在T-PAMI等IEEE汇刊发表论文50余篇,获省部级科研奖励5项、国家教学成果二等奖(第2)。
刘光灿
东南大学教授
报告题目:鲁棒性人工智能之数据复原
报告摘要:鲁棒性是指系统在面对各种干扰时仍能保持预期性能的能力,其起源可追溯至20世纪50年代的“Robust Control”。鲁棒性问题是人工智能等领域长期存在的未解难题,严重制约着人工智能技术在信息化作战等强对抗场景下的应用。本报告将介绍一种称为数据复原的研究思路,简要介绍数据复原领域已经取得的进展,并对未来进行展望。
个人简介:刘光灿,东南大学自动化学院教授、博导。主要研究低维模型在机器学习、模式识别、计算机视觉、数据挖掘、信号处理等领域的应用, 发表IEEE T-IT、IEEE T-PAMI、NeurIPS、ICML等CCF A类论文60余篇,单篇最高引用3600余次,代表性论文获评2023年度CCF-CV持久影响力工作。获中国电子学会自然科学一等奖、CCF自然科学一等奖、吴文俊人工智能优秀青年奖等奖励,入选ESI高被引学者榜单,长期担任ICML、NeurIPS、ICLR等国际会议的Area Chair。
戴文睿
上海交通大学教授
报告题目:重建与生成:真实的逼近
报告摘要:报告将描述信号重建的思想和发展,重点面向最新的深度生成。稀疏采样的深度生成感知,欠采样的压缩感知经历了近20年的发展,作为有噪的线性反问题,通常定义为由线性投影基于带噪观测的退化模型,最新的深度学习则通过深度神经网络,从简单空间以分层或多层方式构建隐空间进行学习逼近,去噪和扩散先验成为反问题求解的一种有效思路。
个人简介:戴文睿,上海交通大学计算机科学与工程系教授、博士生导师,入选国家“万人计划”青年拔尖人才(2023)。在上海交通大学先后获得学士(2006)、硕士(2008)、博士(2014)学位;2015-2018年,在美国加州大学圣地亚哥分校担任博士后;2018-2019年,在美国德克萨斯大学休斯顿健康科学中心担任教职。主要研究方向:信号处理、信息论与编码、机器学习理论。共发表SCI、EI收录论文150余篇,包括 IEEE T-PAMI、T-SP、T-IP等著名汇刊长文 40余篇,顶级国际会议 ICML、NeurIPS、ICLR 等 40 余篇,获 CCF A 类国际会议 ACM Multimedia 2022 Top Paper Award,获中国授权发明专利 26 项、美国授权发明专利 6 项。2022 年获上海市科技进步一等奖(排 3)、中国电子学会科技进步二等奖(排1),2021 年获中国电子学会自然科学一等奖(排3),2023年获华为最佳创新合作奖。在上海交通大学“媒体信息网络研究所”(http://min.sjtu.edu.cn)。
王利民
南京大学教授
报告题目:多模态视频理解基础模型InternVideo
报告摘要:构建多模态基础模型已经成为计算机视觉领域的研究热点。视频理解面临着数据维度高、信息容量大、场景变化多等核心挑战,如何构建通用视频理解基础模型已经成为现阶段一项极具挑战的任务。本次报告将主要介绍多模态视频理解基础模型InternVideo及其背后的关键技术,包括单模态视频自监督预训练方法VideoMAE, 多模态视频弱监督预训练方法CPD和UMT,以及多模态视频交互对话模型VideoChat。同时还将介绍多模态视频数据集InternVid和多模态视频评测基准MVBench。最后将展望多模态视频大模型发展趋势。
个人简介:王利民,南京大学教授,博士生导师,国家海外高层次青年人才计划入选者,科技创新2030-“新一代人工智能”重大项目青年科学家。主要研究领域为计算机视觉和深度学习,专注视频理解和动作识别,在IJCV、T-PAMI、CVPR、ICCV、NeurIPS等学术期刊和会议发表论文100余篇。在视频分析领域做出了一系列有重要影响力的研究工作,例如:TDD视频深度特征、TSN视频网络架构,VideoMAE视频预训练方法,MixFormer目标跟踪器等。曾获得广东省技术发明一等奖,世界人工智能大会青年优秀论文奖,ACM MM 2023最佳论文荣誉提名奖。入选2022年度AI 2000人工智能全球最具影响力学者榜单,2022年度全球华人AI青年学者榜单,2021-2023年度爱思唯尔中国高被引学者榜单。担任CVPR/ICCV/NeurIPS等重要国际会议的领域主席和计算机视觉领域旗舰期刊IJCV的编委。
严骏驰
上海交通大学教授
报告题目:端到端自动驾驶:方法与评测
报告摘要:自动驾驶是学界与业界近两年的研究热点。而端到端自动驾驶是新涌现出的范式,不同于传统的模块化方法,其特点在于神经网络直接处理传感器输入,输出最终决策,全程可导。这种设计将包括感知、预测、决策的在内所有组件以可导的方式连接起来,以期做到高效特征共享与减小累计误差,以数据驱动而不是纯规则驱动的方式解决问题。本次报告中,我将介绍端到端方法的背景与基础知识,以及最前沿的世界模型驱动下的端到端自动驾驶方法、端到端驾驶合理闭环评测的设计思想与实现。
个人简介:严骏驰,上海交通大学人工智能学院教授,计算机系支部书记、IAPR/IET Fellow,CCF优博/杰出会员。科技创新 2030-"新一代人工智能"青年项目负责人、国家自然科学基金委优青、交叉学部重大研究计划重点项目负责人、教育部资源建设深度学习首席专家。曾任IBM研究院研究员(任职7年)。研究方向为机器学习及在组合优化、量子计算等领域的交叉应用,获陕西省自然科学一等奖。发表CCF-A类第一/通讯作者论文过200篇(CVPR24最佳论文候选、AAAI21最具影响力论文),引用超21000次。任ICML、NeurIPS、ICLR、CVPR、AAAI、SIGKDD等顶级会议(高级)领域主席、IEEE T-PAMI、Pattern Recognition、ACM TOPML等期刊(创刊)高级编委。曾指导学生获得挑战杯特等奖、CCF司南杯一等奖等荣誉。
付彦伟
复旦大学青年研究员
报告题目:Optimizing Sample Selection with Statistical Sparsity for Enhanced Model Capacity
报告摘要:In large-scale model training, human preference data is often gathered through crowdsourcing rather than costly lab-based annotation, bringing challenges like data sparsity, ambiguity, and outliers. Selecting clean samples from noisy training data is essential for effective model training. In this talk, we introduce a suite of algorithms designed for theoretically and empirically selecting clean samples.
We begin by proposing a sample selection algorithm that assesses alignment between network features and one-hot labels based on an approximate linear relationship. We also establish a theorem on noisy set recovery, detailing the conditions, under which our algorithm can reliably identify clean samples, and discussing both the strengths and limitations of our approach and our latest enhancements.
Furthermore, we examine how noisy data may negatively impact Direct Preference Optimization (DPO), a promising method for aligning large models with human feedback. We demonstrate that our method effectively manages both synthetic and real-world noisy data, improving performance across a range of visual and textual generation tasks. This underscores the practical value of our approach in enhancing model robustness against noisy preference data.
个人简介:付彦伟,复旦大学大数据学院青年研究员,博士生导师。2014年在英国伦敦大学玛丽皇后学院获得博士学位,2015年至2016年在美国匹兹堡迪士尼研究院任博士后研究员,曾获2017年ACM China Multimedia新星奖, IEEE ICME 2019 最佳论文奖。其已在其已在IEEE T-PAMI、IEEE T-IP、CVPR、ECCV、ICCV等计算机视觉与模式识别、机器学习、多媒体领域顶级国际期刊及会议发表论文超过160篇,其中其中IEEE T-PAMI第一/通讯作者论文16篇。主要研究方向包括小样本识别、深度学习图像三维重建、视觉引导机器人、图像生成/编辑和fMRI神经解码等。
许岚
上海科技大学助理教授
报告题目:Gen-AI and Neural Digital Humans
报告摘要:深度学习和神经表示技术的发展,为高质量的动静态场景重建、渲染和生成都带来新突破。并且进一步随着5G网络、虚拟数字人、元宇宙等应用场景的蓄势待发,其需求也变得越发迫切。本次报告结合过去一年课题组在这些方面的科研进展,重点探讨数字人光场采集、重建渲染和生成相关的方向。
个人简介:许岚,上海科技大学信息科学与技术学院助理教授、研究员、博士生导师,MARS实验室主任。主要研究方向聚焦于计算机视觉、计算机图形学和计算摄像学,致力于光场智能重建理论与技术的研究,突破了动态神经辐照场和虚拟数字人的一批核心关键技术,率团队研制了系列光场装置,为人工智能推动的超写实数字人提供了新范式。在CVPR、SIGGRAPH、IEEE T-PAMI等顶级刊物发表数十篇文章,并多次担任人工智能顶级会议CVPR、ICCV、AAAI等领域主席。
主持人
(按照主持顺序)
熊红凯
上海交通大学教授
个人简介:熊红凯,上海交通大学特聘教授(二级教授)、博士生导师。国家杰青(2014),长江学者(2016),万人计划领军人才(2017);上海市优秀学术带头人;作为第一完成人,曾获上海市科技进步一等奖、中国电子学会自然科学一等奖,上海市技术发明一等奖、上海市青年科技杰出贡献奖。拉斯维加斯手机娱乐网站 理事;中国计算机学会杰出会员;中国电子学会会士;国家自然科学基金委信息学部专家咨询委员会委员。主要研究:信号处理、信息论与编码、多媒体通信、计算机视觉、机器学习等。共发表SCI、EI 论文360余篇,包括:T-PAMI 等IEEE Trans著名汇刊长文近100篇,ICML、CVPR、NeurIPS、ICLR等顶级学术会议论文等60余篇;获授权中国、美国发明专利近 80 项。先后获华为最佳创新合作奖、优秀合作奖。培养学生,获国家杰青、国家优青、青年长江、万人青年拔尖人才、洪堡学者、微软学者等。在上海交通大学组建 “媒体信息网络” 研究所(http://min.sjtu.edu.cn)。
林巍峣
上海交通大学教授
个人简介:林巍峣,上海交通大学教授。在视频分析,视觉表征编码等领域发表权威期刊及会议论文100余篇,获发明专利25项,并获多项国际权威评测第一。研究成果获中国高交会、工博会优秀产品奖,中国产学研合作创新奖。入选IEEE多媒体计算中期职业成就奖、IEEE ICME多媒体学术新星奖。曾任多个IEEE Trans期刊编委,AAAI、MM等会议领域主席,及权威标准化工作组组长。指导学生获得“挑战杯”揭榜挂帅特等奖(擂主)。
邹君妮
上海交通大学教授
个人简介:邹君妮,上海交通大学特聘教授,博士生导师,国家杰出青年科学基金获得者(2021),国家优秀青年科学基金获得者(2016)。2008年在美国卡内基梅隆大学(CMU)从事研究;2011年-2012年,在美国加州大学圣地亚哥分校(UCSD)担任全职访问教授。2017年起,在上海交通大学计算机科学与工程系担任教授。先后获得上海市科技奖励一等奖4项,中国电子学会科技奖励二等奖3项,吴文俊人工智能科技奖励二等奖1项。主要研究领域:多媒体通信、高维视觉信息处理、几何深度学习等。主持国家自然科学基金重点等项目8项,共发表SCI、EI收录论文150余篇,其中:IEEE Transactions汇刊论文50余篇,著名国际学术会议NeurIPS、ICML、CVPR、ECCV等45篇;合作出版专著2部,获中美授权发明专利50项。
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190