近年来,AIGC(生成式人工智能)技术发展迅猛,涌现出一系列颇受关注的模型,如ChatGPT、Stable Diffusion、Sora等,逐渐成为全球科技领域的关注焦点,并开始对人们的生产和生活的各个方面产生影响。AIGC技术在图像、视频和3D生成方面展现出令人惊叹的生成能力,为创意产业、广告营销、游戏开发、电子商务等领域带来全新的可能性,超越传统方法的限制,将想象力转化为现实。为此,拉斯维加斯手机娱乐网站 将于2024年5月11日-12日在北京举办CSIG图像图形学科前沿讲习班,本期讲习班主题为“AIGC进阶与基础”,邀请领域内知名专家和杰出学者作报告,构建一个AIGC图像、视频和3D生成技的沟通交流平台,使学员在了解学科热点、提高学术水平的同时,增近与领域内科研顶尖学者和企业创新人才之间的学术交流。
拉斯维加斯手机娱乐网站
CSIG智能图形专委会
学术主任
刘永进,清华大学计算机系长聘教授,人机交互与媒体集成研究所所长,拉斯维加斯手机娱乐网站 智能图形专委会主任,国家杰出青年基金获得者(2018.01-2022.12),科技部“重大自然灾害监测预警与防范”重点专项(文化遗产保护利用专题任务)总体专家组专家。近五年在PAMI/TOG/SIGGRAPH/TIP/TAFFC/TVCG/CVPR/AAAI/CVPR以及Brain Research等交叉领域内权威期刊会议上发表近百篇,其中SCI论文六十余篇,6篇论文入选ESI高被引及热点论文,获得两次世界华人数学家联盟年度最佳论文奖,六项专利技术作价1100万进行了成果转化。两次获得中国人工智能学会吴文俊人工智能自然科学奖,两次获得北京市科学技术奖,获2022年拉斯维加斯手机娱乐网站 高等教育教学成果奖一等奖,以及2011年国家技术发明二等奖。
易冉,博士,上海交通大学计算机科学与工程系助理教授。2016年获得清华大学工学学士学位,2021年获得清华大学工学博士学位。从事计算机图形学、计算机视觉等方面的研究。发表录用60余篇论文于IEEE TPAMI、ACM TOG、SIGGRAPH、CVPR等期刊会议,其中CCF-A类论文40余篇。入选第八届中国科协“青年人才托举工程”,获2021年北京市科技进步二等奖,2022年拉斯维加斯手机娱乐网站 高等教育教学成果一等奖,2022年CCF-腾讯犀牛鸟基金卓越项目,2021年拉斯维加斯手机娱乐网站 石青云女科学家奖(青英组),2022年中国人工智能学会优秀博士学位论文,2022年瑞士Chorafas青年研究奖,2023年ACM SIGAI China新星奖,2019年中国计算机学会计算机视觉专委会学术新锐奖。TPAMI、IJCV、TIP、CVPR、ICCV、NeurIPS、ICLR、AAAI等国际期刊会议审稿人。
时间:2024年5月11-12日
地点:北京市.北邮锦江酒店
刘永进 清华大学
报告人简介:刘永进,清华大学计算机系长聘教授,人机交互与媒体集成研究所所长,拉斯维加斯手机娱乐网站 智能图形专委会主任,国家杰出青年基金获得者(2018.01-2022.12),科技部“重大自然灾害监测预警与防范”重点专项(文化遗产保护利用专题任务)总体专家组专家。近五年在PAMI/TOG/SIGGRAPH/TIP/TAFFC/TVCG/CVPR/AAAI/CVPR以及Brain Research等交叉领域内权威期刊会议上发表近百篇,其中SCI论文六十余篇,6篇论文入选ESI高被引及热点论文,获得两次世界华人数学家联盟年度最佳论文奖,六项专利技术作价1100万进行了成果转化。两次获得中国人工智能学会吴文俊人工智能自然科学奖,两次获得北京市科学技术奖,获2022年拉斯维加斯手机娱乐网站 高等教育教学成果奖一等奖,以及2011年国家技术发明二等奖。
报告题目:文生3D 的评估与现状分析
报告摘要:随着扩散生成模型以及大规模预训练技术的快速发展,文生3D领域在近一年多内取得了突破式的进展。然而相比其他领域的评估而言,文生3D领域的评估手段主要依赖于2D评估和用户实验,准确性和全面性仍有所不足。本次报告介绍t3bench,作为首个全面衡量文生3D领域的benchmark,提出了基于与人类感知对齐的多视角质量评估自动指标和衡量3D内容与原始提示词对齐程度的自动指标,在有效评估当前文生3D方法效果的同时也体现出了当前方法的一些共性问题,如Janus多头问题、多视角扩散的out-of-distribution等问题,最后讨论一些该领域今后潜在的改进方向。
程明明 南开大学
报告人简介:程明明,南开大学杰出教授,计算机系主任。主持承担了国家杰出青年科学基金、优秀青年科学基金项目、科技部重大项目课题等。他的主要研究方向是计算机视觉和计算机图形学,在SCI一区/CCF A类刊物上发表学术论文100余篇(含IEEE TPAMI论文30余篇),h-index为80,论文谷歌引用4万余次,单篇最高引用4700余次,多次入选全球高被引科学家和中国高被引学者。技术成果被应用于华为、国家减灾中心等多个单位的旗舰产品。获得教育部自然科学一等奖2项、其他省部级科技奖2项。培养的3名博士生获得省部级优秀博士论文奖。现担任拉斯维加斯手机娱乐网站 副秘书长、天津市人工智能学会副理事长和顶级期刊IEEE TPAMI, IEEE TIP和《中国科学:信息科学》编委。
报告题目:高效能个性化图像生成
报告摘要:以大模型为代表的多模态图像生成技术可以有效地根据文本信息生成高质量的图像。然而,现有多模态生成技术在模型训练和个性化生成方面表现出较低的效率。例如,作为最近AI顶流的Sora模型虽然可以生成数十秒的流畅视频,但其训练代价相当高。Sora核心组件Difussion Transformer (DiT) 经常需要数十万次地迭代训练才能生成高质量的图像。此外,在图像生成中引入个性化的信息虽然富有吸引力,但是经典通过模型微调的形式经常耗费数十分钟才能得到高质量的结果。这些问题给生成式模型的大规模推广造成了障碍。本报告将介绍如何通过引入结构信息建模能力和个性化信息编码能力,有效地避免上述问题,并将该领域主流方法的性能提升2个数量级以上。
高林 中科院计算所
报告人简介:高林,中科院计算所研究员,博士生导师,国科大岗位教授,研究方向为计算机图形学,三维计算机视觉。在SIGGRAPH、TPAMI、TVCG等期刊会议发表论文80余篇,研发的人脸AIGC的APP被全球180余个国家或者地区的用户所使用。现任或者曾任GDC 2024大会联合程序主席,SGP 2023 大会联合主席,China3DV2023程序委员会联合主席,SIGGRAPH 2023-2024技术论文程序委员会委员,NeurIPS 2024领域主席,IEEE TVCG编委,CSIG智能图形专委秘书长,入选国家自然科学基金委优青,北京市杰青,英国皇家学会牛顿高级学者,曾获得亚洲图形学会青年学者奖,吴文俊人工智能优秀青年奖,CCF技术发明一等奖,CCF CAD&CG 开源软件奖等奖励。
报告题目:3D AIGC的进展与展望
报告摘要:在本次报告中我们将分享神经几何表示Gaussian Splatting和神经辐射场的基础知识和最新进展,并分析各自的优势。将讲述如何从NeRF中重建具有复杂拓扑的几何模型,如何对高斯泼溅模型进行大尺度编辑,和如何通过线稿生成高质量的三维人脸以及普通三维物体,并对其进行重光影。最后,将对未来的研究方向进行展望。
汪淼 北京航空航天大学
报告人简介:汪淼,北航虚拟现实技术与系统全国重点实验室副教授,博士生导师,研究方向为可视媒体智能生成、混合现实沉浸交互。发表学术论文40余篇,曾获国家科技进步二等奖1项(排名9),入选中国科协青托工程。担任CAVW期刊编委、图学学报编委、基金委FR期刊青年编委,多次担任IEEE VR、ISMAR等会议程序委员。
报告题目:基于神经渲染的三维数字内容生成研究进展
报告摘要:神经辐射场(NeRF)、三维高斯泼溅(3DGS)等神经表征与渲染技术受到了计算机图形学、三维视觉等领域的关注,极大促进了三维数字内容生成领域的发展。我将汇报神经表征与渲染技术在实时三维人像生成、三维场景矢量风格化、开放词汇场景语义查询等方面研究进展,并介绍团队基于计图国产深度学习框架的三维高斯泼溅开源实践。
韩晓光 香港中文大学(深圳)
报告人简介:韩晓光博士,现任香港中文大学(深圳)理工学院助理教授,校长青年学者。他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文近100篇,包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助,香港中文大学(深圳)青年科研奖。目前也担任CVPR2023/2024,NeurIPS 2023以及ECCV2024领域主席,同时也是IEEE TVCG 以及 Computer&Graphics 的编委。他的工作曾两次获得CCF图形开源数据集奖(DeepFashion3D和MVImgNet),曾两次入选CVPR最佳论文列表。
报告题目:AIG-3D,what’s the next?
报告摘要:在AIGC的大背景下,本报告将着重介绍AIG-3D的技术发展,并将介绍我们在AIG-3D方向的多种不同维度的探索工作,包括数据支持方面、先验设计方面、网络结构方面等。并在最后也将分享个人在AIG-3D的未来上面的思考。
报告人简介:曹炎培,VAST公司首席科学家。2009-2013年,于清华大学计算机科学与技术系本科学习,获多次校级奖项。2013-2018年,继续攻读博士学位,师从胡事民院士,专注计算机图形学与三维视觉,期间赴德国RWTH Aachen University交流,获Pacific Graphics 2014最佳论文奖。在三维数字化、几何建模、生成式AI及真实感渲染等方面的研究成果,多次在SIGGRAPH、CVPR等顶级会议和期刊发表,累计引用1200余次。共同创立3D生成式AI开源项目threestudio,荣获2023年度CCF优秀项目奖。2017-2019年间作为创业公司Owlii的创始团队成员及CTO,开发高精度实时动态3D重建、压缩与传输系统,并成功应用于CES、SIGGRAPH等国际展会及天猫双十一等大型活动(Owlii公司于2019年被快手收购)。2019-2021年,快手Y-tech高级研究员,开发低成本视觉动作捕捉系统、4D人脸几何和材质重建lightstage的软硬件系统,跨平台服务快手App等业务。2021-2023年,腾讯AI Lab和PCG ARC Lab专家研究员(T12)、三维方向负责人,负责三维数字化和三维生成方向的研究。2023年-今,VAST公司首席科学家。
报告题目:三维生成式AI:三维表示和神经网络架构
报告摘要:随着三维生成式AI技术的迅速发展,高效、准确的三维数据表示和强大的神经网络架构成为推动领域进步的关键。本报告将分享VAST团队在三维表示和神经网络架构方面的近期探索,以及对于该领域的一些思考。
李崇轩 中国人民大学
报告人简介:李崇轩,中国人民大学高瓴人工智能学院准聘副教授、博士生导师,2010-2019年获清华大学学士和博士学位。主要研究机器学习、深度生成模型,代表性工作Analytic-DPM、DPM-Solver作为核心采样技术部署于DALL·E 2、Stable Diffusion等。获国际会议ICLR杰出论文奖、吴文俊优秀青年奖、吴文俊人工智能自然科学一等奖、中国计算机学会优秀博士论文、ACM SIGAI 中国新星奖等。入选博新计划、北京市科技新星,主持、参与多项国家自然科学基金、科技部课题。担任ICLR 2024领域主席。
报告题目:视觉扩散模型前沿进展
报告摘要:扩散概率模型逐步地对先验分布去噪恢复数据分布,可以有效地建模各类视觉数据。本次报告会介绍视觉扩散模型的前沿进展,包括基础架构设计与训练,视频生成、三维物体生成与可控编辑等方面的理论、算法和应用,并简单探讨视觉生成模型的未来发展。
彭思达 浙江大学
报告人简介:彭思达,浙江大学软件学院“百人计划”研究员。在2023年获得浙江大学计算机科学与技术博士学位。研究方向为三维计算机视觉,代表工作为4K4D、Neural Body、PVNet。至今在TPAMI、CVPR、ICCV等期刊或会议发表四十余篇论文,谷歌学术引用3000余次,其中一篇一作论文获得CVPR最佳论文提名,在GitHub开源获得超过10000个stars。曾获得2023年全球IMC三维重建挑战赛冠军,2023年世界人工智能大会云帆奖-明日之星、2022 Apple Scholar、2020年CCF-CV学术新锐奖、2021年中国CCF图形开源软件奖。
报告题目:面向物理世界仿真的三维重建与生成
报告摘要:物理世界仿真是对人们日常生活进行真实、立体、时序化反映和表达的数字空间。传统多视图重建算法是构建数字三维世界的重要工具。然而,传统重建算法依赖精细的数据采集过程,并且难以处理复杂动态场景。针对这些挑战,讲者基于多视图几何和先验学习等思想,在相机位姿估计、场景重建以及物体生成三方面提出了新技术,提升了场景仿真的质量与效率。
1. 本期讲习班限报90人,根据缴费先后顺序录取,报满为止。
2. 2024年5月10日(含)前注册并缴费:CSIG会员2000元/人,非会员2500元/人(赠送1年CSIG会员);现场缴费:会员、非会员均为3000元/人;CSIG团体会员参加,按CSIG会员标准缴费;同一单位组团(5人及以上)报名,均按CSIG会员标准缴费。
3. 注册费包括讲课资料和2天会议期间午餐,其它食宿、交通自理。
4. 即日起至2024年5月10日,请登录会议注册网站注册。
5. 讲习班培训证书于结营仪式统一发放
6.会议注册网址:https://conf.csig.org.cn/10390.html
联系方式
联 系 人:黄老师
联系电话:010-82544754
邮 箱:igal@csig.org.cn
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190