2024年3月31日,由拉斯维加斯手机娱乐网站 (CSIG)主办,CSIG会员发展与服务工作委员会和优博俱乐部联合承办的第九期学生会员分享论坛在线成功举办。论坛由大连理工大学王立君副教授主持,邀请4位优秀博士生作学术报告,由4位评议嘉宾对研究工作做出点评并解惑,共同围绕研究生学术生涯的热点话题进行探讨,本次活动吸引了近万人次线上参会。
首先拉斯维加斯手机娱乐网站 会员发展与服务工委会主任马思伟教授介绍了学生会员分享论坛的活动形式、理念原则以及学会已经举办和计划举办的优质学术交流活动,并对参加此次论坛的评议嘉宾及讲者表示感谢。马思伟教授进一步强调拉斯维加斯手机娱乐网站 是一个致力于给图像图形领域研究人员和广大会员提供高质量学术服务平台的全国性一级学会组织,也是一个重要的人才举荐平台,希望大家都能积极参与学会各项学术活动,共同推动学术交流与人才成长,并预祝本次活动取得圆满成功。
图 1 CSIG第九期学生会员分享论坛合影
图 2 CSIG会员发展与服务工委会主任马思伟教授致辞
接下来,四位讲者分别带来精彩的学术报告。瑞士苏黎世联邦理工学院博士后研究员秦浩桐作题为“面向视觉任务的低比特量化方法研究”的报告。报告介绍了低比特量化作为一种通用降低位宽的模型压缩方式,在深度学习领域广泛用于在神经网络在资源有限设备上的部署。通过将浮点权重和激活压缩到1-8位,量化模型得以获得显著的计算和内存节省。同时报告还分享了在面向视觉任务的神经网络量化方面所做的努力,包括在不同生产资源场景下的多比特量化、以及面向极限压缩需求的二值量化。尽管仍存在挑战,广泛的适用场景和不断提高的准确性仍然使得模型量化成为对硬件友好的深度学习的一种有前景的方式。
图 3 瑞士苏黎世联邦理工学院博士后研究员秦浩桐作报告
华南理工大学谭明奎教授对报告中面向视觉任务的模型量化压缩方法研究做出了深入点评,肯定了其在视觉模型压缩领域中的系统性和重要性,对如何面向关键科学问题、实用落地场景总结归纳模型压缩领域的研究内容,解决在视觉任务领域的实际效率问题提供了宝贵的建议与指导,双方还就此进行了交流探讨。
图 4 华南理工大学谭明奎教授点评
北京大学智能学院博雅博士后樊斌作题为“卷帘快门相机时间超分辨重建算法研究 ”的报告。报告指出,近年来,使用卷帘式快门的CMOS相机凭借其在工艺复杂度、成本、功耗等方面的优势占据了消费级市场的主导地位。虽然卷帘快门相机具备优越的时间动态场景感知特性,但其逐行曝光机制会导致倾斜、扭曲等卷帘快门效应(即“果冻”效应),使得现有多视几何模型无法直接得以应用,极大限制了其三维视觉应用能力。面向卷帘快门相机鲁棒、高效、精确的实际需求,深入研究并揭示隐含在卷帘快门图像中的时空几何一致性与规律性,在时间动态建模和深度学习框架下重建潜在的高帧率全局快门视频,大大解锁了卷帘快门相机的应用潜力。
图 5 北京大学智能学院博雅博士后樊斌作报告
南京理工大学潘金山教授对报告中卷帘快门相机时间超分辨重建方法做出了点评,肯定了其在底层视觉任务中的重要性,对如何结合大模型以及结合神经形态相机来发挥卷帘快门相机时间动态感知优势,提高在面对云雾等极端挑战时的性能提供了建议与指导。
图 6 南京理工大学潘金山教授点评
中国科学技术大学盛锡华同学作题为“面向端到端视频编码的帧间预测方法研究”的报告。报告指出,视频是服务于人类视觉和机器视觉的一种重要媒体格式之一,人类和机器对高质量视频的需求的增长使得视频的数据量剧增,因此急需高效压缩视频。近年来,研究者们尝试借助深度学习技术,利用神经网络实现端到端视频编码。而为了获得更高的视频编码性能,如何设计更高效的帧间预测技术,减少时域冗余,更成为了研究的关键问题。报告还介绍了在面向端到端视频编码的帧间预测的一系列研究工作,包括基于时域上下文的帧间预测方法、基于空间分解和时域融合的帧间预测方法、面向人类和机器视觉的通用帧间预测方法。
图 7 中国科学技术大学博士生盛锡华作报告
鹏城实验室杨文瀚副研究员就盛锡华同学的报告内容进行了深入的点评。他针对如何定义不同场景下的率失真损失函数提出了问题,并围绕端到端视频编码与特征编码的标准化问题展开了深刻的讨论。此外,杨文瀚副研究员还就如何精准凝练端到端视频编码的关键科学问题给出了宝贵的建议。
图 8 鹏城实验室杨文瀚副研究员点评
中国科学技术大学韦天一同学作题为“GAN反演及其应用”的报告。报告提出:GAN 反演(GAN Inversion)旨在将真实图像反演回预训练 GAN 模型(例如 StyleGAN)的潜空间中,以便通过生成器从反演码中忠实重建图像。它不仅提供了一个替代的灵活图像编辑框架,而且还有助于揭示深度生成模型下的机制。作为连接预训练 GAN 模型和真实图像编辑任务的技术,GAN反演对质量和效率有很高的要求。报告还介绍了高质量高效率GAN反演算法E2Style,并展示其赋能的下游任务,包括:图像恢复、图像篡改、安全深度隐藏等。最后,将以头发编辑作为具体应用案例,介绍本团队在多模态头发编辑领域的系列工作:HairCLIPv1、HairCLIPv2。
图 9 中国科学技术大学博士生韦天一作报告
北京大学张健助理教授对GAN反演及其应用报告作出了精彩点评,对其脉络清晰、展示翔实的优点给予了充分肯定。张老师特别指出,报告中所涉及的GAN反演以及后续的头发编辑系列工作,研究思路清晰明了,研究过程循序渐进,逐步深入。此外,张老师还就如何结合扩散模型进一步推动头发编辑工作,以及如何将所提出的方法泛化到其他任务和实现落地应用等方面,提供了深入细致的指导和建议。
图 10 北京大学张健助理教授点评
panel讨论环节由王立君副教授主持,评议嘉宾、报告人共同围绕“TPAMI等顶刊投稿过程中有哪些经验之谈或注意事项?如何提高接收率?通常有哪些拒稿原因?”“如何更好地应对顶刊论文审阅过程中的response?审稿周期大概多久?审稿流程大概是什么?”“投稿顶会和顶刊应该如何取舍?如何将会议论文拓展成期刊论文?怎么增加创新点?有哪些注意事项?”“新论文层出不穷,如何更加精准、高效的追踪研究热点?有哪些方法和工具推荐?”等热点话题进行了热烈的交流讨论,腾讯会议室及寇享学术直播间互动频繁,气氛热烈。通过此次活动,参会的学生们纷纷表示在此次活动中收获颇丰、受益匪浅。
图 11 panel交流讨论
论坛报名征集:有意报名参加此活动的同学,请扫描下方二维码填写信息,学会秘书处将在收到申请后一周内予以回复。
联系人及联系方式
联系人:秦老师
联系电话:010-82544676
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190