2021年4月25日,由拉斯维加斯手机娱乐网站 (CSIG)主办、CSIG视觉大数据专委会承办的第16期CSIG图像图形学科前沿讲习班(IGAL16)在中国科学院自动化研究所圆满闭幕。本次活动由中国科学院自动化研究所赫然研究员担任学术主任,来自全国各地的教师、学生以及企业工程师参加,讲习班现场气氛热烈。
马惠敏教授主持开班仪式
4月24日上午,CSIG副理事长兼秘书长、北京科技大学马惠敏教授代表主办方主持开班仪式并致辞。马老师感谢学术主任赫然研究员以及报告嘉宾,同时也感谢来自全国各地的参会者对活动的支持。马老师在致辞中指出,讲习班报告详细讲解前沿基础理论、研究思路、核心技术、实际应用,本次讲习班也是新冠肺炎疫情暴发以来,学会组织的第一期线下讲习班,希望各位参会者珍惜这次非常难得的机会,了解学术前沿的同时,与各位报告嘉宾互动交流。
赫然研究员致辞
开班仪式上,中国科学院自动化研究所赫然研究员致辞,首先对在座的各位嘉宾和参加本期讲习班的学员表示欢迎和感谢,然后介绍了“生物特征生成与安全”讲习班的选题背景。赫然研究员提到,人脸、虹膜、语音等生物特征识别技术已经广泛应用于智能手机、金融支付、公安司法、智慧城市等领域,成为人工智能领域最重要的应用方向之一。因此,如何保护生物特征数据和鉴别虚拟生物特征数据是生物特征识别技术面临的新问题。
易江燕副研究员作报告
讲习班第一场报告,中国科学院自动化研究所易江燕副研究员作了题为“语音合成与鉴别”的分享。易老师提到,近年来语音合成技术取得很大的进展,在特定条件下特定人物的合成语音已接近真人。语音合成与鉴别作为一组“攻”与“防”的耦合技术,引起了学术界与工业界的广泛关注。易老师对语音合成与鉴别的发展进行了梳理与阐释。针对语音合成的适用场景与关键技术点,分别对身份风格合成、音色与韵律合成、语音模拟三大核心语音合成技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音合成的应对技术语音鉴别技术,首先介绍整理了针对性较强、面向参数式语音合成、拼接式语音合成与语音模拟技术框架的应对技术,在此基础上介绍具有普适性更强的基于深度鉴别网络的语音鉴别研究进展。
操晓春研究员作报告
接着,中国科学院信息工程研究所操晓春研究员围绕“网络空间视觉内容生成与识别”的主题作了分享。近年来,5/6G网络和AI技术的发展正持续改善网络空间的内容和服务质量,但同时也带来各种潜在内容安全问题:一方面,伪造、虛假、不良的媒体内容充斥于网络空间,影响社会稳定和个人声誉;另一方面,公开来源网络数据蕴含丰富的各种商业情报,但由于其价值密度极低,导致高价值信息挖掘如大海捞针。针对上述网络空间安全应用,操晓春研究员介绍了信工所团队在网络空间视觉内容生成与识别方向学术探索的最新进展,以及搭建的一套视觉大数据价值挖掘系统。具体包括:开源数据的云弹性采集与强智能搜索、数据驱动的自底向上深度抽象归纳、知识驱动的自顶向下演绎推理、人工智能深度攻防对抗等。
孙哲南研究员作报告
24日下午,中国科学院自动化研究所孙哲南研究员作了题为“虹膜图像获取与识别”的分享。虹膜纹理特征因人而异、稳定不变、安全可靠,是理想的身份认证标识信息。从上世纪90年代以来科研人员一直在探寻获取和识别虹膜图像的有效途径,虹膜识别学科领域经过20年的发展积累了丰富的理论和方法。在本场报告中,孙老师系统介绍了虹膜图像获取、预处理、特征提取与匹配、活体检测、技术应用等方面进展,最后展望可感、可知、可信虹膜识别的发展趋势。
王楠楠教授作报告
西安电子科技大学王楠楠教授围绕“异质人脸图像合成与识别”的主题作了分享。异质人脸图像主要是指处在不同模态或形态的人脸图像,例如线条画、素描画像,近红外、热红外图像与可见光图像,低分辨与高分辨图像,人脸动画以及不同的人脸面部表情等,正面人脸图像与侧面人脸图像。异质人脸图像合成主要是指可见光图像与这些不同模态和形态图像之间的相互转换。异质人脸图像合成的出发点是因为现实中经常存在缺少某一种图像的情况,例如刑侦破案等公共安全领域,急需重建出高清晰的人脸图像。在本场报告中,王楠楠教授介绍了现有的异质人脸图像合成方法中的典型方法,特别地,将以人脸素描画像和照片的合成为例,对异质人脸合成的关键原理进行阐述。报告内容涉及计算机视觉机器学习以及图形学等相关方向。
黄迪教授作报告
25日上午的讲习班由黄迪教授题为“人脸老化模拟”的报告拉开序幕。人脸老化是指人脸的轮廓和表观纹理随着时间的推移产生的缓慢、必然、不可逆的变化,准确地预测人脸老化序列在刑侦、安全、娱乐等诸多方面都有着十分广阔的应用前景,还可以促进人体测量学、遗传学等相关学科的发展,因此具有重要的科研意义。然而,人脸老化的机理复杂,且受到内部遗传因素和外部环境条件的共同作用,使老化模式呈现明显的个体差异性和不确定性。近年来,不断地有基于计算机图形学和计算机视觉的方法被提出,相关研究经历了由先验引导向数据驱动的逐渐转变,所合成的图像越来越真实。本场报告从人脸老化数据、模拟算法和有效性评价等维度介绍了国际上人脸老化模拟方面的最新进展,以及本课题组发表在IEEE TPAMI、IEEE TIP及CVPR等期刊和会议上的相关成果。
王井东研究员作报告
第六场报告,微软亚洲研究院首席研究员王井东老师作了题为“Human pose estimation:HRNet and DEKR”的分享。王老师提到,人体姿态估计是从图像中预测每个人的关键点的问题。王老师介绍了用于top-down pose estimation的SOTA的主干架构:HRNet(CVPR2019)及其轻量级版本Lite HRNet(CVPR 2021)。此外,王老师提出了两个自下而上的姿态估计解决方案:HigherNet(CVPR 2020)和HRNet-DEKR(CVPR 2021)。实用而精彩的分享引起了学员的热烈讨论。
李晓龙教授作报告
25日下午,北京交通大学李晓龙教授作了题为“虚假人脸检测的研究进展”的分享。如今,每天有数以百万计的多媒体数据通过网络传播。到底哪些内容是真实可信的、虚假内容的背后又经历了哪些篡改?近年来提出的数字取证技术将会给出答案。该技术不预先嵌入水印,而是直接分析多媒体数据的内容,达到真实性辨别的目的。其基本原理是原始多媒体数据本身的固有特征具有一致性和独特性,可作为自身的“固有指纹”,任何篡改和伪造都会在一定程度上破坏其完整性。在本场报告中李晓龙教授介绍了数字取证技术的分支研究方向、并对主流的研究方法给出介绍,然后重点介绍近年来出现的基于深度学习的虚假人脸生成的检测技术,最后对数字取证和虚假人脸检测的未来研究方向做出展望。
邓伟洪教授作报告
最后一场报告,北京邮电大学邓伟洪教授作了题为“真实世界人脸识别的潜在问题和挑战”的分享。邓老师指出,海量标注数据和深度学习技术推动了视觉识别的巨大进步,现有模型在许多数据集上的性能已经超越人类。然而,在实际应用中,训练和测试的环境差异、地域差异、文化差异、伪造和对抗攻击等挑战导致大部分视觉识别应用的准确率和稳定性仍不理想,甚至造成"种族偏见"等伦理问题。然后邓老师从数据集建设、深度学习算法和性能评价三个角度介绍了近期在以下方面的研究进展:1)当前人脸识别的鲁棒性及CA/CPLFW数据集;2)当前人脸识别的安全性及TALFW数据集;3)当前人脸识别的公平性及RFW数据集;4)真实世界表情识别及RAF-DB/RAF-ML/RAF-AU数据集。
会后讨论交流
8场专家的报告,拓展了学员的视野,激发了大家的研究兴趣和热情,同时通过相互交流,认识了新的同行,碰撞出诸多合作点。报告结束后,学术主任赫然研究员在结营仪式上作了本期讲习班的总结,并对报告嘉宾的分享和参会者的支持表示感谢。
第16期生物特征生成与安全前沿讲习班在各位报告嘉宾、广大同行以及学会的各级领导的大力支持下,取得了圆满成功。
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190