CSIG技术发明奖授予在我国图像图形学领域运用科学技术知识做出产品、工艺、材料及其系统等重大技术发明的个人和团队。
为宣传科技工作者积极进取的工作精神,聚焦获奖团队背后的故事,学会近日对荣获2022年度CSIG技术发明奖二等奖“视听觉个体感知与交互关键技术与应用”的项目获奖团队进行了专访,以对话的形式,为读者们提供一次了解他们的机会。
下面就跟着我们的脚步,走近今天的受访团队。
问题一:感谢您接受CSIG专访,请先简单介绍一下您的团队:
项目团队是由北京声智科技有限公司、北京邮电大学、中国科学院自动化所和公安部一所联合组建的声学、图像和安全交叉学科团队。
声智科技成立于2016年,拉斯维加斯手机娱乐网站 企业会员单位,第二批国家“专精特新”小巨人企业,工信部抗疫突出贡献人工智能企业,工信部揭榜挂帅重点项目承担企业,科创中国Azero人工智能操作系统示范基地、全国声学科普教育基地、北京市数字经济示范基地,与中科院等共建3个人工智能交叉研究实验室,拥有1000多项专利和100多项标准,荣获北京市、计算机学会、人工智能学会等3项科技奖,2项中国专利奖,3项地区专利奖。
北京邮电大学拥有网络与交换技术国家重点实验室、信息内容安全技术国家工程实验室、移动互联网安全技术国家工程实验室、网络大数据分析与应用北京市国际科技合作基地等科研平台。
中科院自动化所拥有模式识别国家重点实验室等国家级平台,以及与中央军委科技委共建的中科院人工智能创新研究院等创新平台,是国内生物特征识别研究的开拓者之一,建设了生物特征数据采集与分析实验平台,拥有上万人规模的虹膜、二维/三维人脸、步态数据库。
公安部第一研究所首次提出城市级虹膜公安应用的多层异构、多维度、多源、分布式的体系架构,构建了跨模态融合、多算法引擎支撑下的虹膜云服务平台,突破了多场景、高通量条件下的虹膜采集核验关键技术并自主研发核心设备。
问题二:项目介绍:
本项目响应国家政策导向和现实应用需求,面向公共安全、疫情防控等重大需求,研发人脸、虹膜、声纹、热成像测温等包含视听觉的个体感知技术,实现对用户身份、体温状态等方面的精准感知,同时,研发语音识别、对话生成、虚拟人状态生成等视听觉人机交互技术,实现自然的人机交互,提升用户体验。在此基础上,研发云边端一体化的人工智能开发框架和应用平台,融合多传感器数据处理、大数据云服务、人工智能算法等技术,最终实现功能完备、内容丰富、应用场景广阔、拓展性强的面向新一代计算平台的端边云一体化视听人体感知系统。不断进行应用实践和产品推广,并在公共安全、疫情防控、金融、教育等国计民生重要领域示范应用。
项目研制过程中,先后获得国家自然科学基金、科技部重点研发计划、中央军委科技委国防科技创新特区、中关村科技园区管理委员会等项目的支持。本项目研制团队基于各合作方的研究基础及优势,项目组通过分工合作、联合攻关、协同转化等步骤实现了视听觉个体感知与交互关键技术突破和成果转化。研制团队汇聚了视听觉个体感知与交互领域从基础研究到行业应用的优势力量,产学研合作、优势互补、强强联合,在交流与合作中推动视听觉个体感知与交互关键技术创新,促进高新技术的成果转化,让科技前沿落地于实际生活中,以便于更好地服务社会。
项目成果已获国家发明专利授权11项,已公开发明专利14项,软件著作权 6项;在计算机图形、计算机视觉领域发表论文33篇,其中CCF-A类论文22篇(IJCV 1篇、IEEE TIP 3篇,IEEE TIFS 7篇,自动化学报1篇,AAAI 2篇,ICCV 1篇,IJCAI 1篇,CVPR 4篇,ICML 1篇,NeurIPS 1篇);论文Google Scholar 引用1070余次。
本项目参与制定国家标准10项、团体标准81项,累计申请专利1086项,发明专利795项,实用新型98项,外观专利193项;累计授权发明专利143项,实用新型79项,外观专利166项;累计申请152件软著,获得证书149件。
项目成果应用于冬奥会和冬残奥会、冬奥测试赛、联合国COP15大会、建党100周年、中国服贸会、中国科博会和中关村论坛等北京市和国家重点项目,有广阔的发展和应用前景,潜在经济效益巨大,并在公共安全、疫情防控、金融、教育等国计民生重要领域示范应用。
问题三:在科研过程中,有没有什么好的方法可以推荐给大家?
科研思路是科学研究的灵魂和首要因素,决定着研究的高度。就科研思路的产生来讲,有以下两个心得。
一是立足研究方向,通过文献阅读寻找科研思路。及时探讨分享阐述最新论文的创新之处,同时也会将该文与其他论文做横向对比,讨论各自的优势和不足,以及可能的使用前景和文中未解答的问题、今后的研究方向等等。此外要多参加学术活动,和同行业内研究方向相近的学者们多沟通交流,及时分享自己的科研思路也是一种不错的通过他人经验获得科研思路的方式。
二是基于自身已开展的研究,发现切实可行的技术路线。如果研究者本身已经开展了一些研究工作,有一定的工作积累,可以以实际研究中遇到的科学问题为导向,或者针对本研究领域中哪些问题已经解决了,采用什么方法解决的,各种方法有什么优缺点,还有哪些问题还没解决,进行横向和纵向对比分析,结合自己实验室的科研条件,提出切实可行的科研思路。
问题四:在项目的研究过程中有遇到什么困难吗?是如何解决的?
在项目的研究过程中,因为团队成员来自四家单位,研究过程中的协作受到影响,所以项目组建立了定期沟通机制,通过线上线下技术研讨会的形式,共同对关键问题进行研讨。在进行个体交互相关研究的过程中,团队对视听觉信号跨模态语义对齐和理解的研究还不够深入,视觉分析技术和自然语言理解技术的运用还没有深度结合,无法像人脑一样同时理解表情、动作、行为和语言、语音,用户和系统界面的交互过程还不够自然流畅,用户的体验感还有待提升,声智科技依托实际应用场景,不断与团队成员优化交互体验,同时探索新型交互界面,在实际应用中逐步进行优化。
问题五:获奖感言:
首先感谢拉斯维加斯手机娱乐网站 颁发技术发明奖,这是一份荣誉,一份激励,更是一个新的起点。在今后的日子里,我们将继续坚持“四个面向”,加强产学研合作,持续进行技术攻关,推动科技成果转化,为国家科研事业发展,为经济社会发展,为人民实现幸福美好生活做出贡献。
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190