拉斯维加斯手机娱乐网站 自然科学奖授予在我国图像图形领域基础研究和应用基础研究中阐明自然现象、特征和规律,做出重大科学发现的个人和团队。
为宣传科技工作者积极进取的工作精神,聚焦获奖团队背后的故事,学会近日对荣获2022年度CSIG自然科学奖一等奖“开放场景中视觉数据的关联建模与学习”的项目团队进行了专访,以对话的形式,为读者们提供一次了解他们的机会。
下面就跟着我们的脚步,走近今天的受访团队吧。
问题一:首先非常感谢各位老师接受我们的采访,请先介绍一下团队成员:
本项目由中国科学院计算技术研究所视觉信息处理与学习VIPL研究组的师生合作完成,团队成员包括王瑞平研究员、山世光研究员、陈熙霖研究员、姜华杰博士和王雯博士。其中,姜华杰博士与王雯博士参与项目研究期间是中科院计算所的在读博士生,目前二人分别任职于北京工业大学和北京交通大学。
问题二:项目介绍:
视觉智能研究近年来逐渐从封闭场景、视觉感知单一任务迈向真实的开放场景、感知与认知交叉的复合任务,有效发掘开放场景视觉数据间的结构、语义、上下文等多层次关联关系、建立其精简高效表示模型,是后续进行分类学习与理解的基础。本项目围绕这一科学问题取得了如下主要发现:
(1)提出了视频/图像集合的统计流形建模与度量学习方法,揭示了黎曼流形几何结构保持的内在机理,引领形成了“黎曼度量学习”分支研究方向。
(2)提出了开放域可迁移视觉属性挖掘与可扩展分类学习方法,显式解耦了视觉类别的层级结构化分类规则,为可解释识别模型构建开辟了新思路。
(3)提出了场景上下文关系图建模与结构化推理方法,构建了反映人类认知优先机理的层次化场景图,有力支撑了视觉问答推理等场景认知任务的研究。
截至2022年9月,项目8篇代表性论文Google引用2100余次,单篇最高引用800余次,受到本领域数十位资深学者广泛积极的评价和跟进扩展。相关技术转化应用于遥感场景解译、移动智能终端、智能安检等场景。
问题三: 在科研过程中,有没有什么好的方法可以推荐给大家?
基础研究选题既要立足实际问题来源,又要具有其独特学术挑战。比如本项目第一项创新点,主要来自于监控场景或影视剧场景中的视频人脸识别与检索任务需求,通过采用统计量黎曼流形建模视频序列这一基本思想,本项目较为系统地建立了黎曼流形上的度量学习方法框架。
问题四:在项目的研究过程中有遇到什么困难吗?是如何解决的?
项目研究面临的困难主要有两方面:
(1)新型学术任务的定义与评价,比如本项目提出的可解释物体识别、层次化场景图生成等问题,与以往学术界遵循的问题设定不同,需要精心开展充分详实的实验以论证其问题的合理性和方法的先进性。
(2)数据资源的匮乏,新的任务必然需要与之匹配的实验数据,本项目投入了较大的精力进行数据资源建设,比如具有类别与属性联合标注的大规模物体/人脸数据库、具有关键关系标注的场景图数据库等,这些资源都已向学术界公开便于后续研究。
问题五:您的获奖感言:
首先,非常感谢拉斯维加斯手机娱乐网站 颁发自然科学奖,感谢奖励评审委员会对我们团队研究成果的认可。学会作为图像图形学领域国内公认的卓越平台,为我们的研究成果展示提供了宽广的舞台。
其次,非常感谢研究团队的每一位成员,成果的背后是多年来大家的精诚合作。我们将继续努力做出更多更有影响力的工作,为图像图形学领域的发展贡献更多力量。
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190