登录会员系统  |  联系我们  |  加入学会  
奖励与推荐
2023年度CSIG自然科学奖一等奖“知识引导的视觉内容理解”团队
发布时间:2024-04-01      来源:拉斯维加斯手机娱乐网站       分享:

CSIG自然科学奖授予在我国图像图形领域基础研究和应用基础研究中阐明自然现象、特征和规律,做出重大科学发现的个人和团队。

为宣传科技工作者积极进取的工作精神,聚焦获奖团队背后的故事,学会近日对荣获2023年度CSIG自然科学奖一等奖“知识引导的视觉内容理解”的项目团队进行了专访,以对话的形式,为读者们提供一次了解他们的机会。

下面就跟着我们的脚步,走近今天的受访团队吧。

问题一:首先非常感谢各位老师接受我们的采访,请先介绍一下团队成员:

WX20240326-180825@2x.png

我们的团队来自北京航空航天大学人工智能学院和浙江大学计算机学院,依托于数字媒体北京市重点实验室,致力于开发知识引导的视觉内容理解新方法。我们探索如何利用适合特定任务的知识,有针对性地促进对不同层次视觉内容的理解。自2012年起,我们在层次化视觉内容理解这一领域进行了前沿研究。经过十余年的努力,我们的几位主要研究者已成长为国内知名高校的科研领军人物,并持续深化和推进这一研究方向。

问题二:了解完了团队内的各位老师,请为大家简单的介绍一下项目的情况:

图.png

视觉内容理解是实现人工智能的重要环节,也是诸多智能视觉应用的关键技术基础。人类在理解视觉内容时通常伴随着经验与知识的介入。本项目发现单一的知识难以完整地满足视觉内容 理解的全部需求,但同一抽象层次的视觉内容理解对知识的需求存在相似性。基于此,本项目依据抽象层次将视觉内容理解划分为底层显著区域定位、中层目标解析和高层视觉推理,并针对性地开展了知识引导的研究。如何发掘同一抽象层次的共性知识需求并设计相应的注入方法, 以提升视觉内容理解能力。

问题三:请问各位老师在科研过程中,有没有什么好的方法可以推荐给大家?

图片222(1).png

首先,进行科研工作时,必须有良好的顶层设计的理念,因为它在很大程度上设定了我们研究的潜力和可能性。当我们开始规划研究的时候,我们应当抱有做成一件大事的信念,这样我们才会有望产出具有深远影响力和实际价值的科研成果。另外一方面,我们必须要认识到人工智能是一门不断创新和发展的交叉学科。作为研究者来说,我们需要在研究过程中持续地、广泛地了解和接触前沿技术,并用这些新的技术以及交叉学科的工具来进一步推动我们的研究。最后,我认为持有批判性的思维方式对我们的研究成果至关重要。任何一项研究成果都不会是完美的,而我们所能做的是不断地发现问题,不断地改进我们的方法,以实现科研工作的卓越。

问题四:在项目的研究过程中有遇到什么困难吗?大家是如何解决的?

在科研过程中,我们有时会感到对下一步的研究方向有些迷茫,特别是当我们在视觉内容理解的领域认为当前的研究结果已经相当不错时,有时候可能会质疑是否还有进一步研究的必要。然而,这时我们需要退后一步,以更宏大的视野,从顶层设计的角度去重新评估我们的工作,看看是否达到我们期待的目标,以及是否能满足实际应用场景的需求。透过这种方式,我们就可以识别出许多新的问题,从而找到新的研究方向。此外,在科研过程中,另一种推动研究进展的方法是利用交叉学科的技术。例如在我们的项目中,我们尝试运用多模态知识去弥补单一视觉模态的局限性,在此过程中我们获得了显著的成效。这也反过来再次强化了我之前提到的观点:需要广泛而持续地接触和掌握新的前沿技术,用它们来推动我们自身的研究。

问题五:最后,大家有什么获奖感言想说呢?

本工作是十余年工作的阶段性的总结。感谢北航人工智能学院提供的研究平台和科研支持,同时,也对拉斯维加斯手机娱乐网站 给予我们科研工作者的优质交流学习平台表示感激。我们所取得的成就,归功于团队每位成员的共同努力。未来,我计划继续在知识引导的视觉内容理解方面进行研究,希望能在新的大模型时代做出更多有意义的工作。

Copyright © 2025 拉斯维加斯手机娱乐网站  京公网安备 11010802035643号   京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服

Baidu
map