拉斯维加斯手机娱乐网站 优秀博士学位论文奖旨在推动中国图像图形学领域的科技进步,鼓励创新性研究,促进青年人才成长。
为宣传科技工作者积极进取的工作精神,聚焦获奖人背后的故事,学会近日对荣获2022年度CSIG优秀博士学位论文奖的获奖者袁艺天进行了专访,以对话的形式,为读者们提供一次了解她的机会。
下面就跟着我们的脚步,走近今天的受访者吧。
问题一:首先非常感谢您接受我们的采访,请先向大家介绍一下自己:
大家好,我是袁艺天,2021年毕业于清华大学清华-伯克利深圳学院计算机科学与技术专业,取得工学博士学位,导师是朱文武教授,我的研究方向为多媒体和多模态分析。博士期间以第一作者身份,在Neurips,ACM Multimedia,AAAI等多媒体和人工智能领域国际会议上发表和接收会议论文4篇;在IEEE TPAMI, IEEE TCSVT等模式识别,视频分析和处理领域国际期刊上发表和接收期刊论文3篇。曾获清华大学博士生国家奖学金,北京市优秀毕业生,腾讯犀牛鸟精英人才培养计划二等奖多项荣誉。
问题二:下面请为大家简单的介绍一下您这篇论文的情况:
随着数字媒体和互联网技术的迅猛发展,视频逐渐渗透到人类生活的方方面面。视频作为一种复杂的流式数据,在传递有效信息的同时也包含着大量的冗余,带来巨大的存储空间和时间成本开销。因此,挖掘和呈现有价值的视频内容,对于视频的分析、检索和管理都具有十分重要的意义。而在当前多媒体时代的背景下,视频并非独立存在,我们观察到网络视频被大量的自然语言数据包围,例如视频标题,描述和用户评论等。这些自然语言数据能够清晰地指示和简洁地描述视频中值得人们关注的内容,为视频的分析和理解带来了极大的便利。基于上述考虑,我的博士学位论文旨在利用自然语言来辅助视频的分析和理解,具体将从以下两个方面展开。
作为信息检索的一种重要查询媒介,自然语言对视频内容具有良好的``指示''性。因此,论文探究了利用自然语言句子在视频中搜索特定片段的时序定位问题。特别地,为了精准地建模视频和自然语言句子这两种不同模态数据中语义细节的对齐关系,我们提出了基于注意力的时序回归方法,该方法通过多模态共同注意力机制细粒度地度量了视频和句子内部内容之间的语义匹配关系,并能够从反映全局视频时序结构的注意力向量中回归预测目标片段的位置坐标。此外,为了充分发挥句子在关联视频内部内容中的重要指导作用,我们还提出了语义动态调制机制,该机制通过微调时序卷积网络中的归一化参数,引导与句子语义相关的视频内容在特征空间聚集,为确定目标片段的边界提供了清晰的线索。进一步地,我们还将上述思想应用到视频缩略图生成的实际问题中,使得视频缩略图能够根据用户的搜索意图动态更新,大大提升了用户的视频搜索和浏览体验。
作为日常沟通的一种重要表达方式,自然语言对视频内容具有良好的``描述''性。因此,我们还探究了视频的自然语言描述的生成问题。传统视频描述生成框架专注于拟合已有数据集的语料特征分布,导致所生成的句子句式单一枯燥,语言表现力有限。针对此问题,我们提出了基于范例句的句法可控的视频描述生成任务,该任务要求所生成的描述句子不仅能够表达视频的语义,还能够模仿给定范例句的句法结构。具体地,我们搜集了大量句法结构多样的自然语言句子作为范例句,利用循环神经网络编码学习这些范例句的句法特征,并将句法信息引入到句子解码器的时序状态更新过程中以指导生成句法可控的视频描述。大量实验结果表明,通过模仿范例句,视频描述句子的多样性和表现力都获得了显著的提升。
问题三:请问您在科研过程中,有没有什么好的方法可以推荐给大家?
在我读博期间,我的导师朱文武老师经常教导我们做科研一定要时刻“把握好几张slides的核心内容,把问题想透”,他的这种观念一直深深影响了我,让我收益匪浅,在这里推荐给大家。所谓“几张slides”,包含的内容主要有以下几点:(1)你要解决的问题是什么?它有什么意义?(2)当前世界上最好的方法有哪些?各有什么优缺点?(3)你提出的方法是什么?用两三句话提炼创新点并给出方法概览图。(4)你的实验计划及现有结果。其实以上几点大家应该都非常熟悉,它们是一篇学术论文的核心要素,可以说在绝大多数合格的学术论文中,这几点都必须要有所体现。朱老师要求我们每次汇报都必须要讲清楚这些内容,实际上就是让我们在科研过程中,时刻培养自己良好的思维方式,理清楚自己的研究脉络,而不是等到写论文的时候脑子里面还是一盘散沙,做实验的时候也头脑混乱毫无章法。事实上,经历了这样的科研训练,我已经潜移默化地形成了很好的科研习惯,每每上述slides中的某一张在脑海里面清晰起来,我科研的信心又会足一分。
此外,我还很推荐大家读论文的时候“分堆”去读,不要轻视学术论文的相关工作章节。在初入一个领域的时候,通过认真阅读经典论文的相关工作章节,我们可以快速地获得前辈们对此领域的总结思考,并提取出其引用的相关论文,再通过学术搜索软件顺腾摸瓜找到相关的经典论文,热点论文,最新论文,形成待阅读列表,这样可以很快地获得这一领域的一个初步认知。只有多阅读,边读边捋清楚前辈们的工作脉络,才能启发自身思考,为做出好的工作打好基础。
最后一点是推荐大家多交流,多和同学、朋友聊聊天。不仅仅科研方面可以和大家多讨论,平时也可以通过和朋友聊天排遣自己的压力。科研生活大多数时候是孤独又“痛苦”的,在科研上越是孤独的时候,生活上更应该把自己放开,去接触其他聪明的脑瓜子,其他有趣的灵魂,让自己获得更加积极的心态。
问题四:在您论文筹备过程中遇到的最大的挑战是什么?是怎样克服的呢?
我在论文筹备过程中,遇到的最大的问题是实验效果还不够好,实验不完善,实验结论不够鲁棒。造成这一问题的原因一般有两个:第一就是对问题的思考还不够到位,模型设计还不是很合理;第二就是实验的细节把握得还不够,比如深度学习常见的调参的问题。遇到实验效果还不好的问题的时候,我都会从以上两点去分析,逐一排查,和导师、同学多讨论,再动手逐一验证。可以多做一些验证性的小实验,排除可能的问题,并结合可视化工具帮助剖析问题。这个过程往往非常繁琐,需要调节好自己的心态。
问题五:最后,有什么话想对自己的导师说呢?
在此衷心感谢我的导师朱文武老师,我在朱老师一众学生中,算是资质平庸的,承蒙师恩不弃,朱老师为我提供了全面的科研训练和指导,使我获得了良好的科研习惯和思维方式;他还为学生们提供了开放的科研平台和深厚的科研资源,极大地扩展了我们的学术视野。朱老师一直要求我们做世界一流的研究,紧跟当下的前沿技术,但也不要人云亦云,保持清醒的头脑。朱老师优秀的科研品位、勤奋的精神、谦逊的学者风范也一直深深影响了我;每当我贪玩懈怠的时候,一想到朱老师认真工作的身影,就会感到羞愧,唯有继续努力。朱老师一直为我们提供鼓励和支持,无论走到哪里,从事何种工作,朱老师永远都是我们最坚实的后盾和内心的底气。
同时,我也要感谢一路走来帮助过我的梅涛老师,马林老师,以及各位合作者、同学和朋友,非常怀念和大家一起奋斗的时光,这段日子永远闪闪发光。
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190