个人介绍:李亮,中科院计算所副研究员,研究方向为计算机视觉和跨媒体智能等,发表TPAMI,IJCV等汇刊和CCF-A类论文50余篇,获国际会议最佳论文奖2次,5项工作入选ESI高被引论文。主持/参与科技部科技创新2030重大项目、973课题、NSFC应急管理重点项目、NSFC重点和面上项目等10余项,参与组织7次IEEE/ACM国际会议和5次国内会议,期刊JCST青年编委,ACM SIGMM中国分会高校合作负责人,入选中国科学院青年人才项目,获2020年吴文俊人工智能自然科学一等奖。与新华社起草《机器生产内容自动化分级》标准,相关成果在华为、淘宝、大华、华数传媒等公司使用,服务于2022北京冬奥会等重要任务。
报告题目:跨模态时空定位
报告摘要:计算机视觉和自然语言处理是人工智能的两大分支,它们专注于在视觉和语言上模拟人类智能。两者都用于描述客观世界,只是表述形式不同,存在相当密切的关联,现实世界的交互问题往往是同时涉及视觉和语言等多种模的。本次报告分享不同模态间在时间和空间上的定位,包括语言到图像的定位、语言到视频的定位、音频到视频的定位。此外,也将介绍在弱监督和开放域等复杂场景下的跨模态定位工作。
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190