CSIG云讲堂-李亮-42_拉斯维加斯手机娱乐网站

学会活动

CSIG云讲堂-李亮-42

发布时间：2023-01-16 来源：拉斯维加斯手机娱乐网站分享：

云讲堂 42期(大）.png

个人介绍：李亮，中科院计算所副研究员，研究方向为计算机视觉和跨媒体智能等，发表TPAMI，IJCV等汇刊和CCF-A类论文50余篇，获国际会议最佳论文奖2次，5项工作入选ESI高被引论文。主持/参与科技部科技创新2030重大项目、973课题、NSFC应急管理重点项目、NSFC重点和面上项目等10余项，参与组织7次IEEE/ACM国际会议和5次国内会议，期刊JCST青年编委，ACM SIGMM中国分会高校合作负责人，入选中国科学院青年人才项目，获2020年吴文俊人工智能自然科学一等奖。与新华社起草《机器生产内容自动化分级》标准，相关成果在华为、淘宝、大华、华数传媒等公司使用，服务于2022北京冬奥会等重要任务。

报告题目：跨模态时空定位

报告摘要：计算机视觉和自然语言处理是人工智能的两大分支，它们专注于在视觉和语言上模拟人类智能。两者都用于描述客观世界，只是表述形式不同，存在相当密切的关联，现实世界的交互问题往往是同时涉及视觉和语言等多种模的。本次报告分享不同模态间在时间和空间上的定位，包括语言到图像的定位、语言到视频的定位、音频到视频的定位。此外，也将介绍在弱监督和开放域等复杂场景下的跨模态定位工作。