CSIG文档图像分析与识别专业委员会学术微沙龙(简称:文档图像微沙龙)在线学术报告会第二十四期于2024年1月9日成功举行。本沙龙由拉斯维加斯手机娱乐网站
主办,文档图像分析与识别专委会发起承办,中国图象图形学报协办。本场活动邀请复旦大学赵珉怿博士,围绕其ACM-MM 2023等OCR最新成果进行介绍。微沙龙活动在B站、蔻享学术,中国图像图形学报视频号进行了同步直播。
报告的主持人是复旦大学张路博士,报告人复旦大学赵珉怿博士,围绕其ACM-MM 2023等OCR最新成果介绍。题目为“低质量文本图像识别”。报告首先介绍了低质量文本图像识别任务的相关背景和问题定义。该任务旨在识别低分辨率、模糊的低质量图像上的文本。现有的工作通常使用文本图像超分辨率技术提升低质量图像的质量,随后再识别。随后,报告分析了现有工作的缺点,并提出了两个新的文本图像识别算法。第一个是C3-STISR,该方法抽取包括识别线索、语言线索、视觉线索在内的更全面三重线索,以更好地引导超分辨率。第二个方法是STIRER,该方法设计了联合的图像超分辨率和识别方法,解决了超分辨率和识别恶性竞争的缺点。实验表明提出的方法在低质量文本图像数据集上取得了良好的识别准确率、超分辨率保真度和运行效率。
报告论文:
[1] Minyi Zhao,Shijie Xuyang, Jihong Guan, Shuigeng Zhou, STIRER: A Unified Model for Low-Resolution Scene Text Image Recovery and Recognition,MM '23: Proceedings of the 31st ACM International Conference on MultimediaOctober 2023Pages 7530–7539 shttps://dl.acm.org/doi/10.1145/3581783.3612488
[2] Minyi Zhao, Miao Wang, Fan Bai, Bingjia Li, Jie Wang, Shuigeng Zhou C3-STISR: Scene Text Image Super-resolution with Triple Clues
https://arxiv.org/abs/2204.14044
本次报告会获得了良好效果,我们期待更多优秀青年学子在文档图像领域取得研究进展,并在后续的沙龙报告会中踊跃参与、共同进步!
错过直播的同学可以前往B站观看回放视频,链接:
https://www.bilibili.com/video/BV1xK411v7ss/
扫描二维码观看
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190