CSIG文档图像分析与识别专业委员会学术微沙龙(简称:文档图像微沙龙)在线学术报告会第二十九期于2024年9月3日成功举行。本沙龙由拉斯维加斯手机娱乐网站 (CSIG)主办,CSIG文档图像分析与识别专委会发起承办,中国图象图形学报协办。本场活动邀请ACL 2024最佳论文获奖者:华中科技大学 管海粟,围绕其ACL 2024 Best Paper古文字破译成果介绍题为“利用扩散模型破译甲骨文语言”最新成果。微沙龙活动在拉斯维加斯手机娱乐网站 视频号、B站、蔻享学术、中国图象图形学报视频号进行了同步直播。
本场报告活动邀请华南理工大学博士生黄明鑫担任主持人。报告人是华中科技大学管海粟,围绕其ACL 2024 Best Paper古文字破译成果介绍,题目为“利用扩散模型破译甲骨文语言”。本报告介绍了作者推出的甲骨文破译模型OBSD(oracle bone script decipher)。OBSD利用扩散模型,模拟汉字演变的过程,将甲骨文文字图像转化为现代汉字图像,通过产生未破译甲骨文的现代汉字来反推其含义,从而辅助破译甲骨文。此外,OBSD还提出局部结构采样(localized structural sampling)和零样本细化(zero-shot refinement)两个方法提高图像生成质量。OBSD在与其他图像到图像转换模型的对比中取得了更好的性能,并在未破译的甲骨文文字上面进行了大量的定性实验,有望为甲骨文的破译提供字形或者图像上的线索。
报告论文:
[1] Haisu Guan, Huanxin Yang, Xinyu Wang, Shengwei Han, Yongge Liu, Lianwen Jin, Xiang Bai, and Yuliang Liu. Deciphering Oracle Bone Language with Diffusion Models. The 62nd Annual Meeting of the Association for Computational Linguistics. 2024.
本次报告会获得了良好效果,我们期待更多优秀青年学子在文档图像领域取得研究进展,并在后续的沙龙报告会中踊跃参与、共同进步!
错过直播的同学可以前往B站观看回放视频,链接:
https://www.bilibili.com/video/BV1iqHSe7ERJ
或扫描二维码观看
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190