欢迎访问义乌工商职业技术学院机电信息学院官方网站!

华硕高管庄谨誉博士为学院师生做题为“OCR-free Document Understanding Transformer”的讲座


作者:叶达   发布日期:2024-10-21

10月14日,437必赢会员中心邀请了华硕电脑股份有限公司副董事长、台湾大学博士庄谨誉,为大数据技术专业群的师生做了一场题为“OCR-free Document Understanding Transformer”的线上讲座

庄博士介绍华硕在AI领域获奖论文与技术创新成果

庄谨誉博士拥有丰富的技术和行业经验,他在台湾大学攻读博士后,长期致力于计算机视觉和自然语言处理技术的研究,尤其在OCR(光学字符识别)领域的应用方面拥有深厚造诣。他的讲座涉及“OCR发展历史、OCR识别中的问题与解决方案、OCR的工作原理及意义、常规文档信息提取的步骤和结构、Transformer架构的应用”等六大方面。

首先庄博士回顾了OCR的发展历程,从传统的手工标注方法到机器学习和深度学习技术的进步,强调了OCR在全球范围内自动化处理文档中的重要性。同时,庄博士也指出,OCR技术仍然面临着诸多挑战,例如对复杂背景的文字识别准确率不足、多语言环境下的处理难题以及图像质量对识别结果的影响。

庄博士讲解OCR技术中的识别准确性及多语言处理挑战

接着,庄博士深入剖析了OCR在实际工作中的具体流程,详细讲解了如何进行文档预处理、文本区域检测、字符识别及后续的格式化处理等步骤,突出了OCR技术在提升企业效率和推动自动化流程中的重要作用。在此基础上,通过Transformer架构,解释该架构如何为OCR-free文档理解提供全新的解决思路,通过分享其团队在该领域的最新研究进展,展示了OCR-free技术在实践中的潜力。

最后,庄博士介绍了OCR及其衍生领域的就业机会,从技术研发、产品管理到解决方案提供等多维度分析了该行业的未来发展趋势。

讲座结束后,老师们踊跃提问,庄博士对提出的问题进行了详细的解答,现场气氛热烈,师生们受益匪浅。

(审核 张胜兵 编辑 王晔)