您的当前位置:首页 >> 期刊文献 >> 正文
基于CRNN模型的中文场景文字识别
摘 要:
中文场景文字识别(STR)是光学字符识别(OCR)技术的重要研究方向,在拍照翻译、无人驾驶等领域广泛应用。但是,中文场景下的文字面临着字体和字符种类多、文字背景复杂等问题。本文着眼于中国街景图像,基于CRNN模型提出了一种免分割、端到端的中文场景文字识别方法。首先CNN提取图像卷积特征,然后RNN进行序列特征预测,其中Bi-GRU有效抑制梯度消失或梯度爆炸,Dropout可以防止过拟合,最后引入CTC作为损失函数解决训练时字符无法对齐的问题。本文用Python实现了算法,以较好的效果完成了实验。
作 者:
  • 辜双佳1;栗智2
单 位:
    1.重庆理工大学计算机科学与工程学院;2.重庆大学
关键字:
  • 中文OCR;CRNN;免分割;端到端;中国街景;
页 码:
    108-110
出 处:
HTML阅读PDF文献下载您还没有登陆会员账号,请先登陆,在进行阅读或下载!
返回顶部 关注公众号