云从科技提出Pixel-Anchor框架 取得OCR文字识别突破

日前,云从科技的自然场景OCR(文字识别)技术在ICDAR数据集上取得了多项最佳成绩,特别对于东亚语言部分,该文本检测框架的表现尤为出色,在多个子测试集上(包括中文)都获得了第一。ICDAR是当前OCR技术领域全球最具影响力的数据集,具有OCR领域奥斯卡之称。

云从科技提出的Pixel-Anchor框架在两个具有挑战性的自然场景文本检测测试集——ICDAR2015以及ICDAR2017 MLT中,分别在检测准确率和检测效率两个综合维度上获得了至今为止最好的结果(FMeasure,一种检出率和精确度的加权,具体见图Table 1-Table 3)。该框架在满足生产环境实时性要求的基础上获得了很高的检测准确率,该成果可进一步应用于计算机视觉、人工智能技术。同时,阿里巴巴、南京大学与南京理工大学、商汤科技、旷视科技也在榜单中体现出良好的成绩,表明中国继续在国际上引领OCR领域的研究。

云从科技提出Pixel-Anchor框架 取得OCR文字识别突破

云从科技提出Pixel-Anchor框架 取得OCR文字识别突破

云从科技提出Pixel-Anchor框架 取得OCR文字识别突破

OCR(Optical Character Recognition)是指对输入图像进行分析识别处理,获取图像中文字信息的过程,具有广泛的应用场景。而自然场景中的OCR 技术不需要针对特殊场景进行定制,可以识别任意场景图片中的文字。

云从科技提出Pixel-Anchor框架 取得OCR文字识别突破

和面对高质量文档图像的传统OCR相比,自然场景OCR跳出了对输入图像的质量和场景束缚,能够在更宽泛的领域中获取应用,引起了学术界以及工业界的极大关注。

但相较于传统OCR,自然场景OCR中的各种商品、布景或自然场景图片中的文本检测与识别面临着复杂背景干扰、文字的模糊与退化、不可预测的光照、字体的多样性、垂直文本、倾斜文本等众多挑战。

计算机视觉基础技术

应用前景广泛

OCR是计算机视觉领域的经典问题,长久以来,一直受到学术界和工业界的持续关注。在工业界,Google、Microsoft、Amazon等大型互联网公司,以及云从科技等人工智能创业公司,都在OCR技术上耕耘多年。随着技术不断成熟,OCR也开始在互联网及其他行业逐步上线使用,应用范围也从文档识别扩展到车牌识别,图片广告过滤,场景理解,商品识别,街景定位,票据识别等广泛的领域。

据悉,目前Pixel-Anchor框架已在云从科技的证件票据识别系统和图片广告过滤系统中上线,每天处理图片近千万张,自动反馈疑似违规图片准确率达96%以上;同时将证件处理和图文审核风险发现时间从“小时”降低到“秒”级。数据显示,2018年云从科技累计处理25亿证件数据、屏蔽了400万条恶意推广,有效提高业务流程效率及净化营销环境。

除OCR以外,包含人体姿态、跨镜追踪、车辆结构化、语音识别等智能感知的核心技术闭环已经在云从科技内部获得建立,比如安防大数据系统与智能商业运营平台应用“跨镜追踪(ReID)”技术,无需人脸也可以追踪目标。“逃犯克星”张学友的部分成果,就有“跨镜追踪”技术的参与。另外,云从科技也在浸入式大数据风控系统、AI-IoT物联网应用等场景中引入了智能感知技术。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。