迪奥OCR丨专注为企事业单位提供文字检测与识别服务迪奥科技致力于人工智能与大数据算法研发与应用领域的深度挖掘,聚焦“数字企业”应用场景,核心技术包含机器学习、计算机视觉算法、自然语言识别,为企业客户提供企业数字化与智能化改造应用解决方案,主要客户来自能源、证券金融、化工、政务、教育等行业。 迪奥产品拥有 4 项发明专利、1 项实用新型专利与 40 项著作权,涵盖计算机视觉算法、自然语言算法、知识图谱、机器学习、模型标注训练。 其中,迪奥OCR、迪奥NLP拥有海量信息毫秒级检索引擎、通用文字识别引擎、自然语言处理引擎,实现对电子档案、扫描件自动识别与结构化存储,合同智能审阅、文本智能分析和纠错,为企业提供综合全面的智能文本处理服务。 通识文字识别 支持识别各类常见图像文件中的文字信息,并按照文档原有格式将文本还原成可编辑的文本格式。在通用全文识别能力(文字定位、行分析、文字识别)的基础上,返回文字在图片中的位置信息,方便用户对版式进行二次处理。 免费试用链接:http://demo.text.eyedmp.com/#/ocr 印章对比 检测合同文件或常用票据中的印章的合规合法性,提高验证效率,降低合同签订过程的业务风险。 免费试用链接:http://demo.text.eyedmp.com/#/seal 单据类识别 适用于凭证、报关单、回执等图文素材识别文字,应用办公场所快速处理相关文件等事要。 免费试用链接:http://demo.text.eyedmp.com/#/receipts 图像矫正 对文档图像的角度倾斜、透视变形等情况进行矫正。支持40度以内的倾斜自动矫正,支持自定义倾斜角度纠正。 免费试用链接:http://demo.text.eyedmp.com/#/angle 表格识别 支持识别有框线或行列位置明确的常规表格和含合并单元格的复杂表格。 文档图像数据结构化 实现对文档(图像、pdf)里面的标题、文本、表格、图像、盖章、列表、页码、页眉页脚的识别、提取和整理,并返回结构化数据。 二维码识别 提取文档图像中的二维码,并返回二维码的值及所在位置。 营业执照识别 营业执照识别(多版式支持,支持市面所有版式)。 证照识别 支持身份证、护照、港澳通行证、户口本、驾驶证、行驶证等识照识别。 应用场景 -信息检索聚合,召回更多与检索词语相似的结果,可以用相似度来识别相似的词语,以此提高检索召回率; -智能对话理解,处理客户自然语言的提问,通过相似度计算客服知识库的同类回答的相似匹配程度,匹配度高的问题对应的答案将作为响应,提升响应率; -智能摘要生成,分析语句的相似度来完成文本摘要,直接利用语句中每个词的语法和语义来分析,对文本进行聚类,剔除重复主题,生成摘要精华。 解决方案 金融行业中,为防止合同被恶意修改,需要对合同盖章前后、借阅前后做全部文字条款审核确认。传统的人工审核速度慢、效率低。 迪奥火眼OCR自动对两份合同进行逐行的文字比对,进行全字匹配,标注出不一致的文字。对于多行、少行、文本错误等也能自动发现并提示,从而解放重复性体力劳动,让员工可从事其他高附加值工作。 结合RPA工具,迪奥火眼OCR还能将证照识别结果、表格识别结果等自动同步到指定文档、表格或第三方应用上。 政务行业的申请表、申报表的数据录入,金融行业各类交易单据、申请表的录入,使用迪奥火眼OCR后识别后不需要手动输入,直接实现自动填写,大幅提升录入速度和效率。 小结 迪奥火眼OCR专注于为企事业、机关单位提供多场景、响应快、高精度、可定制的文字检测与识别服务。 能够识别文件、证照、发票、表格、函证、印章等常见文档图像,同时对低质量文档图像如倾斜、扭曲、模糊也能做到精准识别。 实现对电子档案、合同扫描件、电子招标文件、函证回执等文档图像里面的标题、文本、表格、图像、签名、盖章、二维码、页码、页眉页脚进行结构化抽取,为企业、政务的数据采集和数据应用之间架起了高速通道。 |