中国高校SAS数据分析大赛2018宣讲会-华南赛区巡讲

迪奥NLP智能文档审查丨敏感词智能检测、高效识别,辅助企业规避法律风险

近日,上海市市场监管局发布《2020年第一批虚假违法广告典型案例公告》,在2019年下半年上海市市场监管部门查处的部分虚假违法广告典型案例中,包含永和食品(中国)股份有限公司广告违法案。永和食品(中国)股份有限公司因在微信公号发布未经政府授权的“永和豆浆的产品作为国礼走进各国驻华大使馆”内容,混淆概念误导受众,被处罚30万元。


随着互联网信息技术发展,企业通过移动终端发布广告,进行个性化广告推送,快捷实现广告到销售的商业变现,为消费者提供更便利生活方式,但同时也面临着随时触碰到法律红线的风险。


互联网不是法外之地,永和食品因为在微信公众平台发布的文章涉及虚假违法而收到惩罚,但其实在微信公众平台上,还有许多规则是企业宣传时需要注意的,例如:


图片

一、政治相关或者色情敏感,所有涉及政治相关的人名事件尽量使用常见代号来代替;

二、国家领导人姓名,尤其是时政类文章一定要注意;

三、谈及政策制度的时候,千万不要妄下判断或者结论;

四、迷信、脏话、非法信息、虚假信息等容易成为敏感词。


因此,有些人会使用一些敏感词检测工具,来检查公众号文章中的敏感词汇。


但是,很多工具都存在一些局限,又或者违规关键词的词库太老、词量太少,而企业在经营宣传中,除了微信公众平台以外,还有许多文字文档的信息,仅靠人力筛查无法准确掌握最新法律法规,且效率低、易出错。


这时,您不妨试试迪奥NLP智能文档审查,进行违规检测,EYENLP文档检测可以做到高效识别和过滤、广告、涉政、暴恐等多类不合规文字、垃圾文字及敏感词、违禁变种词。


图片

检测后可以进行针对性的删除,或者直接去修改包含关键词的文字,即可最大限度避免文章违法违规。


免费试用链接:

http://demo.text.eyedmp.com/detection/


除此敏感词识别外,迪奥NLP智能文档审查还拥有许多服务,可应用于金融、制造、通信、法律、审计、媒体、政府等多种文档处理密集型行业


通识文字识别

图片

支持识别各类文档扫描件、文档图像、照片中的文字信息。具体通用全文识别能力(文字定位、行分析、文字识别)能力,返回文字在图片中的位置信息。并支持文档图像自动倾斜矫正。

链接:http://ocr.text.eyedmp.com


应用场景·

PDF、图像、函证识别

金融行业是文档密集型的行业,不管是券商、银行、保险、基金、私募,这些企业都有大量的文书处理,文档格式繁杂,而且往往都是非结构化的文档,比如 pdf、扫描件,还有图片格式 jpg 这样的文件等,但因为监管条件严格,文档处理容错率低,通过通识文字识别应用,可以对PDF、图像、函证进行识别。


文档电子化储存

使用通用文字识别技术,实现对各类文档图像的结构化存储处理,可满足医疗、金融、政务、法务、教育等行业文档快速录入、存档和检索的需求,有效降低企业人力成本,提高信息录入效率


文档内容检索与快速定位

支持对海量PDF、图像文件进行准确检索并快速定位位置。


文本、表格、图像抽取

实现对文档扫描件、文档图像、照片中的文本、表格、图像内容进行识别和拆分。


文本纠错检测

图片


对短文本进行纠错处理,标识文本出错部分给予高亮,并展示错误信息,可用于短文本辅助差错等,有效提高语言正确性,同时减少人工校验成本。


链接:http://check.text.eyedmp.com


应用场景·

文档错误稽查

支持对文档错误进行自动稽查,包括语法错误、形似字错误、简繁体错误、谐音字错误以及字词动补全等,有效辅助文本编辑、校对工作,避免常见错误。


文档编写辅助

新闻媒体、商业文档撰写可在文档上内嵌纠错模块,可在编写文档时自动检查并提示错别字情况。从而降低因疏忽导致的错误表述,有效提升编写文档的严谨性,同时给用户更好的阅读体验。


违禁词检测

判断一段文本内容是否符合网络发文规范,识别文本中是否包含违禁类型里面的关键字/词,能够实现自动化、智能化的文本审核,大幅节省内容审核的人力成本。


文档比对


图片


支持对不同短文本之间的相似度进行计算,输出的相似度,可用于文本分类,辅助预分类搜索、推荐相似信息、问答分类等。


支持对两份或多份文档差异进行比对,找出各文档差异之处,可用于合同审核校正等。


链接:http://similar.text.eyedmp.com


应用场景·

文档要素提取

可以实现对多种类型文档的关键信息进行自动化抽取。对于抽取的每个类型的文档,可以设定多种不同的字段类型。通过定义不同文档的类型和字段的类型来更好的实现对项目文档关键信息的抽取。


以合同文档为例,可以设定包括甲方、乙方、金额大写、金额小写、起始时间、结束时间、签约地点、银行账号等重要信息。通过自然语言处理技术处理之后,可以自动的将相应的信息归档。在未来遇到类似项目的时候,可以方便的快捷的找到该项目的相关信息,利用旧有项目为新的项目提供更好的指导。


智能摘要生成

分析语句的相似度来完成文本摘要,直接利用语句中每个词的语法和语义来分析,对文本进行聚类,剔除重复主题,生成摘要精华。


文档差异比对

对文本之间内部差异的对比,通过自然语言处理技术,不仅可以显示出内容不同的部分,同时还支持对比包括新增、删除、不同这三大类的差异。同时通过自然语言处理技术,可以实现基于语义的文档比对,同时使用自然语言处理技术结合OCR技术,能够实现多种文件格式间的比对,更好的帮助项目文档管理。


印章比对

图片

检测合同文件或常用票据中的印章的合规合法性,提高验证效率,降低合同签订过程的业务风险。


链接:http://seal.text.eyedmp.com


应用场景·

合同、票据合法性检测

企业经营业务中,面临着大量的合同票据,其中可能有合同造假、票据篡改等业务风险。使用印章检测技术,可检测合同文件与常用票据中有无印章,用于快速确认合同及票据的合法性,并可定位印章位置进行印章图案抠取,有效提高验证效率,降低财税及商务合同签订过程的业务风险。

商务合作
BD@ibbd.net
简历投递
fuwu@ibbd.net
关于迪奥
产品中心
联系我们
行业应用
公司简介
新闻动态
人才招聘
自然语言理解
场景文字识别
文档OCR识别
金融行业
政府&公共事业
零售行业
020-29179586
工作日:9:30-18:30
广州市天河区华观路田头岗二路一横街起点国际三层
能源行业
文本数据挖掘