零零客微文大全00ke.net

  • OCR文本识别,场景虽小,大有乾坤
  • 来源:安全自动化

图片


AI赋能千行百业的口号如今正在逐步落地实践,普罗大众在日常生活的衣食住行之中也越来越多的感受到AI带来的智能和快捷。

比如社区场景中出入口的人脸识别通道、社区智能垃圾分类、电瓶车禁入电梯系统;办公场景中人脸识别门禁考勤、票证识别;包裹收寄场景中图片转文本的一系列应用等等。

如此来看,不知不觉中,除了人脸识别的应用外,文本识别也已经深入渗透到大众生活当中,并为我们带来了诸多便利。

关于文本识别技术,其是计算机视觉和目标识别的基础研究之一,可以将图片、扫描件中的文字识别成可以编辑的文本,代替人工手动录入,近年在深度卷积神经网络的推波助澜下飞速进展。

图片



文本识别技术 秒识万千字符



从目前市场上文本识别技术的应用情况来看,文本识别技术适用于多种应用场景,其实用性完全不亚于名声在外的人脸识别。

平安科技就曾表示,文本识别技术的研究价值巨大,对人工智能在地图导航、智能交通、信息检索、机器视觉等领域的发展有较强推动作用,具有广阔的应用空间和重要的研究意义。

随着各行各业信息化程度的提升,很多需要文字信息录入的场合如今也在实现业务流程的数智升级。传统的票据录入、单据录入、各种证件执照等文件信息的录入以往基本只能人工手动输入,不仅效率低下,还容易出错。如今在AI技术赋能之下,卡证票据文档识别技术的投入使用,可迅速提升文本信息的录入效率,并且识别准确率基本可达99%以上。

为了让这项技术能够更方便的为人所用,目前不少企业已经开发了相当成熟的票证识别应用程序,嵌在各种业务办理平台的辅助功能当中,方便随点随用。

比如平安科技专门研发的“平安票证识别通”,目前已接入平安产险、平安寿险、平安信托等企业中,广泛应用于移动开户、移动投保、银行票据录入、医疗单据录入等场景,可准确识别身份证、行驶证、驾驶证、营业执照、医疗发票等证件票据。

复杂且个性化的文字和各类字符丰富着我们的日常生活,不过,这也给文本识别带来挑战。

比如在城市治理场景中,城市街道沿街商铺各类个性化的招牌,招牌颜色各异、招牌大小不一、随意变更招牌以及小广告粘贴等问题,这不仅影响市容市貌也存在安全隐患。紫光华智推出的街面OCR识别算法可准确识别不同招牌的文本和语义信息,提升城市智能化管理能力和效率,助力城市精细化管理。

而在大华股份针对文本识别技术的应用案例中,我们还看到了文本识别在在钢铁、能源、交通等行业的应用。比如在钢铁、能源领域,通过编号识别算法自动获取车辆、集装箱、钢卷等目标上的编号信息,助力高效管理;在交通运输安全管理领域,运用自然场景文字识别算法自动读取车身文字信息,智能筛选出重点管理车辆,以便针对不同车型采取不同管理方案。

又或者在医疗领域,帮助公司识别药品说明书,帮助公司快速构建药品说明书的信息库;在物流领域,通过文本识别技术快速完成各类单据自动识别,提效降本效果显著……文本识别技术可适用场景相当广泛,有了文本识别算法,也藉由机器之“眼”,让我们从此告别繁琐的手动输入低效率方式。

图片


文本识别技术的难点和挑战



文本识别应用的普及,得益于OCR(Optical Character Recognition)文字识别算法的日趋成熟,不过,从目前市场的文本识别应用情况来看,由于应用场景的多样性,文本识别也还面临着一些挑战:
  1. 扫描的单据往往存在虚线干扰、版面缺失、倾斜、暗光、扭曲、噪声等情况,定位难度大。

  2. 文字千变万化,例如字体、字号、颜色、笔画宽度等不固定,方向任意;小数点、近似英文数字、特殊符号、连接词、艺术字等,容易被漏检或误识别。

  3. 语言种类繁多,经常是中英文混合,多种语言混合等场景,识别难度加大。

  4. 表格单据经常存在盖章(印章覆盖文字)、错行(文字溢出表格单元,与表格线交叉)的情况,也造成文字识别干扰,极大影响识别准确率。

  5. 拍照上传的图片存在噪声、模糊、光线变化、形变、复杂背景干扰等问题,对文字定位和识别的准确度是巨大的挑战。

机器不同于人眼,尤其在现实场景中,字体设计、文本背板、语种以及外部的光线环境等各类因素都可能对机器识别造成干扰,而这也正是当前AI视觉企业在文本识别算法上需要攻破的技术方向。

当然,我们也看到了相关企业在算法研究上取得的进展。比如针对低质量图像、生僻字、艺术字的识别。

大华依托自研的“巨灵”人工智能平台,对识别算法进行深度改进,运用多尺度融合、跨层链接等先进技术,提高了算法对这类文本的识别效果;紫光华智则结合多尺度融合、注意力机制、多模型融合等先进技术及基础数据分析,对难例样本进行数据增强,实现了对图片像素低、质量差、艺术字体等识别效果的大幅提升;华为云采用了黑边处理、自动纠偏、去噪、图像自动旋转、多种二值化等方法处理图像,从而提高了扭曲、复杂背景、光照、模糊场景下的文字检测识别准确率。

在AI视觉企业的持续探索之下,文本识别算法也得以不断演进,而伴随着算法的日趋成熟,作为AI赋能千行百业的又一个典型,文本识别场景虽小,却大有乾坤!



图片

往期回顾




图片

后疫情时代,向混合型办公转型

图片

野生动物保护,AI大有可为

图片

小区电瓶车安全管理,AI视觉有办法


科技

  • 解析RSAC 2021
    解析RSAC 2021
    网络弹性产生的背景随着数字时代的高速发展,各种业务越来越多地依赖数字信息系统运行。与此同时,网络攻击手段越来越复杂,形成的网络威胁越来越大,造成的损失和影响更是惊人。2018年8月半导体龙头企业“台积...
    E安全
  • 亚马逊 90 亿美元收购米高梅;孙正义:东京奥运办了损失更大;上海迪士尼开启人脸
    亚马逊 90 亿美元收购米高梅;孙正义:东京奥运办了损失更大;上海迪士尼开启人脸
    外卖费率透明化座谈会在京召开,美团听取商户吐槽5 月 24 日消息,近日,由北京烹饪协会主办的「中小餐饮企业外卖费率透明化座谈会」在京召开。参加讨论的十余家商户,包括潇湘阁、晓寿司、美意天、四友青年这类...
    极客公园
  • 直播预告:《连线硅谷-无锡产业园前沿科技的探讨与应用展望》在线讲座
    直播预告:《连线硅谷-无锡产业园前沿科技的探讨与应用展望》在线讲座
    热点追踪 / 深度探讨 / 实地探访 / 商务合作在国内,未来3年将是我国工业互联网快速成长的关键期。在工业和信息化部印发的《工业互联网创新发展行动计划(2021-2023年)》中,也确立了未来3年我国工业互联网发展目...
    硅谷洞察
  • 想要随心所欲DIY你的专属云城?触手可及!
    想要随心所欲DIY你的专属云城?触手可及!
    “云生活” 已经悄然走入千家万户“云学习”、“云购物”、“云娱乐”也成为新常态……同时也有越来越多企业认识到“转向云端”的多种优势如优化成本效率、提升服务水平、推动业务模式创新及增强业务韧性等然而...
    科技人生
  • 两个项目入围终审
    两个项目入围终审
        本报讯 5月24日,记者从2021中国国际大数据产业博览会执委会办公室数博发布组获悉,新型商业查询工具“天眼查”项目和数据中心双层双联微模块项目入围数博会领先科技成果奖终审,最终获奖结果将于2021数...
    贵阳晚报
  • 比特币·魔戒·马斯克
    比特币·魔戒·马斯克
    马斯克戴上了魔戒,他能抵挡住诱惑吗?作者:冯诺编辑:陈书敏本文经授权转载自微信公众号:量子学派(ID:quantumschool)马斯克戴上了魔戒电影《指环王》中的人类英雄阿拉贡,这样评价九大「戒灵」:他们曾经...
    极客公园
  • 调查报告:全美成年人中有23%用过VR,Quest使用率占总体24%
    调查报告:全美成年人中有23%用过VR,Quest使用率占总体24%
    Esther|编辑自2012到2014年掀起一波VR风口,至今已经过去7年以上的时间。随着前几年VR一体机诞生,VR硬件和内容市场得到了肉眼可见的发展和推动。那么时至今日,已经有多少人用上了VR?VR在普通消费群体的渗透...
    青亭网
  • 腾讯已经秒杀三大运营商,放水养鱼或应适可而止
    腾讯已经秒杀三大运营商,放水养鱼或应适可而止
    | 科 | 技 | 杂 | 谈 |中国通信行业第一自媒体本文作者:张运来本文来源:C114通信网(C114-weixin)杂谈投稿邮箱:631255063@qq.com当前支撑我国5G争抢全球领先已经成为国家共识,在这种情况下,互联网公司支
    科技杂谈
  • 瞭望丨大数据“杀熟”的利益机制
    瞭望丨大数据“杀熟”的利益机制
    ◆ 注册成为某团购会员后,不仅外卖满减优惠力度降低,配送费更是不减反增◆ “刷脸越多,‘丢脸’风险越大。”◆ “一些企业有滥用数据的底气,在于大数据垄断,算法不透明发现难、举证难、认定难。”原题丨大...
    瞭望
  • 华为突放“利空”!千亿巨头被砸跌停“四个小伙伴”跌惨了
    华为突放“利空”!千亿巨头被砸跌停“四个小伙伴”跌惨了
    自从华为进入汽车赛道以来,华为投资汽车企业的传言不断。5月24日,华为发布声明称,华为不造车。至今为止,华为并未投资任何车企。未来也不会投资任何车企,更不会控股、参股。从二级市场来看,今日华为汽车概...
    车风云
  • 市场分析|1Q21全球Open RAN收入同比增长五倍
    市场分析|1Q21全球Open RAN收入同比增长五倍
    新闻导读2021年第一季度,Open RAN投资激增。Dell'Oro初步估计,Open RAN总收入同比增长了大约五倍。该调研公司目前预计2021年Open RAN收入将接近翻番。ICC讯 2021年第一季度,Open RAN投资
    讯石光通讯
  • 特斯拉:已在中国建立数据中心 将向车主开放车辆信息查询平台
    特斯拉:已在中国建立数据中心 将向车主开放车辆信息查询平台
      上证报中国证券网讯 据特斯拉官方微博5月25日消息,特斯拉已经在中国建立数据中心,以实现数据存储本地化,并将陆续增加更多本地数据中心。所有在中国大陆市场销售车辆所产生的数据,都将存储在境内。  同...
    上海证券报
  • OCR文本识别,场景虽小,大有乾坤
    OCR文本识别,场景虽小,大有乾坤
    AI赋能千行百业的口号如今正在逐步落地实践,普罗大众在日常生活的衣食住行之中也越来越多的感受到AI带来的智能和快捷。比如社区场景中出入口的人脸识别通道、社区智能垃圾分类、电瓶车禁入电梯系统;办公场景中...
    安全自动化
  • 工信部正以“四项工作”助推车联网产业蓬勃发展
    工信部正以“四项工作”助推车联网产业蓬勃发展
    “当前我国车联网产业呈现蓬勃发展的势头,但在跨行业协调、运营管理等方面还面临不少的新挑战,迫切需要各方面继续做好协同,凝聚发展核力,我们愿同大家一道探索实践车联网先导应用创新发展工作,推动我国车联...
    通信世界
  • 哪四大领域至今还被美日德垄断?
    哪四大领域至今还被美日德垄断?
    1工业软件领域中国目前最大的工业软件企业属于华为技术。但即使华为十分强大,但在设计产品时,仍然需要用到美国的三家软件公司Synopsys、Cadence、Mentor提供的EDA(电子设计自动化)软件工具。值得一提的是,美...
    OK智能制造
<< 6 7 8 9 10 >> 

公众号 • 安全自动化

  • 安全自动化微信号 : asmag001
  • 深耕中国安防市场,汇集全球安防产业资讯的主流行业媒体,a&s《安全&自动化》帮助安防企业厘清市场发展规律、探讨新技术的前进方向,以及提升企业品牌的认知度和市场价值。
  • 手机微信扫描上方二维码进行订阅
Flag Counter