您的位置:首页 > 智能设备

百度大脑OCR技术加持白描App:让AI成为视障者的眼睛(百度ai ocr识别)

发布时间:2022-07-10 16:13:29  来源:互联网     背景:

  现实中,你可以轻松无障碍的阅读各类平面印刷文字以及身边的一切,或许你未曾想过,视障人群该怎么办呢?

  统计数据显示,中国大约有1700万的视障群体,相当于每100个人中就有超过1位是视障人士。但我们在日常生活中却很少见到他们,那是因为视障群体在日常生活中会有诸多不便,出门对他们而言危机四伏。AI有可能成为他们的“眼睛”吗?

科技的进步,祖国的强大!

  成为他们的眼睛:白描App与视障群体的故事

  如果手机上只能有一款App,你会选择哪一款?视障人士安之坚定地给出了答案——白描。因为白描App让视力不佳的他用另一种方式“看”清世界,文字不再遥不可及。他用白描“看”过优美的诗篇,“听”过动人的乐章,甚至在独自上楼看不清所在楼层时,白描也准确地将答案告诉了他,将他从窘境中解救出来。一个App让曾经望“字”兴叹的他更加勇敢的走出家门,参与丰富多彩的生活。

  “白描是我的眼。”同为视障人士的小杰从不吝啬对白描的夸赞,甚至直言白描是视障伙伴赖以生存的工具。白描帮助他解决了生活的难题,从各类电器、数码产品、药品说明书到各种洗漱用品包装都可以识别,他还可以给可爱的小侄女讲绘本故事。如果没有白描,这种事情是他难以想象的。

百度ai ocr识别

chrome已保存的密码

  白描是如何做到被视障群体视若珍宝的呢?白描App是一款简洁高效的OCR文字识别软件,不仅简单好用,而且设计美观,可以轻松实现“拍照-识别文字-朗读结果”一系列流程。同时,白描适配了手机无障碍辅助功能,视障者可以在手机上非常轻松地操作。

百度ai ocr识别

讯飞翻译笔S10功能介绍

  “白描”这个词本意是一种文学写作手法,鲁迅先生曾把这种手法概括成十二个字,即“有真意,去粉饰,少做作,勿卖弄”。白描App的开发者陶新乐正是这样的一个人,他观察到了不同人群的实际需求,用虚拟世界的代码满足了现实世界有需求的人,让他们的生活变得更加美好、便捷。

  白描App开发者的心路历程:切入不同场景、优化产品细节

  你或许很难想象,作为一名个人开发者的陶新乐,他最早开发白描App是为了女朋友。陶新乐的女友热爱阅读,经常做读书笔记。为了减轻抄录压力,她尝试使用了当时市面上的各类文字识别软件,但她发现:有的软件操作流程繁琐,有的费用高昂,有的则识别不准确……看到女朋友痛苦不已,陶新乐当下决定亲自做个体验好、效果佳的OCR文字识别工具给女朋友使用,并且很快付诸了行动。这或许就是开发者独有的浪漫。

  然而,一款App的开发过程是充满未知与挑战的。在当时的条件下,开发一款具有OCR功能的软件,面临的一个巨大挑战是:如何让文字识别的又快又准。因此,他调研了市面上提供此服务的厂商,并对不同厂商的产品进行了对比,尝试识别不同场景的图片,找出识别效果最好的那个。于是他发现,百度大脑AI开放平台的OCR技术能力和使用体验都是最好的,尤其是识别准确度更领先于其他厂商,所以在2015年他就毫不犹豫的选择了百度OCR技术,并一直使用至今。

  但是优秀的底层技术并不意味着全部,百度大脑OCR已提供近60项技术能力,好的技术也需要应用于匹配的场景才能发挥更大的价值。

  于是,陶新乐首先对白描的使用场景做了细分研究,比如:学生上课拍PPT提取文字记笔记、企业员工把纸质合同扫描成电子版并且制作PDF、把纸质表格转成Excel电子版、翻译图片上的文字、老师拍摄并识别试题后对试题再加工、律师用来提取纸质文书上的文字等等。特别的是,视障人群特殊的使用需求,他都有关注和调研。

Galaxy M32

鲨客拖把好用吗

百度ai ocr识别百度ai ocr识别百度ai ocr识别百度ai ocr识别

  考虑完用户的使用场景之后,再者就是对产品的不断打磨。当时,图片转文字常常会有识别错误的情况发生,为了弥补这一问题,在识别之前,白描APP会进行一些技术上的处理,比如图像压缩如何保证清晰度又尽量减小图片大小;如何在进行长图自动裁剪时,检测到长图的空行位置自动裁剪,且不会裁到文字;如何针对文章进行自动分段,更便于读者阅读等等。这些精细化的产品设计保证了图片的清晰度,让文字信息更易于被识别。而在识别之后,白描的校对功能,可以让识别结果与原图显示在同一界面上,方便用户快速找到需要修改的地方,在此基础上进行编辑。

  依托百度优秀的深度学习算法和基于海量优质数据的预训练模型,以及白描App的图像预处理能力,最终实现了关键字段识别准确率99%+。看到女友使用白描时绽放的笑颜,陶新乐觉得一切都是值得的,他也希望更多人能够享受到这份快乐。

  成功的背后:用“匠人”之心雕琢产品之光

  程序员出身的陶新乐在做产品这件事上一直怀揣一颗“匠人”之心。陶新乐提到,AI在落地的过程中会遇到很多的困难,很多时候都是一边踩坑一边向前走。当遇到无法解决的问题时,就需要不断学习,攻坚克难。

  百度大脑OCR技术与无数像陶新乐一样的开发者并肩同行。作为最早规模化应用的AI技术之一,OCR技术的产业级应用持续取得突破。百度大脑OCR技术可提供多场景、多语种、高精度的文字检测与识别服务,多项ICDAR指标居世界第一,已广泛适用于远程身份认证、财税报销、文档电子化等场景,为企业降本增效,为用户带来更智能化的应用体验。

百度ai ocr识别

sony wf xb700测评

  当然,AI技术的应用落地,除了需要有百度大脑这样提供领先AI技术能力的平台外,还需要更多像陶新乐这样的开发者们,发挥想象将AI应用在更多真实场景中,满足不同用户群体,甚至是容易被忽视的残障人群的需求,让社会更有“AI”。同时,为了降低独立开发者和企业自主训练OCR文字识别模型的门槛,百度大脑推出业界首个EasyDL OCR自训练平台,提供零门槛、定制化、低成本的一站式OCR模型训练服务。保证高准确率的同时,满足多元化的场景需求,并有效保障数据安全。

  在这个科技为大众生活赋能的时代,产品的设计更是一种普惠理念的输出。已拥有超过800万用户的白描App,已经成为业界的口碑产品。相信,未来还将有越来越多的开发者通过百度大脑AI开放平台提供的AI技术与服务,创造出更多与场景相结合的智能应用,让更多人生活更便捷、更美好。

rog幻15新品


返回网站首页

本文评论
为iPhone 15做准备 英国苹果零售店提前一年告知员工不得休假「苹果暂停每周回办公室工作3天」
  IT之家10月10日消息,据MacRumors报道,英国至少有一家苹果AppleStore预计明年秋季会有不同寻常的高客流量,预计这一时间将包括iPhone15/Pro系列的推出。  报道称,苹果在英...
日期:10-11
华为mate40 pro5g和华为p50pro_华为Mate 40手机5G版立减2000:国庆节前有好价
华为Mate 40目前依然值得入手,而且全系目前十一国庆节假期前有着不错的价格,目前5G版本立减2000元,华为的5G旗舰机将跌破6000大关,这也是目前华为旗下性能最强的5G直屏机型了,虽...
日期:09-28
神奇苹果保护套:既是打火机又是开瓶器「苹果防风打火机」
 正常的iPhone保护套也就只能保护手机,然而你有没有期待过更多功能,比如开瓶器?ZVE公司终于将你的想象变成现实,最新版本在四角增加TPU避震材质,十分贴心。不仅如此,这款一款手...
日期:07-28
ios16顶部电池电量显示百分比「iOS 16新增电量显示百分比功能 但iPhone 11等机型不能用」
来源:中关村在线线上商城,线下超市相结合微众银行的核心功能9月13日消息,今天苹果iOS系统正式开始推送,身边一大批苹果iPhone用户都进行了更新。今天苹果官方确认:iOS 16电量显...
日期:09-15
iPad mini上线立即售罄 发货日期已推迟「ipadmini下架时间」
  10月29日消息,据外媒报道,在苹果官网开启iPad mini预定之后的35个小时内,黑色Wi-Fi版16GB iPad mini即售罄。而在苹果官网当日开售的几十分钟之后,白色Wi-Fi版iPad mini就瞬...
日期:07-25
Android 13第3个公测版发布 比Android 12提前2个月达到平台稳定
  Google 今天推出了第 3 个 Android 13 的公测版本,并表示已经达到了“平台稳定”(platform stability)。这表明 Google 已经锁定了主要更新,接下来的工作就是打磨细节,修复...
日期:07-16
amd r9 7950x处理器售价_AMD新款R9 7950X处理器提前现身闲鱼 售价5999元
IT之家 9 月 20 日消息,AMD 锐龙 7000 系列于 8 月底发布,目前还没有正式开售。但是,国内二手平台闲鱼的电脑玩家又提前拿到了货,并晒出 R9 7950X 实物,售价 5999 元。中国第一家...
日期:09-24
美版iphone14没有sim卡槽国内能用吗「iPhone 14部分没有SIM卡槽 国内没法用」
苹果iPhone 14已经在国内开售,不少用户已经拿到了真机,而从iPhone 14系列开始,北美等地区的SIM卡槽正式的取消,在国内无法使用,也就是说今后国内的市场中将不会出现某些地区版本...
日期:09-25
曾在旗舰机上只用高通芯片的谷歌变了:Pixel 7搭载Tensor芯片_Pixel 设备
  6月1日消息,据phone arena报道,谷歌Pixel 7和Pixel 7 Pro两款高端旗舰都将搭载第二代Tensor芯片,并预装Android 13操作系统。  爆料指出,Tensor芯片由谷歌和三星联合研发...
日期:11-10
倍思氮化镓 三星45w_三星充电器 45W 采用氮化镓技术,内置纳微定制芯片
  ITBEAR科技资讯4月8日消息,三星今年的新机 S22+/Ultra 支持 45W 快充,官方发布了新的 45W 旅行充电器,据充电头网的最新消息,三星45W旅行充电器EP-T4510采用了第三代半导体...
日期:07-14
开服第一天,就登上了App Store榜首,这款二次元手游好玩吗?「日服app手游排行榜2018」
9 月 26 日刚开服一天的游戏就冲上了 App Store 免费榜的第一名?顺便还拿下了 TapTap、B站等安卓渠道的下载量第一。好家伙,小发已经很久没见过一个纯纯的二次元放置类养成系...
日期:10-09
三星正优先开发适用于2024年款iPad Pro的新型OLED屏幕「三星14.6英寸ipadpro全网通5gwifi」
IT之家 12 月 22 日消息,援引韩媒 The Elec 报道,三星正优先开发用于 2024 年苹果 iPad Pro 的专用 OLED 屏幕。报道中指出这种新型 OLED 屏幕采用双层串联(two-stack tandem)的...
日期:12-23
华为智能手表新款什么时候发布_华为10月还有新品发!4G折叠屏、赛博版智能手表来了
  9月6日,阔别两年的华为Mate 50系列正式发布,新机发售后受到诸多消费者抢购,其中昆仑玻璃版更是一机难求,而RS保时捷版黄牛更是一度加价至2万元左右。  值得一提的是,华为在...
日期:10-27
2021ipad pro会升级mac os_消息称苹果正在M2 iPad Pro上测试MacOS简化版
  爆料者;@Majin Bu 称,苹果正在对 iOS 17 的 Messages 应用程序进行大规模重新设计。除此之外,他还表示苹果正在为全新的 M2 款 iPad Pro 专门适配一个特殊版本的 macOS。...
日期:10-26
twitter会被罚款吗_推特合规团队无人可用 遭调查和巨额罚款风险激增
12月3日消息,据两位知情人士透露,在一连串裁员、辞职潮中,推特赖以遵守监管机构相关规定的两个关键团队突然陷入无人可用的窘境,这让这家社交媒体巨头遭到调查和巨额罚款的风险...
日期:12-12
超威电池发布会「品牌势能爆发,绽放高光时刻!超威打造电池行业顶尖科技盛宴」
(原标题:品牌势能爆发,绽放高光时刻!超威打造电池行业顶尖科技盛宴) 日前,超威集团举行2022年度新品发布会暨超威超能1亿只电池下...
日期:09-02
苹果将于2023年中期开始在越南生产MacBook「2021年3月份苹果会发布macbook吗」
集微网消息,随着中美之间的技术紧张局势升级,苹果将继续努力将其生产基地从中国转移出去。据《金融时报》报道,苹果计划明年首次将部分MacBook生产转移到越南。知情人士称,苹果...
日期:12-27
oppoa17什么时候上市_OPPO A17 手机发布:搭载联发科 Helio G35,仿皮革后盖,约 927 元
  9 月 26 日消息,OPPO A17 手机今日在马来西亚发布,搭载联发科芯片、大电池和双摄像头,主要卖点是具有仿皮革质感的后盖。  该机搭载联发科 Helio G35 处理器,4GB + 64GB...
日期:09-28
骁龙8+立下大功!陈劲晒摩托罗拉Razr 3续航:三天电量还剩大半「摩托罗拉razr续航能力」
  最近,骁龙8+机型犹如雨后春笋一般不断的发布、预热,据此前消息,摩托罗拉也将于最近一段时间推出对应新机,甚至是一次性两款。  根据爆料显示,摩托罗拉接下来的骁龙8+新机分...
日期:07-30
消息称一加正开发旗下首款折叠屏手机,与 OPPO Find N 类似_一加和oppo find
  4 月 9 日消息,据 pricebaba 报道,从爆料者 Yogesh Brar 处获得的消息,一加正在开发旗下首款折叠屏手机,类似近期推出的 OPPO Find N。中国健康行业十大领军品牌惠普台式机w...
日期:07-14