谷歌Lookout完满货币识别功效,正不和都可以,折叠的也行
【新智元导读】今天,谷歌的Lookout使用步骤完成更新,完满了言语功效与一些天性化计划,如今可以识别食品、杂货、文件、货币等,为瞽者和视力受损者带来了福音。
杰克是一个视力停滞者。
市肆中外形相似的瓶瓶罐罐总是给他带来挑唆。想买沙拉酱却错拿了芥末,回抵家边吃边辣得堕泪的「案件」多次产生。
全天下估测有22亿人有视力停滞。为协助他们,同时也践行Google的职责之一——让天下上一切人都能广泛取得信息。
在2018年I/O开发者大会上,谷歌公布了Lookout。
Lookout logo
这是一款经过人工智能协助瞽者和视障用户的Android使用步骤。在一定范围内,Lookout能检测到人、物体以及扫描文本,然后对用户举行听觉提示。
就仿佛有一个陪护在你旁边,提示你看不见的统统~
用后置摄像头拍拍拍,用户就可以使用Lookout来检测和识别场景中的物品。
从前,Lookout还只范围于使用英语的美国。
今天,为了对运转Android 6.0或以上版本的2GB内存装备的支持,谷歌新增长了对四种言语的支持——法语、意大利语、德语和西班牙语,并将兼容性从Pixel智能手机扩展到其他装备。
除了添加了言语,Lookout还更新并完满了机动好用的五种形式:
?「新」食品标签形式(测试版)。
?「新」快速阅读形式。
?「快速阅读」形式。
?「货币」形式可以更快、更可靠地识别美钞。
? 探究形式协助识别周围信息。
使用更新的食品标签形式,除了扫描条形码外,还可以经过标签快速识别包装食品。然后屏幕阅读器可以大声地说「喊」出来。
Lookout改良的食品标签形式
「快速阅读」是另一种加强的形式。正如其名,它会大声朗诵信封和优惠券上的笔墨,乃至还能反朝向朗诵。这个形式可以捕捉更长的文本,让用户依照本人的节奏阅读,使用屏幕阅读使用步骤,大概手动复制粘贴文本到第三方使用步骤中。
短篇档更是不在话下。
更新后的Lookout不仅可以区分不同面额的钞票,还玩了一些「高难度」。比如能「看清」折叠着的10美钞,也可以从钞票的正面和反面识别。但货币标识现在仅支持美元。
重新计划的Lookout将之前全屏的形式选择器移到了使用步骤的最底下一行。用户可以在不同形式之间滑动,也可以选择使用屏幕阅读器来识别他们所选的选项,好比谷歌本人的TalkBack。
Google 的产物司理Scott Adams表现,依据瞽者与弱视用户的反应,Lookout如今为相机视图提供了更多空间,使用户可以更轻松地构架他们想要更多信息的目标。
「将这个使用步骤扩展到更多的人和装备,是我们努力于普及天下各地的信息,并与残疾人一同为残疾人提供有效的产物的允许的一局部。」
SIFT和OCR + N-Gram是传统盘算机视觉识别产物的常用办法。
两种办法都有着较为准确的读取信息才能,但缺陷是每个索引图像都必要多量存储(通常为每个图像10KB到40KB),并且前者关于光源等要素也要求较高。
比拟而言,Lookout基于神经网络的办法天生一个全局形貌符(即每个图像只需64字节),大大变小了存储需求。
Lookout体系由帧缓存,帧选择器,检测器,目标跟踪器,嵌入器,索引搜刮器,OCR,计分器和后果表现器构成。
内里架构
取得Result后,经过谷歌的文本主动转语音,用户就能「听到」手中拿的商品啦!
谷歌表现,将来的重点是改良言语支持,但尚未泄漏任何细节。
以为不但是视残者,总是忘带眼镜的大眺望眼们也可以思索思索……






