lookout(谷歌Lookout完善货币识别功能,正反面都可以,折叠的也行)

谷歌Lookout完满货币识别功效,正不和都可以,折叠的也行

【新智元导读】今天,谷歌的Lookout使用步骤完成更新,完满了言语功效与一些天性化计划,如今可以识别食品、杂货、文件、货币等,为瞽者和视力受损者带来了福音。

杰克是一个视力停滞者。

市肆中外形相似的瓶瓶罐罐总是给他带来挑唆。想买沙拉酱却错拿了芥末,回抵家边吃边辣得堕泪的「案件」多次产生。

全天下估测有22亿人有视力停滞。为协助他们,同时也践行Google的职责之一——让天下上一切人都能广泛取得信息。

在2018年I/O开发者大会上,谷歌公布了Lookout。

Lookout logo

这是一款经过人工智能协助瞽者和视障用户的Android使用步骤。在一定范围内,Lookout能检测到人、物体以及扫描文本,然后对用户举行听觉提示。

就仿佛有一个陪护在你旁边,提示你看不见的统统~

用后置摄像头拍拍拍,用户就可以使用Lookout来检测和识别场景中的物品。

从前,Lookout还只范围于使用英语的美国。

今天,为了对运转Android 6.0或以上版本的2GB内存装备的支持,谷歌新增长了对四种言语的支持——法语、意大利语、德语和西班牙语,并将兼容性从Pixel智能手机扩展到其他装备。

除了添加了言语,Lookout还更新并完满了机动好用的五种形式:

?「新」食品标签形式(测试版)。

?「新」快速阅读形式。

?「快速阅读」形式。

?「货币」形式可以更快、更可靠地识别美钞。

? 探究形式协助识别周围信息。

使用更新的食品标签形式,除了扫描条形码外,还可以经过标签快速识别包装食品。然后屏幕阅读器可以大声地说「喊」出来。

Lookout改良的食品标签形式

「快速阅读」是另一种加强的形式。正如其名,它会大声朗诵信封和优惠券上的笔墨,乃至还能反朝向朗诵。这个形式可以捕捉更长的文本,让用户依照本人的节奏阅读,使用屏幕阅读使用步骤,大概手动复制粘贴文本到第三方使用步骤中。

短篇档更是不在话下。

更新后的Lookout不仅可以区分不同面额的钞票,还玩了一些「高难度」。比如能「看清」折叠着的10美钞,也可以从钞票的正面和反面识别。但货币标识现在仅支持美元。

重新计划的Lookout将之前全屏的形式选择器移到了使用步骤的最底下一行。用户可以在不同形式之间滑动,也可以选择使用屏幕阅读器来识别他们所选的选项,好比谷歌本人的TalkBack。

Google 的产物司理Scott Adams表现,依据瞽者与弱视用户的反应,Lookout如今为相机视图提供了更多空间,使用户可以更轻松地构架他们想要更多信息的目标。

「将这个使用步骤扩展到更多的人和装备,是我们努力于普及天下各地的信息,并与残疾人一同为残疾人提供有效的产物的允许的一局部。」

SIFT和OCR + N-Gram是传统盘算机视觉识别产物的常用办法。

两种办法都有着较为准确的读取信息才能,但缺陷是每个索引图像都必要多量存储(通常为每个图像10KB到40KB),并且前者关于光源等要素也要求较高。

比拟而言,Lookout基于神经网络的办法天生一个全局形貌符(即每个图像只需64字节),大大变小了存储需求。

Lookout体系由帧缓存,帧选择器,检测器,目标跟踪器,嵌入器,索引搜刮器,OCR,计分器和后果表现器构成。

内里架构

取得Result后,经过谷歌的文本主动转语音,用户就能「听到」手中拿的商品啦!

谷歌表现,将来的重点是改良言语支持,但尚未泄漏任何细节。

以为不但是视残者,总是忘带眼镜的大眺望眼们也可以思索思索……

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发
火提提的头像-趣拿体育

昵称

取消
昵称表情代码图片