苹果语音控制:让舌头和鼠标一样精确

产品 ·

  • 9
  • 37
点击这里,阅读 Engadget 原文

“打开相册。向上滚屏,显示十三号图片。”

多年来,苹果一直在广告中突出其产品的使用方便性,在 NBA 总决赛第 5 场比赛中连续播出一分半钟的广告效果尤为明显。一个坐在轮椅上的人——他既是残疾人事务倡导者也是一位户外爱好者——向 iMac 发出了上述指令。几乎没有任何延迟,电脑迅速执行了它被告知的任务。

新版本的 macOS 并不只是为用户降低了点击鼠标的次数,它让用户不必使用声控的转换装置与设备进行交流。这就是更新后的语音控制系统的神奇之处:通过正确的语音指令组合,你可以像使用手指或鼠标一样精确地操控 Mac、iPhone 或 iPad。 (苹果早期也推出过类似的语音控制功能,在旧版本的 iOS 上允许基本的设备交互, 但现已被苹果弃用。)

更值得称道的是,该语音控制系统会直接并入到苹果即将推出的 macOS、iOS 和 iPadOS 版本,没有额外的软件介入,系统的公开测试版预计将于今年夏天发布。


类似的声控工具其实并不少见;Windows 10 也有自己的语音控制系统,尽管它需要更多繁琐的系统设置,但同样表现出色。除此之外,通过将设备学习模块的不断缩小,谷歌将发布一款 Android 版本的语音识别系统,该版本几乎可以同步地响应谷歌助手的指令。广泛来说,智能家居设备和虚拟助手的兴起使得人们与设备交流的想法变得日益强烈。无论是为了帮助更多用户使用他们的产品,还是仅仅出于简便性的需要,语音控制设备的使用正变得越来越普遍。

对于像广告中那些患有运动障碍的人来说,这着实是个好消息,这意外着他们再也不会在使用传统电脑和智能手机时面临因自身障碍带来的不便。

“无论你有运动障碍,还是忙得不可开交,语音指令等辅助功能在很长一段时间内都让所有设备用户的生活变得更加简单轻松,” 美国残疾人组织对外事务主任 Priyanka Ghosh 这样说到。“看到苹果在这一领域的不断进步,和技术发展对社会联结和生产力障碍的持续消除,我感到由衷的喜悦,同时我想这也应该会帮助解决就业障碍。”

语音控制系统的工作方式非常简单:如果你正在使用 iOS 设备,当软件接收语音指令时,你会看到一个微小的蓝色麦克风亮起。(平时它被默认设置为侦听状态,除非你设置在不查看屏幕时拒绝设备对你的语音进行录制。) 而在 Mac 上,将会显示一个小窗口以确认你的电脑可以听到你的声音,并拼写出你的语音指令,以便你判断它是否正确理解了你的意图。

语音控制的智能程度取决于系统组件的粒度。苹果表示其语音系统建立在许多支持 Siri 的基础智能算法之上,因此它足以用于启动应用程序和将语音转录成文本等操作。该系统还可以识别菜单项和对话框提示的名称。例如,你可以下达语音指令“点击继续”以接受某应用程序的服务条款。除此之外,你还可以下达“显示数字”的语音指令,该系统会附加一个数字到屏幕上的每个应用,你可以只说出数字以选择任何你想打开的应用。


尽管发展迅速,语音控制系统的智能化依然还有很大的进步空间。不知出于何种原因,语音控制无法用数字正确标记地图上的图标或其他地点,虽然你可以用显示网格的方式来代替。该网格的每个段都标有一个你可以选择的数字;完成指令下达后, 系统会显示另一个网格,该网格会显示屏幕特定部分的放大视图以及你可以要求与之交互的更多数字。在语音控制系统的细微控制选项和它对移动端或其他操作系统的基础理解之间,实际上没有什么可以避免语音指令的传达。

对语音控制唯一实质性的限制是系统对首选语法结构的适应所需的时间。从我所看到的引导演示中,语音控制系统可以轻易处理用户随意下达的指令,但我想它需要一段时间来适应完成某些指令所需的冗长的指令字符串。(用户其实可以将定期需要执行的任务创建为宏指令以简化操作。)

然而, 与没有使用精细电机控制的现代信息处理工具耗时费力的过程相比,语音控制系统似乎值得人们为其提供可适应的语音指令。请记住: 此功能可以在每台运行最新版本的 iOS、iPadOS 和 macOS 的设备上使用。语音控制广泛的覆盖范围和即时效用的潜力帮助我们提高了生活质量。而你只需更新苹果设备上的软件,就可以将这一切变为现实。

作为苹果下一轮软件发布的一部分,这项功能几个月后才会正式发布,但现在还是有一些潜在的注意事项值得用户牢记。在设备桌面上使用语音控制时, 电源并不是真正的问题所在,笔记本电脑和 iOS 设备也是如此。(目前苹果还没有就语音控制对电池寿命的影响进行任何说明。) 就现在的情况看来,真正的问题在于并不是每个应用程序都能与语音控制完美兼容。

开发人员在制作软件时可以设置程序的可访问性,让设备上的应用程序都正确标记在代码中,这样语音控制系统就可以识别并访问这些程序。遗憾的是,苹果并没有就那些无语音控制访问权的应用程序提出解决方案,这也导致了部分程序无法响应语音控制的指令。


虽然语音控制目前在技术上作为辅助功能存在,但不难看出随着时间的推移它将变得更加主流。在一段有关该功能的简短演示中,语音控制系统毫不迟疑地执行了苹果发言人下达的指令任务,我不禁想象自己将来也可以通过语音控制懒洋洋地指导我的电脑以机智的回复来回应推文。毕竟苹果早期展示的一些辅助功能如今已经得到了广泛的应用,例如全面屏上的虚拟主屏幕按钮代替了旧版 iPhone 的实体按钮。

人们不禁要问:语音控制能否超越其本身的利基地位,并改变我们在未来使用 iPhone 的方式,或者作为功能更强的 Siri 的一部分? 正如我前面提到的,得益于谷歌智能助手的显著改进,谷歌也将在自己的设备上实现即时响应语音指令。但目前对于这一切的答案还是“或许可行”。

“我认为我们开发语音控制的主要任务是确保语音指令只作为使用设备的一种选项”, 苹果全球无障碍项目高级总监莎拉·赫林格说到,“但我们希望了解人们如何使用它,更重要的是,当我们为获得收益对语音控制进行开发的同时,实际上也为大众提供了更好的产品。”

苹果似乎非常乐意去静心观察人们如何在其不同的设备上使用语音控制,如果大量无残疾障碍的用户认可并接受这一功能,那很可能意味着苹果将改变现在的做法。但是,即使这种情况不会发生,在其新的软件更新中加入语音控制仍然是苹果公司有史以来针对辅助功能最大规模的举措之一。现在只需要静候 iOS13、iPadOS 和 macOS Catalina 的完成,人们便可以开始体验语音控制带来的快捷生活。
  • 举报
快给朋友分享吧!
收藏
11人已收藏
评论列表(已有37条评论)
热门评论
最新评论
更多评论
取消评论