一、语音识别(1 / 1)

我们先来看一段对话,一位顾客正在电话预约美发服务:

店员:“您好,有什么能帮您的吗?”

顾客:“你好,我想为客户预约一个女士美发。日期是5月3日。”

店员:“好的,请稍等。”

顾客:“嗯哼?”

店员:“请问您想预订哪个时间段呢?”

顾客:“中午12点吧。”

店员:“我们12点已经约满了,最近的时间是下午1点15分。”

顾客:“那10点到12点之间呢?”

店员:“这得看顾客想要什么服务了。她需要哪种服务呢?”

顾客:“只要女士理发就行。”

店员:“好的,10点可以。”

顾客:“那就10点了。”

店员:“好的,请问那位顾客的名字是?”

顾客:“她的名字是Lisa。”

店员:“好的,那就和Lisa在5月3日上午10点见咯。”

顾客:“没错,很好,辛苦啦。”

店员:“好的,祝您愉快,拜拜。”

聪明的读者一定猜到,既然我们要讲人工智能,这段话里肯定有一个人是机器人。那么到底谁是机器人呢?是不是很难猜?其实,这位打电话预约的顾客正是“机器”。或许有较真的读者说:“这不公平,因为打电话是要听语气、腔调的,不能只凭文字来判断。”确实如此。但是因为这本书没那么“智能”,没办法自动播放给各位读者,我们只能说说在现场亲自听到这段对话的观众们的反应。这段简单的预约电话是2018年谷歌I/O大会现场演示的视频之一,视频结束后引起了台下的阵阵欢呼,在这位“人工智能助理”发出“嗯哼”的声音时,大家都会心地笑了,因为这位助理已经开始掌握了人类的语气,模仿得惟妙惟肖,而且接电话的店员也完全没有发现对方是人工智能。

这位人工智能的名字叫做谷歌Duplex。我们知道苹果手机里的Siri说话的时候还是像机器人,和人类的口语还有着显著的差别,但是谷歌Duplex却能做到语音、语调和人类并无二致。不仅如此,在店员提出1点15分才有时间的时候,它并未接受提议,而是进一步提出了新的方案,最终完成了预约。对于原来只能用陈述句进行回复的语音助手来说,这种应变能力非常难得,已经是非常大的突破。而这一突破也吻合了谷歌助理的设计宗旨:为用户节省时间,为用户把事情搞定(也就是“get things done”)。

一款内置谷歌助手的10英寸的联想智能显示器

谷歌Duplex的功能还不限于电话预约,它在完成对话后,谷歌助手还会在日历上记录事件并提醒用户。虽然在面对非常复杂的语句时,谷歌Duplex还是会有一些错误率,但它在技术上已经有了很大的进步。能让一个机器这么流畅地和人类交流,到底要攻克什么样的难关,并运用到什么样的技术呢?谷歌的CEO桑德尔·皮蔡指出,谷歌Duplex是三大技术的融会贯通,即自然语言理解技术、深度学习技术和语言转文字的技术。

以自然语言理解技术为例,人类的自然行为是很难建模的,以“延迟”为例。试着思考一下,我们和其他人对话的时候,什么时候会产生“延迟”,什么时候又要“脱口而出”?比如,当别人对你说“你吃了吗?”的时候,你的反应应当是迅速的、不假思索的,并很快就给出一个简短的回复:“吃了”或者是“没吃”。但是,当别人问你:“你对未来有什么规划?”面对这种问题,你就需要一定的思考时间。当别人问:“37892+58725553是多少?”你可能需要更多的思考时间。这对于我们人类来说本来是一件再自然不过的事,但是对于机器来说,为了模拟人类的交流行为,就需要判断哪些情境是需要延迟的,还要进一步判断具体延迟多少时间较为合适。当人工智能检测到需要“脱口而出”的情境,他就会采用更快,但是精度更低的模型,最极端的情况下,系统的延迟可以仅仅不到100毫秒以内!而当人工智能在回答一个复杂的问题时,它就会适当增加一些延迟,有时还会连带很多语气词,比如“嗯……”“这个……”等。当然,这个“复杂”是对人类而言的“复杂”,比如刚才那道数学题,这对机器来说再简单不过了,但它还是要“装作”遇到了难题,加长延迟的时间,这样才更像一个“人”。

有了像谷歌Duplex一样的语音助手,人们的生活会有怎样的变化呢?有人会觉得很害怕,人工智能语音如果和真人说话没有区别了,那人类不是很容易被人工智能玩弄吗?不过,谷歌表示,技术透明性十分重要。他们发布了一条声明:“我们在谷歌Duplex的设计中内置了身份披露功能,会确保谷歌Duplex系统适当地表明自己的身份。我们在I/O大会上演示的是一个初期的技术demo,后续把这项技术放入到产品中时,我们会采纳用户的反馈。”这一声明让人放心不少,至少将来我们在接电话时,知道自己在和人说话,还是在和人工智能说话。

那么人们能从这项技术里得到什么好处呢?首先对于工作繁忙的人来说,就省去了打电话订座、询问的时间,其次,对于有“社交恐惧”、害羞的人来说,有了语音助手,就不用亲自与餐厅、发廊等陌生的工作人员进行交流了。如果你在异国他乡,语言不通,“精通”多国语言的语音助手就会成为你的“贴身翻译”。而对于聋哑等残障人士来说,语音助手无疑是帮了他们的大忙。当然,这种语音助手对于商家也有一定的帮助,它可以提醒客户预定的时间、地点,万一客户临时有事来不了了,预约也可以简单地取消,商家的时间就能腾给别的客人了。