去掉唤醒词的难点其实是在人工智能方面,如果写的程序更加智能,能准确的判断出来人们所说的每一句话是不是和智能音箱在对话其实就可以了。
现在的智能音箱有一些为了解决每次都需要唤醒词,好几个都加入了连续对话的功能。
林奇调查发现,最早加入这个功能的其实不是在智能音箱上面,而是风暴影音的电视上面。
风暴影音的电视采用了语音控制,在找片源的时候用到了:
“我要找米国大片。”等人们说完,电视上面就会显示很多的米国大片,好多页。
“科幻的。”人们可以接着说,然后数据还在减少。
“漫威动画。”被筛选出来的数据再次减少。
“下一页。”然后显示的列表翻了一页。
“播放第三行第五个。”
至此,一个完整的交互才算是完成。
“不过这个是有明显的目的的,基本上唤醒电视就是为了找一个片,和智能音箱还是有所区别的。”林奇看到了风暴的宣传也意识到和智能音箱的区别。
“不知道现在的智能音箱是否借鉴了这个功能,也有了连续对话功能,不过有的需要一个特定的词语才能让音箱们进入到连续对话的功能。”
在调查的过程中,林奇发现了不仅仅唤醒词挺让人烦的,还有一个就是智能音箱就像一个鱼,他的记忆只有7秒。
比如人们说第二句话的时候,他自己不会思考和上句话建立联系。
比如:
“天狗精灵,我失恋了,心情不好。”
“主人,心情不好的时候,可以去看个电影,晒晒太阳,吃顿火锅,或者听一首音乐。”
“天狗精灵,我要听歌。”
“好的主人,已经根据你的喜欢为你推荐了几首音乐。”
“后来,我终于在眼泪中明白,有些人一旦错过就不在……”
智能音箱就开口唱了起来。
这首歌好不好听?当然好听。
但是适合心情不好的时候听吗?当然不适合,因为失恋导致的心情不好,可能更加严重,导致心情极度糟糕。
但是如果智能音箱能记住上次的内容,那就是别一种情形了。
“要取消唤醒词,内容最好是有连续性,不过连续性这里可以再做个市场调研,看看时间放在多少合适。”林奇一边思考,一边写下了对智能音箱的期许。
林奇在研究智能核心的时候,也给公司其他团队分配了任务。
第一个团队是语音识别团队。