目前与机器人的语音交互技术还只限于简短的对话,而且需要不停的唤醒。大部分是人类说话(还不能太长),而让机器人作简短的回应,但要做到真正的较长话语交流还是很难达到的。但这样的情况可能很快就会被打破,其终结者就是微软的科技:全双工语音交互感官。这项科技有何特点或有何特别的地方呢? 此技术与以前的连续语音识别不同,它可以预测到人接下来会说出的内容从而实时生成回应并控制对话的节奏。这样的话,语言技术在与人交流对话时及时感知并预知人将会说什么,并且实时的生成对应的话语,以便于与人的思维接上,从而产生与人逻辑相应的对话。据称微软已经把这项技术产品化了,就是在微软的小冰全球中实现。 这项技术在亚洲有两个国家拔得头筹进行尝鲜应用。一个就是中国,在目前的中国科技馆的小冰电话亭得到应用,接下来是与小米公司合作在米家YeeLight语音助手的硬件产品中植入该技术。另一个就是日本的语音系统小冰凛菜中应用并实现直播平台落地。 这项全新的全双工语音交互感官让微软在语音交互领域走在了领跑者的位置,不久也许会有更多的智能硬件用到这样的技术。而这项技术的应用看来有很广阔的市场,人与机器人的对话真的会变成像人与人的对话那样自如吗?如果变为这样,人们的生活方式也许会有非常大的变化。孤独的老人有了说话的对象,交往的对象也许不是人而是机器就像活的性爱机器人一样让人喜爱,那些目前还需要人来招呼的岗位也许不久的将来全会变成人。这样的变化是否是人类期望的呢?微软的全双工语音交互感官科技在微软小冰中的应用,迈出来第一步。 |