从双十一99元抢智能音箱聊语音识别 真没那么简单!

2017-11-11 00:15 TNT A+

  【PConline 杂谈】99元抢天猫精灵X1,双11答题抢红包,这些你全部参与了吗?随着双十一脚步逐渐临近,各种优惠券满减活动让人眼花缭乱无所侍从,精打细算摸清套路的小伙伴只等到时全力出击,而数学体育老师教的笔者这会暂且脑袋空空看着电脑两眼发懵。

asa

3

  且不说满减、优惠券、膨胀金的“套路”,回到我们这次要聊的话题:语音识别。随着苹果WWDC宣布即将发布HomePod,一时智能音箱风头无两,它是未来家庭智能家居控制的超级入口?我们无法定论,毕竟谁也保不准盒子、路由器、电视机甚至是机器人半路再杀出(为什么有机器人的份,看看亚马逊Echo触屏版,对比如今国内目前主打“早教”的儿童机器人,是不是相差无几?如果“早教”机器人后期能够软硬件升级,不就……)。

2

  至于为什么从天猫聊起“智能语音识别与控制”,原因当然还是阿里实在是太会利用机会。阿里拥有自己的智能平台AliGenie,它包含内容广泛,其中就有好比亚马逊Alexa,苹果Siri的听懂语音指令实现智能家居控制、音乐播放等的助手。

fffaa

  99元抢天猫精灵X1配合答题抢红包,阿里不仅通过活动给用户分派了红包,还锻炼了系统在口音识别方面的能力,同时智能音箱促销加速阿里进入智能家庭,布局智能家居系统,一套组合拳一箭三雕(当然或许不止三雕),堪称漂亮。

xXX

  相对阿里的自家联合主动出击,百度、腾讯等表现虽称不上低调,但也动作不小。

  思科推出首个用于会议的语音智能助手Spark Assistant;具备语音识别数据累积的搜狗在美上市;科大讯飞以“以人为本A.I.赋能”主题,重点发布了讯飞“超脑计划”的最新进展和讯飞人工智能技术面向教育、客服、医疗及家庭等场景的产品和解决方案;还有下周百度开启大会讲述布局智能家居方面的计划。

1

  或许不少网友体验过Siri等语音系统,觉得水平太低根本不够看。智能音箱?应该叫智障音箱吧!然而语音识别能达到目前这个程度,已经有了不小的进步。

ASDA

  语音识别并没有想象中简单!语音识别可以简单理解为,把声音分析然后切成帧,再把帧识别成状态(难点),把状态组合成音素,把音素组合成单词,只要知道每帧语音对应哪个状态,那么语音识别的结果也就出来了(注:仅为容易理解,因此解释得并不够严谨)。

sss
据说:潮汕话说普通话“买、买、买”是表达“不要、不用了”

  而让语音识别头疼的是,首先是地区口音,美式英语与英式英语倒还好,但无论国内国外,你小镇里我这村和隔壁村口音就可能不同,而这样带有口音的村镇在各个国家数量之庞大,就别再说中国还有粤语、闽南语、潮汕话、客家话等系列语言了。

  其次说话的逻辑与语气词的运用,口语不同于书面,我们正常交流时语序不会规规矩矩一板一眼,主谓宾对调,英语中间插入个FUXK,中文拖尾来点“嗯”、“呃”,踌躇时候来点“这个”、“那个”……系统暂且跟不上。

4

  最后相同的话,夹杂的情绪不同,重音所在单词不同,它表达出来的意思也将完全不同:“I have never say he stolen my moeny!”。重音在“I”,“说他偷我钱的人不是我”;重音在“he”,“我没有说过偷我钱的是他”;重音在“my”,“我没说过他偷的是我的钱”……所以,尽管语音识别真的太难了!

xxxx

  人类大脑具备860亿神经元,其中有将近500亿神经元用在思考与计算,目前计算机投入使用的神经元只有几千万。“亿”和“千万”明显就不在同个数量级,更何况语言作为人类的高阶技能,它从听、说、读、写、看以及学习的知识里面转化出来,目前机器面对复杂的情况,如开放性的问题,如比较口语的语音识别都还没能够完全应付,所以它还需要不断的锻炼。

xxxx

  完美可能永远不存在,但近乎完美是从不断的完善中出来。智能开始走入了年轻人的生活,能够被年轻人广泛接受,支持人工智能的虚拟助手正变得越来越普遍,而强大的语音助手支持也将定义智能手机领域和联网设备市场的赢家和输家。

  亚马逊、谷歌、微软、苹果,到百度、阿里巴巴、腾讯,再到科大讯飞、搜狗等等,智能的未来从来都是具备实力的平台的竞争,只不过谁胜谁负对于用户来说又有什么紧要的,市场上没有永远的朋友,也没有永远的敌人,我们期待的还是各大平台在竞争与合作中让智能来得更快些。

下载太平洋电脑网App,看更多相关内容
分享到:

热门文章

推荐内容