11月19日下午,2022科大讯飞全球1024开发者节“输入生态”论坛拉开帷幕。本次论坛分设“新输入·赋万物”、“讯飞输入法12.0发布”、“新输入·新传承”三大主题演讲,来自讯飞输入法的演讲嘉宾与现场和线上的朋友分享技术、产品、方言文化传承方面的新进展,以及面向万物智能时代所做出的新探索。
首先,讯飞输入法总经理程坤在会上发表《新输入·赋万物》主题演讲,作为人工智能应用的先行者,讯飞输入法深耕行业12年,始终围绕“以人为本”,创新输入体验。最新数据显示,讯飞输入法日活用户已突破1亿,语音渗透率达75%,日语音调用量较2021年提升45%,这组数字正说明讯飞输入法不断为亿万用户提供个性、智能的人机交互。
在中国移动互联网的发展元年,讯飞输入法首创语音输入人机交互模式,不断提升输入效率和用户体验,使用讯飞输入法每日可为全社会节省100万小时输入时间。程坤指出,随着“万物皆终端、终端皆互联”的时代来临,储备前沿的人工智能技术并持续产品创新是讯飞输入法未来的关键点和制高点。
讯飞输入法一直以人工智能技术作为产品升级的驱动力,基于多环境因子嗅探的动态模型延展,通过增强模型和识别模型的深度耦合,推出了解决高噪、远场混响等复杂环境下的高精度语音识别。依托于高噪识别技术能力的支撑,在家居、车载、街区、公共交通、多人说话等典型高噪场景下,讯飞输入法依然准确识别。
为了给用户提供更自然、智能、可靠的交互体验,讯飞输入法全新升级语音个性化方言免切换模型,采用Conformer Encoder音频编码和全语言专家系统,实现用户级语言个性化识别,可支持普通话与20多种方言免切换语音识别。
此外,离线方言语音识别技术也获得突破,极大降低语音交互门槛。目前,讯飞还基于多语种合成技术,利用海量文本数据对小语种数据增强,扩充支持30种语言语音识别,进一步拓宽了语音输入场景。
面对万物智能时代凸显的3个新的输入问题——复杂多样的交互界面、输入场景以及用户需求。讯飞输入法产品总监赵明路在现场发布讯飞输入法12.0,用实实在在的产品给出了讯飞的解决方案。
据悉,基于移动终端、穿戴设备、智能家居、车载车机等交互界面的变化,讯飞输入法为手表等小屏设备量身定制智能手写,面向智慧屏等大屏构建了可跨端流转的新输入等,让用户能够“畅快交互”。围绕智慧生活场景,讯飞输入法基于输入服务与用户连接的需求根基,提出一整套输入新方案。面向愈来复杂多样的输入场景,讯飞输入法12.0搭载全新AI智能化输入引擎,在聊天、音乐、综艺、影视、生活服务情景下,都能赋以高效、准确、自如的表达。此外,讯飞输入法面向不同用户特点,加入游戏语音键盘、跨屏输入、长辈模式、无障碍输入等模式,抓稳用户体验。
作为人工智能技术的天然载体,输入法从工具到服务再发展到生态圈层,每一次的进步都离不开创新,技术的创新又为内容生产方式注入新的生机活力。数据显示,讯飞输入法个性化内容服务使用者中年轻用户占比达48%,吸引了内容创作者超过万人,内容使用量多达100亿次。会上,赵明路发布“i-Blocks”输入个性化内容开放平台。该平台以讯飞输入法为基座,秉承生态开放的理念,助力众多创作者获得内容业务的快速增长。
那么,输入法如何与文化产生深度联结?讯飞输入法副总经理李强军发表《新输入·新传承》的演讲,讲述讯飞输入法以AI新输入,助力方言文化新传承的故事。
据李强军介绍,讯飞输入法早在2011年就启动粤语识别项目,并且用3年时间陆续上线了10种方言识别。2017年,讯飞输入法正式发布方言保护计划,随着该计划的持续推进,中国方言库汇集语料已超过160万条,覆盖粤语、吴语、闽语、晋语等十大主要方言区。基于方言语料的积累,讯飞输入法实现25种方言以及5种民族语言的语音识别,目前还完成13种方言合成和2种方言翻译,将应用成果普惠大众。
李强军表示,一直以来,讯飞输入法充分挖掘方言的文化内核,努力“拓圈”传承。比如讯飞输入法、讯飞苏研院联合蜃楼志STUDIO创新制作《姑苏琐记》系列公益短片,借力多种数字技术开辟方言保护和文化传承的新场景,不仅让观众听到AI方言配音,还看见虚拟人有声有色的演绎。在推进方言保护计划过程中,讯飞与新华书店、苏州博物馆、海南民生广播、中国蓝TV展开广泛合作。此外,携手中国方言研究院、苏州图书馆多家单位推出线上方言公开课、教学短片,用方言魅力增强地域文化自信。这些努力不仅有利于加大方言保护的力度,也将对文化传承产生深远的影响。
在本次论坛上,讯飞输入法超前预判以语音为主,键盘触摸为辅,肢体语言动作为补充的万物智能时代正在到来。在此基础上,讯飞输入法发布12.0,用AI赋能“新输入”,面向未来的人机交互更迈进一步,对当下具有非常强的现实意义。