随着揭幕战哨声的吹响,2022年世界杯正式进入到火热的赛程阶段。为了让听障群体也能更好地感受足球的魅力,抖音在带来全场次、4K超高清免费直播的同时上线了「无障碍直播间」功能,借助火山同传的技术能力,提供低延时的赛事解说字幕。
图说:进入抖音“世界杯”直播界面,选择「无障碍字幕」即可通过文字实时了解赛事解说
创新字幕方案,更匹配足球赛事
火山同传是火山翻译旗下的AI同传产品,可以实时进行多种语言的语音识别和转写,输出同传字幕。
接到直播流后,火山同传对语音信号进行实时识别,输出AI流式字幕;译员在延时的30秒内对AI字幕进行人工二次校对,然后整句推出字幕,实现了在「低延时」的条件下输出「更精准」的字幕,给观众带来更优质的观看体验。
图说:火山同传字幕生成流程
传统的字幕方案是实时按词推出,字符变换跳动,长时间阅读容易疲惫。针对本次世界杯赛事,火山同传还特地进行了字幕样式优化。精心设计的双行字幕展示,保证观众能获取更多完整信息;调优后的字体样式更加清晰显眼,更好地匹配足球赛事的画面特点,打造了更优的看播体验。
此外,火山语音团队自研的端到端的语音识别系统也为实现高质量字幕提供了重要技术支持。对语音的精准快速识别能力是实现同传字幕的基础,针对世界杯比赛场景,火山语音团队对足球领域专有名词、球队和球员名称等术语进行了专项优化,进一步提高了AI模型识别的准确率。另外,通过对大量足球解说场景的音频特征进行分析并进行模型调优,能保证在有背景音的情况下也能清晰地识别人声,实现更好的流式字幕效果,为观众带来更加稳定、舒适的观赛体验。
图说:火山同传双行字幕显示
打破信息障碍,让交流更无界
根据世界卫生组织发布的数据,全球的听障人士有四亿以上,而我国有着世界上最大的听力障碍群体,据统计总人数近三千万人。在当今互联网快速发展的时代,海量的新闻资讯和文娱节目每时每刻都在产生,其中不同国家地区的语言差异、网络用语的特殊表达等等,都会对听障人士的信息获取和理解带来巨大的障碍。
火山同传相关负责人表示,此次联合抖音打造「无障碍直播间」的初心,就是触达听障群体的需求,旨在解决「听不到」「听不懂」「听不了」三大难题,帮助听障人士无障碍地享受这四年一届足球盛宴的乐趣。
据介绍 ,抖音“无障碍字幕”不仅有助于残障伙伴、老年群体等听力受限用户拥有更好的观赛体验,也可以解决普通用户在极安静或极嘈杂情况下,不方便听解说的需求。
目前,火山同传的无障碍字幕方案已在抖音多场直播中得到了应用,包括中国消防总队春节消防安全科普、中国科技馆春节云游科技馆系列直播、日本艺术家村上隆中国直播首秀、英国艺术家菲利普·考尔波特直播等,获得了众多观众的认可。火山同传为这些直播活动提供了近乎实时的高质量字幕,帮助不同国家的人和听障人士跨越语言和听力的障碍,享受优质内容。