讯飞听见

#文字办公#翻译

用户评分
用户头像1用户头像2用户头像3
62条真实用户评分
查看更多
4.6
准确性 4.8响应速度 4.6易用性 4.5
评分图标 我也评评

讯飞听见是科大讯飞推出的AI语音转文字工具,支持实时录音转写、多语种翻译及会议纪要生成,准确率高达98%。其核心功能包括1小时音频5分钟快速出稿、人工精转校验、DeepSeek模式深度语义分析,并兼容鸿蒙生态。适用于会议、教育、媒体等场景,已服务8900万用户。

讯飞听见免费科大讯飞
直达网站

核心功能

实时语音转文字

录音实时转文字,准确率高达98%

多语种翻译

支持8国语言实时互译

智能会议纪要

自动生成会议摘要和待办事项

录音文件转文字

1小时音频最快5分钟出稿

玩法教程热度分析迭代里程碑常见问题AI百科相关推荐

产品对比

4.6
评分图标 我也评评
用户评分
4.7
评分图标我也评评
4.8
准确性
4.6
4.5
易用性
4.7
4.6
响应速度
4.8
实时语音转文字
多语种翻译
智能会议纪要
录音文件转文字
声纹角色分离
核心功能
全领域知识问答
创意内容生成
逻辑梳理提炼
自然交互协作
生活效率支持
4638
产品热度
8721
科大讯飞
技术背景
字节跳动
科大讯飞星火认知大模型V2.0
最新模型
豆包大模型1.6系列
2025-05-30
更新时间
2025-06-11

技术背景

母公司背景

科大讯飞股份有限公司

亚太地区领先的智能语音与人工智能上市企业

团队信息

研发团队规模

4000 人 +

团队信息

研发团队构成

未公开

技术实力

翻译准确率

91.2%

中英同传准确率 91.2%(2024 国际语音翻译评测)

语种覆盖率

12+23

12 国语言 + 23 种方言

行业术语库

20+

覆盖 20 个专业领域术语优化

响应速度

≤500ms

1 小时音频最快 5 分钟出稿

模型规模

未公开

搭载星火大模型技术

训练数据

100 万小时

累计语音数据超 100 万小时

活跃用户

56 万

累计用户超 8900 万

资源优势

1. 资金实力

  • 母公司融资情况:科大讯飞股份有限公司为上市公司(股票代码:002230),公开市场融资渠道畅通
  • 盈利情况:母公司 2023 年财报显示净利润同比增长 12.6%,但 AI 业务板块具体盈利数据暂未披露
  • 业务营收:讯飞听见采用 SaaS 订阅模式,年费制定价 100 元 / 年起,企业级客户为主要收入来源

2. 算力资源

  • 是否具备自研算力平台:依托母公司科大讯飞自研的 “飞星一号” 算力集群(含 4090 张 GPU,算力达 50P FLOPS)
  • 云服务资源:采用混合云架构,支持公有云 / 私有云部署,GPU 集群含 1024 张 A800/H800,理论算力达 32P ops(混合精度)

3. 数据资源

  • 数据来源:多模态数据来源于母公司 20 余年语音技术积累,覆盖 9 国语言 + 16 个专业领域 + 19 种方言的语音库
  • 数据质量:法庭场景识别率 98.7%(公开测试数据),支持 PB 级脑科学数据的结构化处理
  • 数据闭环能力:具备从原始语音→文本→语义分析→知识图谱的全流程处理能力,支持模型持续迭代

热度分析

暂无数据
不如看看其他上榜的热门产品吧?
查看完整榜单

迭代里程碑

鸿蒙PC深度适配2025年5月
鸿蒙生态PC适配
完成鸿蒙PC端适配,提升多终端协同与悬浮字幕体验。
星火大模型赋能2023年5月
AIGC智能摘要
搭载星火大模型推出‘会写’功能,支持AI生成会议纪要及文案。
鸿蒙生态接入2021年
鸿蒙跨端协同
首批适配鸿蒙系统,实现原子化服务与跨终端协同功能。
讯飞听见App发布2020年4月
多语种移动端
上线多语种转写及翻译App,支持13种语言转写和6种语言翻译。
L1高端会议设备发布2019年3月
视频会议实时翻译
推出支持实时双语翻译的智能会议设备,覆盖跨国企业场景。
录音笔硬件生态整合2016年
硬件协同实时转写
配合录音笔产品提供免费转写服务,构建完整SaaS生态。
讯飞听见网站上线2015年12月
语音转写SaaS
推出语音转写网站,半年内用户突破100万,支持边录音边转写。

常见问题

讯飞听见的语音转文字准确率如何?适合哪些场景使用?
讯飞听见采用领先的语音识别技术,普通话转写准确率可达98%,支持带口音普通话和部分方言识别。特别适合会议记录、访谈整理、课程笔记等需要快速将语音转为文字的场景,尤其在嘈杂环境下仍能保持较高识别率。
实时转写和录音转文字功能有什么区别?该如何选择?
实时转写适合需要同步获取文字的场景(如直播字幕、同声传译),延迟控制在3秒内;录音转文字则针对已录制音频文件进行批量处理,支持多格式导入和智能分段。建议根据时效性需求选择,两者均可导出可编辑文本。
转写后的文本如何保证隐私安全?企业敏感会议内容会被存储吗?
讯飞听见提供金融级加密传输,用户数据存储于私有云且可自主删除。企业版支持本地化部署,所有音频和文本数据均不经过公有云,符合GDPR等国际安全标准,敏感会议内容可设置阅后即焚。
专业术语较多的医疗/法律场景如何提升识别准确率?
可在转写前上传行业术语库(如药品名、法条术语),系统将自动优化识别模型。付费版支持定制专属声学模型和语言模型,医学会议等专业场景识别准确率可额外提升15%-20%。
导出文稿时有哪些实用功能?能否直接生成会议纪要?
支持智能排版、中英双语对照导出,并独创'语义分段'功能自动划分发言逻辑。企业版提供AI会议摘要功能,可自动提取决议项、待办事项等关键信息,节省80%的纪要整理时间。
已经到底了