录音文件识别-科大讯飞

3年前发布 155 0 0

语音转写可批量将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景,可提供公有云接口及私有化部署方案

收录时间:
2022-03-29
录音文件识别-科大讯飞录音文件识别-科大讯飞
录音文件识别-科大讯飞
清影AI视频生成

服务商

科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。

科大讯飞是我国唯一以语音技术为产业化方向的“国家863计划成果产业化基地”、“国家规划布局内重点软件企业”、“国家火炬计划重点高新技术企业”、“国家高技术产业化示范工程”,并被信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。

产品介绍

语音转写可批量将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景,可提供公有云接口及私有化部署方案。

产品优势

录音文件识别-科大讯飞

应用场景

录音文件识别-科大讯飞

常见问题

1、 “语音转写 ”与 “语音听写 ”的区别是?

产品名称 支持的音频时长  使用场景
语音听写 一分钟以内 人机对话,如输入法、语音搜索
语音转写 五小时以内 更自然地贴近日常的对话、演讲

2、 “已录制音频转写”和“实时音频流转写”的区别是?

已录制音频转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;

实时音频流转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。

3、语音转写支持什么语言?

答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言/语种需购买套餐或语种授权。目前可支持:

l  方言:广东话、河南话、西南官话(云南话、贵州话、重庆话、四川话)

l  语种:中文、英文、日语、韩语、法语、俄语、越南语、西班牙语

l  民族语言:藏语、维语

4、目前语音转写支持的音频格式为:

已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道;采样率:8KHz,16KHz

5、语音转写支不支持并发?

答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。

相关导航