语音转文字

共 21 篇网址

短语音识别_科大讯飞

将短音频（≤60秒）精准识别成文字，除中文普通话和英文外，支持51个语种、24种方言和1个民族语言，实时返回结果，达到边说边返回的效果，可提供公有云接口及私有化部署方案。

3010

语音识别 # android讯飞语音 # 科大讯飞语音技术 # 讯飞开放平台

短语音识别-百度AI

将60秒以内的语音精准识别为文字，可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景

2190

语音技术语音识别 # AI # 人工智能 # 百度语音

一句话识别-阿里云

一句话识别可对一分钟以内的语音进行实时识别，适用于较短的语音交互场景，如语音搜索、语音指令、语音短消息等。可集成在各类App、智能家电、智能助手等产品中。

2440

语音识别 # AI # 人工智能 # 语音技术

一句话识别-云知声

把语音(≤60秒)转换成对应的文字信息，适用于较短的语音交互场景，如语音搜索、语音输入、语音控制等

2290

语音识别 # 云知声 # 语音识别 # 语音转文字

语音识别_思必驰

思必驰提供基于云+端混合引擎的连续语音识别，覆盖中文、英文、葡萄牙语等语种，粤、川、沪等方言，以及带方言的普通话。

3110

语音技术语音识别 # AI # 人工智能 # 思必驰

短语音听写-依图

将时长不超过60秒的语音转写成文字，让您的应用听懂人类语言

2150

语音识别 # 依图 # 依图科技 # 语音识别

长语音识别-依图

将时长不超过5小时的语音转写成文字，让您从音频数据中挖掘更多信息和价值。

1930

语音识别 # 依图科技 # 语音识别 # 语音转文字

录音文件识别-科大讯飞

语音转写可批量将音频文件（5小时以内）转换成文本数据，适用于语音质检、会议访谈等场景，可提供公有云接口及私有化部署方案

2280

语音识别 # 人工智能 # 人工智能语音技术 # 科大讯飞

录音文件识别-阿里云

对用户上传的录音文件进行识别，上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。

2310

语音识别 # AI # 人工智能 # 人工智能语音技术

音频文件转写-百度AI

将批量上传的音频文件识别为文字，12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景

1980

语音识别 # 人工智能 # 百度 # 语音转文字

音频文件转写-云知声

将长段音频文件（5小时以内或文件大小在2G以下）转换成文本数据，商业用户可在6小时之内获得识别文本。适用于会议转写、字幕生成、音频内容分析等场景

1940

语音识别 # 云知声 # 语音转文字 # 音频文件转写

实时语音转写-云知声

对长段音频流做实时识别，达到“边说边出文字”的效果，适用于实时会议、直播字幕等场景

2700

语音识别 # 云知声 # 语音识别 # 语音转文字

腾讯AI开放平台

提供全球领先的语音、图像、NLP等多项人工智能技术，共享AI领域最新的应用场景和解决方案。

28570

城市教育 # AI # OCR # 腾讯云

实时语音识别-科大讯飞

实时语音转写可将不限时长的音频流实时识别为文字，并返回带有时间戳的文字流，新增翻译功能，适用于跨语种会议、国际赛事直播等多言语场景

2630

语音识别 # AI # 人工智能 # 人工智能语音技术

实时语音识别-百度AI

基于Deep Peak2的端到端建模，将音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

2180

语音识别 # AI # 人工智能 # 实时语音识别

实时语音识别-阿里云

实时语音识别是对不限时长的音频流做实时识别，达到“边说边出文字”的效果，内置智能断句，可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。

2000

语音识别 # AI # 人工智能 # 人工智能语音技术

实时语音转写-依图

一边接收音频数据，一边提供转写结果，让您能够实时获取和利用文字信息

2190

语音识别 # 依图 # 语音识别 # 语音转文字

好未来AI开放平台

好未来AI开放平台，依托多年教育行业经验与海量行业数据优势，深耕教育领域人工智能技术创新，为广大教育行业伙伴提供领先的AI能力与解决方案，助力教育智能化发展

2050

教育语音合成 # AI # OCR # 人工智能

小米小爱开放平台

把小米在人工智能领域的技术积累对外输出，我们提供多种能力给开发者，帮助开发者实现更多可能

26970

语音合成语音唤醒 # AI # 人工智能 # 智能语音

捷通华声

免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力

34620

语音合成语音唤醒 # 语音识别 # 语音转文字

短语音识别-有道智云

有道智云提供神经网络翻译、文字识别OCR服务以及行业解决方案，具备在线/离线翻译、在线OCR识别功能。

1880

语音识别 # 智能语音识别 # 有道智云 # 神经网络翻译