短语音识别_科大讯飞 将短音频(≤60秒)精准识别成文字,除中文普通话和英文外,支持51个语种、24种方言和1个民族语言,实时返回结果,达到边说边返回的效果,可提供公有云接口及私有化部署方案。 1770 语音识别# android讯飞语音# 科大讯飞语音技术# 讯飞开放平台
一句话识别-阿里云 一句话识别可对一分钟以内的语音进行实时识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等。 可集成在各类App、智能家电、智能助手等产品中。 1720 语音识别# AI# 人工智能# 语音技术
录音文件识别-科大讯飞 语音转写可批量将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景,可提供公有云接口及私有化部署方案 1540 语音识别# 人工智能# 人工智能语音技术# 科大讯飞
录音文件识别-阿里云 对用户上传的录音文件进行识别,上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。 1570 语音识别# AI# 人工智能# 人工智能语音技术
音频文件转写-云知声 将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据,商业用户可在6小时之内获得识别文本。适用于会议转写、字幕生成、音频内容分析等场景 1410 语音识别# 云知声# 语音转文字# 音频文件转写
实时语音识别-科大讯飞 实时语音转写可将不限时长的音频流实时识别为文字,并返回带有时间戳的文字流,新增翻译功能,适用于跨语种会议、国际赛事直播等多言语场景 1970 语音识别# AI# 人工智能# 人工智能语音技术
实时语音识别-百度AI 基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景 1500 语音识别# AI# 人工智能# 实时语音识别
实时语音识别-阿里云 实时语音识别是对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。 1490 语音识别# AI# 人工智能# 人工智能语音技术
好未来AI开放平台 好未来AI开放平台,依托多年教育行业经验与海量行业数据优势,深耕教育领域人工智能技术创新,为广大教育行业伙伴提供领先的AI能力与解决方案,助力教育智能化发展 1460 教育语音合成# AI# OCR# 人工智能
捷通华声 免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力 19620 语音合成语音唤醒# 语音识别# 语音转文字