百度AI开放平台 百度AI开放平台提供全球领先的语音、图像、NLP等多项人工智能技术,开放对话式人工智能系统、智能驾驶系统两大行业生态,共享AI领域最新的应用场景和解决方案 030931 视频技术语音技术# AI# NLP# OCR
语音评测-科大讯飞 对中英文的朗读发音进行评分和问题定位。支持字、词、句、篇章等题型,并返回准确度、流畅度、完整度、声韵调型等多维度评分。为各年龄提供不同的打分标准。 2100 语音评测# 科大讯飞# 讯飞# 讯飞语音api
语音唤醒-科大讯飞 设备(手机、玩具、家电等)在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令,即唤醒词),让处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步 2380 语音唤醒# 人工智能# 人工智能语音技术# 科大讯飞语音技术
短语音识别_科大讯飞 将短音频(≤60秒)精准识别成文字,除中文普通话和英文外,支持51个语种、24种方言和1个民族语言,实时返回结果,达到边说边返回的效果,可提供公有云接口及私有化部署方案。 1770 语音识别# android讯飞语音# 科大讯飞语音技术# 讯飞开放平台
中英文口语评测-驰声 驰声是国内知名中英文语音评测技术供应商,在线语音识别引擎发音纠错技术、中英文口语评测、人工智能发音打分技术、AI口语训练技术、口语作业、中高考英语听说考试评分技术等面向儿童、成人、K12学生,维度全,功能多,平台稳,效率高,被誉为中国语言教育产品的智能语音工具包。 17350 语音技术语音评测# 中英文口语评测# 人工智能语音技术# 在线语音识别
语音唤醒-思必驰 语音唤醒(Voice Wakeuper)是人机对话的第一步。通过在设备或软件中预制唤醒词,将设备在休眠待机的状态中唤醒,进入等待指令的状态 1480 语音唤醒# AI# 人工智能# 思必驰
一句话识别-阿里云 一句话识别可对一分钟以内的语音进行实时识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等。 可集成在各类App、智能家电、智能助手等产品中。 1720 语音识别# AI# 人工智能# 语音技术
短文本语音合成-云知声 将短文本( ≤ 500 字符 )转换成自然流畅的语音,支持多种音色,并提供调节音量、语速、音高、亮度等功能。适用于智能客服、语音交互、导航播报等场景。 1270 语音合成# 云知声# 语音合成
长文本语音合成-云知声 将长文本(≤5万字符)转换成自然流畅的语音,提供更多音色、不同情感的发音人,适用于文学阅读、新闻播报、自媒体配音等场景。合成音可供下载使用。 1400 语音合成语音技术# 云知声# 免费语音合成# 语音合成
云知声AI开放平台 云知声AI开放平台以智能语音技术为核心,提供语音识别、语音合成、语音分析、语义理解等人工智能服务,为全行业开发者提供一站式人工智能语音交互技术方案。 014830 语音唤醒# AI# NLP# 云知声
录音文件识别-科大讯飞 语音转写可批量将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景,可提供公有云接口及私有化部署方案 1540 语音识别# 人工智能# 人工智能语音技术# 科大讯飞
语音合成-有道智云 智能语音合成(text-to-speech,TTS)满足一般语言的文本转换为语音的需求,让您的应用或设备开口说话,让发音更自然和专业,助力提升人机交互体验。 1470 语音合成# OCR# 作文批改# 拍照搜题
录音文件识别-阿里云 对用户上传的录音文件进行识别,上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。 1570 语音识别# AI# 人工智能# 人工智能语音技术
音频文件转写-云知声 将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据,商业用户可在6小时之内获得识别文本。适用于会议转写、字幕生成、音频内容分析等场景 1400 语音识别# 云知声# 语音转文字# 音频文件转写