微软语音服务,提供语音到文本、文本到语音和语音翻译功能。
它允许用户创建自定义的语音识别模型,以及提供访问一系列预先训练的模型。它还提供了用于创建和管理自定义语音的工具。
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
魔音工坊-AI智能配音软件&短视频配音神器
AI人声和文本转语音生成工具
AI文本到语音生成器
多情绪免费克隆AI音频工具
法国AI实验室Kyutai推出的端到端实时多模态AI语音模型,具备听、说、看的能力,不仅可以实时收听,还能进行自然对话。
音视频秒转文字,声波流式转录,让每个声音都成篇章