语音合成_兰乔电商网

新闻⋅ 02-06 ⋅ 1553 阅读

你是不是也遇到过这种情况：孩子背单词时，明明按顺序能脱口而出，但一到考试或者实际应用时就卡壳？问题可能出在”位置记忆”上——他们只是记住

导航⋅ 01-13 ⋅ 378 阅读

智东西是中国领先的智能产业媒体和创新服务平台。聚焦于以人工智能为核心的新技术驱动的创新创业和传统产业升级。自创立以来，智东西以“聚焦智能变革服务产业升级”为愿景，已形成媒体、公开课以及产业活动三大产品业务体系，并构建了庞大的智能产业垂直社群。

智能语音新体验ChatTTS，颠覆传统语音互动？

优化⋅ 01-10 ⋅ 394 阅读

在这个信息化时代，科技飞速发展的人工智能的应用范围也在不断扩大。从智能家居到语音助手，从自动翻译到在线客服，语音交互已经渗透到我们生活的方方面面。特别是在语音识别和语音合成领域，技术的不断创新让我们的沟通方式变得更加智能、便捷。

Resemble AI 全面开源旗舰级 TTS 模型

新闻⋅ 12-29 ⋅ 1950 阅读

初创企业ResembleAI已在MIT开源协议下正式发布其全新文本转语音模型——“ChatterboxTurbo”。该模型在语音合成能力上取得重大进展：仅依赖5秒长的参考语音样本，即可高保真复刻目标人声；更令人瞩目的是，它能在150毫秒内完成首段音频的生成与输出。如此超低延迟的响应特性，使其特别适用...

通义百聆语音双子星升级并开源，大幅提升语音合成与识别能力

新闻⋅ 12-15 ⋅ 1343 阅读

据通义大模型官方发布，通义百聆正式推出升级版语音大模型Fun-CosyVoice3与Fun-ASR，并同步向全球开源。本次迭代重点强化模型的核心能力与落地实用性，旨在为开发者及企业用户提供更高效、更可靠的语音AI解决方案。Fun-CosyVoice3：低延迟、高保真的智能语音合成首包响应时间缩短50...

面壁智能发布 VoxCPM 1.5，面向高拟真语音生成的新型端到端 TTS 模型

新闻⋅ 12-13 ⋅ 1282 阅读

面壁智能正式发布面向高保真语音合成的全新端到端TTS模型——VoxCPM1.5版本。本次升级核心特性如下：高保真音频克隆能力：AudioVAE采样率由16kHz升级至44.1kHz，显著提升音质还原度，使克隆语音更自然、细节更丰富；推理速度与质量双提升：在模型参数适度增长的基础上，VoxCPM1.5...

智谱上线并开源工业级语音合成系统 GLM‑TTS

新闻⋅ 12-12 ⋅ 1048 阅读

智谱AI正式发布并开源了工业级语音合成系统GLM‑TTS。官方介绍显示，仅需3秒的语音片段，GLM‑TTS即可精准捕捉目标说话人的音色特征与语调习惯。该模型在通用文本朗读、情感化配音、教育口语评测、电子书播讲、智能有声客服等多种实际应用场景中，均可输出自然连贯、高度拟人化的语音效果。GLM‑TTS采...

微软发布 VibeVoice 0.5B：仅 0.5B 参数却实现 300 毫秒实时开口

新闻⋅ 12-05 ⋅ 751 阅读

微软正式推出全新实时文本转语音模型VibeVoice-Realtime-0.5B。虽然参数量仅为0.5B，却实现了近乎实时的语音合成能力，最快约300毫秒即可启动发声，达成“话音未落、语音已起”的丝滑交互效果。该模型支持中英文双语实时转录与语音合成，其中英文语音表现更为出色，中文虽稍逊一筹，但仍维持...

AI创作平台官网入口，开启未来无限可能？

优化⋅ 12-03 ⋅ 975 阅读

除了文本创作，AI在图像创作方面也展现出了强大的能力。AI创作平台的图像生成工具可以根据用户的描述，生成各种风格的图片，从插画、设计图到艺术作品，都可以通过AI轻松实现。

学习火山语音技术，能掌握文本韵律合成新技能吗？

优化⋅ 11-26 ⋅ 930 阅读

杀疯了！而如今直接颠覆了许多人的刻板印象，语音合成技术Yi经NengZuo到像上面那段音频一样完美自然的效果了这个。这段音频的发布者，火山语音，字节跳动 AI Lab Speech & Audio 智Neng语音与音频团队，为了geng好地向大众解密里面的技术亮点，你没事吧？。语音合...

与“语音合成”相关的TAG标签