语音合成_第2页_兰乔电商网

优化⋅ 11-23 ⋅ 1872 阅读

什么是Deepfake？啊，你们知道Deepfake吗？就是那种Neng让你kan起来像是在说再说一个一个人说的话，或者Zuo再说一个一个人Zuo的事情的那种神奇技术。不过这种技术啊，有时候也会让人hen困惑，不知道到底是真的还是假的，精神内耗。。事件3：2018年，加拿大Lyrebird琴鸟公...

学习生成式AI底层逻辑，掌握实战应用技巧，我能获得什么？

优化⋅ 11-22 ⋅ 550 阅读

生成式AI的基本概念与理论原理，生成式AI是指新数据的规律和机制的智Neng系统。这个AI，听起来好像就是那种Neng自己生小孩的东西，差不多得了...。生成式AI的核心原理基于深度学习算法，模型模仿人类创造性的思维过程。这就像是我们的大脑，有hen多神经元，它们会根据不同的输入和任务要求，自动...

听象棋签名录音，如何实现通话录音AI合成？

优化⋅ 11-20 ⋅ 1053 阅读

什么是AI合成无语了... AI合成，就是通过人工智Neng技术，将文本或者录音转换成语音的技术。这项技术在hen多领域dou有应用，比如智Neng客服、语音助手、教育等。 AI合成的工作原理 AI合成的工作原理主要分为两个部分：语音识别和语音合成。语音识别是将人类的语音信号转换为计算机Ke以理...

冬瓜配音-免费文字转语音-ai在线配音生成器

导航⋅ 10-29 ⋅ 1363 阅读

冬瓜配音是一款专业的在线将文字转语音的AI配音软件。提供免费ai配音，声音克隆、漫画推文、文案提取、人声处理、背景音处理等功能，只需输入文本内容即可一键合成语音，可快速实现文本朗读、视频配音、广告、课件、影视解说等的配音工作，是一款功能强大的ai在线配音生成器

Soul App 开源播客语音合成模型 SoulX-Podcast

新闻⋅ 10-29 ⋅ 1576 阅读

近日，SoulAppAI团队（SoulAILab）正式对外开源其最新研发的播客语音合成模型——SoulX-Podcast。该模型专为多人、多轮对话场景设计，支持中文、英文、四川话、粤语等多种语言与方言，并具备丰富的副语言表达能力，可稳定生成超过60分钟自然流畅、角色切换精准、韵律变化生动的长时语音内...

智元发布「灵创」平台，0 代码、0 门槛训练机器人

新闻⋅ 10-24 ⋅ 276 阅读

智元机器人正式发布全球首款零代码、零门槛的机器人内容创作平台——「灵创」。秉持“让创作更简单，让表达更灵动”的核心理念，该平台首次融合AI动作捕捉、云端模仿学习与多模态编排技术，向大众开放人形机器人内容创作的全新入口。无需编程经验，也无需专业设备，用户只需上传一段真人动作视频，即可通过「灵创」平台实...

豆包语音合成模型 2.0 升级，语义理解+情感演绎双突破

新闻⋅ 10-16 ⋅ 1302 阅读

火山引擎正式推出豆包语音合成模型2.0（Doubao-Seed-TTS2.0）与豆包声音复刻模型2.0（Doubao-Seed-ICL2.0）的全面升级版本。本次更新依托豆包大语言模型的技术积累，重构语音生成架构，赋予合成与复刻语音更深层次的语义感知和上下文理解能力，实现从“机械朗读”到“理解驱动的...

火山引擎发布豆包语音模型2.0，实现语义与情感双突破

新闻⋅ 10-16 ⋅ 1946 阅读

火山引擎正式发布豆包语音合成模型2.0（Doubao-Seed-TTS2.0）与声音复刻模型2.0（Doubao-Seed-ICL2.0），基于全新升级的豆包大语言模型架构，推动语音技术从“机械朗读”迈向“理解驱动的情感化表达”。此次推出的2.0版本在语义理解和上下文关联能力上实现关键突破。语音合成...

巨人网络&清华大学开源 DiaMoE-TTS，多方言语音合成大模型框架

新闻⋅ 10-15 ⋅ 386 阅读

巨人网络AILab携手清华大学电子工程系SATLab研究团队，近日共同宣布一项重要技术进展：成功研发全球首个支持多方言语音合成的大模型架构——DiaMoE-TTS，并正式向全社会开放其全部代码、数据与技术方案，致力于促进方言语音合成领域的公平化与普及化发展。尽管当前主流的文本转语音（TTS）大模型已...

2025魔搭社区MCP&Agent挑战赛落幕：20支进入决赛的团队角逐AMD创新赛道，端侧智能体应用百花齐放

新闻⋅ 09-26 ⋅ 1462 阅读

2025年9月24日，2025魔搭社区MCP&Agent挑战赛在杭州云栖大会现场圆满收官。当天，从AMD创新赛道初赛中脱颖而出的20支优秀团队齐聚一堂，展开最终决赛的精彩路演。经过一整天紧张激烈的比拼，这些团队基于搭载AMD锐龙AIMAX+395处理器的MiniAI工作站，展示了他们在端侧智...

与“语音合成”相关的TAG标签