Chatterbox:开源TTS的轻量革命,重新定义语音合成的效率与边界


Chatterbox是Resemble AI开源的轻量TTS模型,包含三款针对不同场景优化的核心模型,具备高效生成架构等关键技术突破,覆盖实时交互、全球化部署等全场景需求,在轻量与性能、功能与易用性、开源与合规等方面实现平衡,可快速上手,开启开源TTS平民化时代

阿里开源Qwen2.5-Omni,7B参数完成看、听、说、写


阿里通义千问团队推出全球首个端到端开源全模态大模型Qwen2.5-Omni,支持文本、图像、音频、视频的实时交互与流式响应,仅7B参数即超越千亿级闭源模型性能。其创新Thinker-Talker架构和TMRoPE位置嵌入技术实现多模态同步处理,在语音生成、视频理解等任务中表现优异,并在OmniBench等评测中达到SOTA水平。