4月17日上线!字节跳动Seed-Thinking-v1.5模型技术细节全解读:三重数据清洗+双轨奖励机制


字节跳动将于2025年4月17日上线Seed-Thinking-v1.5模型,该模型采用MoE稀疏专家架构,总参数200B,激活参数仅20B,显著降低推理成本50%。通过三重数据清洗和双轨奖励机制,模型在数学推理、编程和科学推理等领域表现优异,并在创意写作等任务上超越前代模型。未来可能重塑行业竞争格局,推动轻量化模型趋势,并扩展至教育、创意产业和企业服务等领域。

阿里开源多模态模型(Qwen2.5-VL-32B-Instruct):小模型也能有大作为


阿里巴巴通义千问团队于2025年3月25日开源了多模态模型Qwen2.5-VL-32B-Instruct。该模型在视觉语言理解与推理、数学推理能力等方面表现优异,性能超越更大规模模型,支持本地部署,并通过强化学习优化用户体验。采用Apache 2.0协议开源,适用于教育、智能硬件、科研等多个领域。未来将聚焦于长且有效的视觉推理,进一步提升模型在复杂场景中的应用能力。