枫夜求索阁

4月17日上线！字节跳动Seed-Thinking-v1.5模型技术细节全解读：三重数据清洗+双轨奖励机制

字节跳动将于2025年4月17日上线Seed-Thinking-v1.5模型，该模型采用MoE稀疏专家架构，总参数200B，激活参数仅20B，显著降低推理成本50%。通过三重数据清洗和双轨奖励机制，模型在数学推理、编程和科学推理等领域表现优异，并在创意写作等任务上超越前代模型。未来可能重塑行业竞争格局，推动轻量化模型趋势，并扩展至教育、创意产业和企业服务等领域。

大模型知识科普

AI学习之路 AI 学习系列

本文科普了大模型中的核心概念，包括Tokens、Tokenizer、嵌入模型（Embedding Model）以及MCP（Model Context Protocol）。Tokens是AI模型处理文本的基本单位，Tokenizer负责将文本转换为Tokens，而嵌入模型则将高维数据转换为低维向量，便于机器处理。MCP则是一种标准化协议，用于为大型语言模型提供上下文信息，增强其能力。文章详细解释了这些概念的工作原理、实际影响以及应用场景。