枫夜求索阁

AI学习之路（一）：一文学习deepseek的创新之处

AI学习之路

本文深度解析DeepSeek五大核心技术突破：①开源策略打破技术壁垒，类比"全民可用的智能计算器"；②MLA注意力机制通过KV压缩降低93.3%显存消耗；③MoE架构实现50%训练成本削减；④混合精度框架兼顾计算效率与模型精度；⑤强化学习+思维链技术提升复杂任务处理能力。结合医疗诊断、金融风控等场景案例，揭秘其如何通过工程创新在文本、图像、音频多模态处理中实现突破，推动AI技术在垂直领域的低成本落地与规模化应用。

AI时代打工人的"十倍暴击"生存指南：你的工位正在被GPT化！

AI 学习系列

当ChatGPT开始撰写周报、Midjourney接管设计需求，职场人如何避免被AI浪潮淘汰？本文深度解析吴恩达提出的「10倍专业人士」理论，揭秘电商、医疗、营销等领域的AI增效实战案例。从「AI炼丹术」到「人机合体技」，教你用GPT化工作流实现生产力十倍暴增，打造不可替代的职场竞争优势。拒绝躺平，掌握与AI共舞的生存法则！

从青铜到王者：30组魔法公式解锁DeepSeek隐藏潜能

AI 学习系列

本书为你呈现30组精心设计的"魔法公式"，助你从AI新手蜕变为DeepSeek驾驭高手。

从入门到精通：用Cherry-Studio玩转本地知识库，这个职场神器你值得拥有

AI 学习系列

从入门到精通：用Cherry-Studio玩转本地知识库，这个职场神器你值得拥有

打破信息茧房！RAG技术如何让AI拥有“实时外挂大脑“？

AI 学习系列

今天要聊一个让AI从"嘴炮王者"变身"学术裁缝"的黑科技——RAG（检索增强生成）。这货堪称人工智能界的"人形自走图书馆"，专治模型胡编乱造的老毛病！

薅百度羊毛指南：白嫖Deepseek-R1的「满血版」正确姿势

AI 学习系列

听说百度云千帆平台最近把Deepseek-R1模型当「赛博菩萨」供着，免费开放期间连算力费用都替你充功德？与其在官网挤成沙丁鱼罐头，时不时就碰见“服务器繁忙”的报错，不如跟我玩转这套「白嫖经济学」。

用Ollama三分钟部署DeepSeek！零配置+小白友好，让你的电脑秒变AI神器

AI 学习系列

如果你曾因配环境、装CUDA、解决依赖冲突而头秃——Ollama来了！它像“AI模型的全自动管家”，一句命令拉取模型、零配置启动，甚至内置API，连你家的猫都能学会（夸张了，但真的简单）。

Spring容器的本质

转载

文章详细讨论了Spring框架中IoC容器的核心机制，包括BeanFactory和ApplicationContext的实现。通过分析Spring源码，解释了依赖注入、工厂模式、单例模式等设计模式在Spring中的应用。

微调碾压RAG？大模型意图识别工程化实践

转载

本文介绍了大模型意图识别能力在智能电视AI OS中的落地过程和思考。文章详细探讨了传统NLP算法的不足，并提出了基于大模型的解决方案，包括RAG和SFT方法。还讨论了意图识别在智能电视中的具体应用场景、挑战及优化策略。

漫谈DeepSeek及其背后的核心技术

转载

文章介绍了DeepSeek公司的大模型技术，特别是其V3版本的核心技术。讨论了模型的架构、训练和推理成本以及创新的MLA注意力机制和无辅助损失负载均衡策略。还探讨了用于FP8训练的混合精度框架和多Token预测的训练目标，展示了DeepSeek在AI领域的创新和低成本优势。