Tomcat 如何配置 Redis 实现 Session 共享?详细步骤与配置说明


本文详细介绍了在Tomcat中配置Redis实现Session共享的步骤,包括配置文件位置(context.xml和server.xml)、所需依赖JAR包、RedisSessionManager初始化参数说明以及测试验证方法。通过配置RedisSessionManager,可以将会话数据存储在Redis中,实现多个Tomcat实例间的会话共享。

Q4_K_M量化技术解析:4-bi混合量化如何实现大模型显存降低70%?


Q4_K_M是一种针对大语言模型的4-bit混合量化策略,通过分组量化(K-Quantization)和动态校准技术,显著降低显存占用70%(如70B模型从140GB降至42GB),同时保持推理精度损失在1%以内。该技术适用于边缘设备、低成本部署和大规模推理场景,已成为开源社区的事实标准。

用AI写代码省时省力?小心给黑客开了后门!你的智能助手真的可靠吗?


文章探讨了AI编程带来的安全风险,包括Agent Memory功能漏洞、上下文添加机制的供应链污染、Guidelines功能的定向误导以及MCP协议的指令劫持与权限滥用等攻击路径。同时提出了多层安全架构与数据保护、AI模型与行为监控体系、上下文安全与执行隔离、漏洞管理与应急响应以及安全意识与协作生态等系统性防御策略。呼吁企业将AI安全纳入DevSecOps流程,构建覆盖数据、模型、协议、生态的全生命周期安全体系。

腾讯优化DeepSeek的DeepEP通信框架:开启AI大模型训练新时代


腾讯星脉网络团队优化了DeepSeek的DeepEP通信框架,显著提升了AI大模型训练的效率。DeepEP是全球首个专为混合专家模型设计的开源通信库,解决了MoE架构对NCCL的依赖问题。腾讯通过智能化带宽分配、绕过CPU控制面及原子化信令协同等关键技术,使DeepEP在RoCE网络环境性能提升100%,IB网络环境提升30%。这一合作推动了技术创新,为企业提供了高效解决方案,并加速了AI应用的普及。

轻松理解TensorFlow会话(Session)


本文介绍了TensorFlow框架中会话(Session)的作用和使用方法。会话(Session)是连接计算图和实际计算的桥梁,负责启动图中的节点操作并管理运行时资源。文章通过类比建筑蓝图和施工团队,形象地解释了会话的作用,并提供了创建会话、运行计算图以及使用`with`语句和交互式会话的代码示例。

大模型文件类型揭秘:从基础到面试挑战


本文深入探讨了大模型的文件类型,分为模型文件和数据文件两大类。模型文件包括权重文件(如.pt/.pth、.ckpt、.safetensors、.bin)、配置文件(如config.、generation_config.)、词汇表文件(如tokenizer.)以及其他格式(如SavedModel、ONNX、HDF5、量化格式和GGUF)。数据文件涵盖文本文件(.txt、.csv、.)、文档文件(.doc、.pdf)、图像文件和音频文件。文章还提供了相关面试题及解析,帮助读者巩固知识并应对实际工作挑战。

2025年阿里Qwen3开源来袭,解锁大模型新体验!


阿里巴巴于2025年4月29日开源了新一代通义千问Qwen3系列模型,该系列在性能、成本、多语言支持等方面均有显著突破。Qwen3在多项测评中超越主流模型,采用混合专家(MoE)架构降低部署成本,支持119种语言,并推出8款不同尺寸模型满足多样需求。技术突破包括数据规模翻倍、四阶段训练流程等。文章还提供了本地部署和微调的实操示例,并展望了Qwen3的开源生态与未来发展方向。

告别低效工作与专业难题!字节扣子空间开启个性化智能协作新时代(附邀请码)


字节扣子空间(Coze Space)是字节跳动推出的AI Agent平台,由国产大模型驱动,提供任务自动化、专家Agent生态及扩展集成功能。平台支持探索模式和规划模式,适用于文档整理、市场调研、旅行规划等场景,显著提升工作效率和专业支持。内置专家Agent如华泰A股观察助手和用户研究专家,提供股票分析、用户研究等专业服务。个性化服务包括商品推荐和旅行规划。目前处于内测阶段,需邀请码使用。

让每个GitHub仓库“开口说话”:DeepWiki如何革新代码理解方式?​


DeepWiki是全球首个为GitHub仓库打造的AI文档助手,通过对话式问答、深度分析和智能索引等功能,帮助开发者快速理解复杂代码库。它解决了传统代码阅读中的文档缺失、逻辑复杂和时间成本高等问题,支持公开和私有仓库,已索引3万个仓库并处理40亿行代码。案例显示能显著提升开发效率,未来计划增强多语言支持和调试功能,构建开发者社区。

Tomcat7 Host头攻击漏洞修复指南:Web.xml配置+Servlet过滤器双重方案


本文详细介绍了针对Tomcat7的HTTP Host头攻击漏洞的修复方案,包括Tomcat配置调整(限制Host头匹配范围、设置默认无效主机)、应用层过滤器实现(校验Host头合法性)、应用代码修复(避免直接使用Host头生成URL)、反向代理增强防护(Nginx配置示例)以及验证测试方法。通过多层级防护措施,有效防御Host头攻击。