AI大模型

AI大语言模型 (Large Language Model)，最新发布的大模型资讯，大模型天梯排行榜，大模型评测，大模型应用。

AI大模型

DeepSeek V4：用“记忆架构”改写大模型算力游戏？

本文梳理了DeepSeek V4可能采用的核心技术路线：通过 Ingram 条件记忆模块将大部分静态知识迁移到 CPU 内存，并在 R1 训练范式的基础上压缩训练与部署成本。“算力+记忆双轴”架构有望显著降低大模型门槛，对 OpenAI 等闭源路线及 GPU 主导的算力商业模式形成压力。

AI大模型

vLLM：把一块 GPU 吃干榨尽的大模型推理引擎

介绍了 vLLM 这一开源大模型推理引擎，解释其通过 PagedAttention 管理 KV Cache、通过连续批处理提升 GPU 利用率的核心机制，展示了 vLLM 在高并发场景下的吞吐优势。总结了 vLLM 在高并发 API 服务、企业级工程体系中的适用场景，并给出了一套从单机到服务化的实践入门路径。