AI算力
全球显卡价格平均上涨15%,RTX 5090涨幅高达32%,理财属性拉满
根据VideoCardz对10个国家和地区的14款当代显卡最低现货价格统计,过去三个月间全球显卡价格平均上涨15%。RTX 5090全球均涨32%,RTX 5070 Ti紧随其后,均涨25%。中国国内,涨幅最高的反而是RTX 5060 Ti 16G,达23.08%。AMD和Intel整体表现较为克制。
AI算力
根据VideoCardz对10个国家和地区的14款当代显卡最低现货价格统计,过去三个月间全球显卡价格平均上涨15%。RTX 5090全球均涨32%,RTX 5070 Ti紧随其后,均涨25%。中国国内,涨幅最高的反而是RTX 5060 Ti 16G,达23.08%。AMD和Intel整体表现较为克制。
AI大模型
梳理了大语言模型中的 Token 和 Embedding 概念,解释模型为何先通过 Tokenizer 将文本转为离散编号,再用 Embedding 将编号映射到高维向量空间。对比语言模型内部的 Token Embedding 与 RAG 场景中的文本 Embedding,说明二者在架构相似但训练目标和用途不同。
AI算力
2025年GPU算力租赁市场突破千亿规模,但价格大幅回落超70%。市场从"抢卡"转向"拼交付",推理需求快速崛起预计2028年占比达73%。企业竞争焦点转向异构调度、绿色能效和生态服务能力。东数西算与算力券政策强力引导,液冷技术使PUE降至1.1,行业迈向高质量发展阶段。
AI Agent
本文从 Prompt 入手,梳理了 Agent 如何通过工具完成实际操作,以及 Function Calling 如何标准化工具描述。重点介绍 MCP 作为模型外部工具层通信协议的角色,并与 Anthropic 的 Skills 进行对比,指出二者本质差异在于“对模型的信任程度”与复杂度取舍。
AI Agent
Agent Swarm不是"集群"而是"蜂群"——通过彼此影响、自组织产生涌现智慧。Agent Teams用16个AI蜜蜂两周写出C编译器,验证了2026年AI主线:Orchestration编排架构。Qwen3 Coder Next以长上下文、强Agent能力成为蜂群关键拼图,证明这不是炒作而是范式转变。
AI算力
本文围绕近期出现的 32GB 魔改版 RTX 5080 显卡展开,梳理了其来源、改装方式及面向的本地 AI 运算市场。解释了为何在大模型推理场景下,显存容量往往比纯算力更关键,以及 32GB 版 5080 如何以低于 5090 的成本填补高显存需求空档。
AI大模型
本文通过Base64解码、古诗词创作、逻辑推理、UI复刻、游戏开发、Bug排查等多维度实测对比刚刚发布的Claude Opus 4.6和GPT 5.3。Opus 4.6在UI设计和可视化方面表现突出,拥有100万Token超大上下文;GPT 5.3 Codex则在代码规范、响应速度上领先,且成本降低50%。
AI算力
自 2025 下半年以来,DDR5 和服务器 DRAM 价格出现 400%–500% 的历史级暴涨,AI 服务器与 HBM 抢占了绝大部分先进产能。本文从 AI 军备赛、HBM 产能挤压、DRAM 定价逻辑变化和厂商策略等角度进行拆解,以及国产存储与新型存储技术的潜在机会。
AI大模型
Kimi K2.5 是最新发布的国产开源多模态大模型,支持 256K 上下文,并在图片、视频理解和 Agent Swarm 多智能体协作上大幅升级。实测在前端开发、PPT 报告生成、大规模信息整理等场景表现出色,但在事实准确性和视觉细节识别上仍需人工把关,整体已足以支撑新一代 AI 应用。
AI Agent
OpenClaw(原 Clawdbot / Moltbot)在短时间内冲上 GitHub 热门,背后代表的是“能真正动手”的第五代 AI 代理形态。本文介绍 OpenClaw 是什么、核心架构和典型使用场景,并重点讨论它的部署方式与安全风险,最后分析哪些人适合上手这类 AI Agent 系统。
科研及应用
本文介绍分子动力学模拟的计算特点,解释 GROMACS 如何将高度并行的非键相互作用交给 GPU、将控制与约束等逻辑留在 CPU 端,形成典型的 CPU–GPU 协同架构。结合实测结果,说明 GPU 性能发挥高度依赖 CPU 配置和体系规模。最后给出本地和算力云的选卡与配比建议。
AI大模型
本文梳理了DeepSeek V4可能采用的核心技术路线:通过 Ingram 条件记忆模块将大部分静态知识迁移到 CPU 内存,并在 R1 训练范式的基础上压缩训练与部署成本。“算力+记忆双轴”架构有望显著降低大模型门槛,对 OpenAI 等闭源路线及 GPU 主导的算力商业模式形成压力。