AI 每日简报 AI Daily Digest

英伟达发布 RTX Spark 自研 CPU，联手微软、戴尔、惠普打造 AI Agent PC

英伟达正式进军消费级 CPU 市场，推出基于 Arm 架构的芯片，旨在将 AI Agent 能力带到个人电脑。

★★★★★ PC 产业迎来 Arm+AI 架构革命，开发者需关注新生态。

Google 发布 Gemini Spark AI Agent，全天候替你执行任务

Google 推出 "24/7" AI Agent，可在浏览器中自主完成复杂任务，但存在隐私和成本顾虑。

★★★★★ Agent 产品化进入消费级市场，但隐私定价模式待解。

The Verge

Microsoft Build 大会前瞻：新 AI 模型和 Windows 重大改进即将发布

微软将在本周 Build 大会上展示全新 AI 模型及 Windows 开发模式更新，被视为公司转型的关键时刻。

★★★★★ Windows 平台 AI 原生化，开发者生态将迎重大变化。

The Verge

OpenAI 重返机器人赛道，四大核心岗位开放招聘

OpenAI 重新启动机器人项目，招聘年薪超 200 万的工程岗位。

★★★★☆ LLM+机器人融合趋势明确，具身智能赛道升温。

VAST 完成近 2 亿美元融资，正式披露世界模型技术路线

3D AI 公司 VAST 获巨额融资，主打多人实时同屏场景生成。

★★★★☆ 3D 生成赛道资本加码，世界模型商业化加速。

佛罗里达州起诉 OpenAI 和 Sam Altman，指控 ChatGPT 与暴力事件有关

首例州政府针对 AI 公司提起的诉讼，涉及校园枪击案中 AI 的角色认定。

★★★★☆ AI 安全责任边界引发法律挑战，监管风险升级。

AI 天气创业公司 WindBorne 超越政府机构预报水平

利用 400 个气球实时采集数据，结合自研模型实现更精准的天气预报。

★★★★☆ AI+物理数据闭环的垂直应用范例，验证小公司可突破传统壁垒。

Alphabet 计划筹资 800 亿美元用于 AI 基础设施建设

Google 母公司称企业及消费者对 AI 服务的需求远超现有供应能力。

★★★☆☆ AI 算力军备竞赛持续升级，基础设施投资规模惊人。

Meta 的 AI 客服机器人被利用来劫持 Instagram 账号

黑客通过诱导 Meta AI 客服修改账户邮箱实现账号盗取。

★★★★☆ AI Agent 安全漏洞暴露，权限控制机制亟待加强。

The Verge

DuckDuckGo 推出 "无 AI" 浏览器扩展，流量激增

反 AI 搜索引擎 DuckDuckGo 为 Chrome 和 Firefox 发布无 AI 扩展，用户增长显著。

★★★★☆ AI 疲劳情绪显现，"去 AI" 成为新市场差异化方向。

Majestic Labs 发布新 AI 服务器，试图突破 "内存墙" 瓶颈

针对 LLM 推理的内存带宽限制，新硬件架构直接解决 token 生成速度瓶颈。

★★★★☆ 硬件层面突破 LLM 推理性能瓶颈，对部署成本影响深远。

IEEE Spectrum

复旦 × 通义提出全新 CUA 训练范式：别光给 Agent 加 Tool，它根本选不明白

研究发现 Agent 在多个工具间选择能力不足，提出新一代训练方法。

★★★★☆ Agent 工具选择能力瓶颈被揭示，训练范式需升级。

📄 重要论文

Mellum 2 技术报告发布：12B 参数 MoE 代码专用模型

开源 12B 参数 MoE 模型，2.5B 活跃参数，专注软件工程全流程，支持代码生成、调试、Agent 编程。

★★★★★ 小参数开源模型在代码领域达到实用水平，降低部署门槛。

从模型扩展到系统扩展：Agentic AI 的 "缰绳" 缩放

论文提出未来 Agent AI 的瓶颈在于系统架构设计（harness scaling），而非模型参数缩放。

★★★★★ Agent 系统设计方法论转向，可审计、模块化架构成关键。

物理 AI 推理的 "内存墙" 真相：Batch-1 LLM 解码并非受限于带宽

研究发现单流推理场景下，延迟瓶颈来自内存容量而非带宽，颠覆传统认知。

★★★★★ 机器人、自动驾驶等实时场景的推理优化方向需重新评估。

VisualThink-VLA：视觉中间推理实现低延迟视觉-语言-动作策略

提出用视觉推理替代文本 Chain-of-Thought，大幅降低 VLA 策略的推理延迟。

★★★★★ 具身智能推理范式革新，解决实时控制延迟痛点。

GrepSeek：训练搜索 Agent 直接与文本库交互

让 LLM Agent 将语料库本身作为搜索环境，通过 grep 操作替代传统检索器。

★★★★★ 知识密集型任务的新搜索范式，Agent 可直接操作底层数据。

材料版 AlphaFold 来了！40 个工业任务全面 SOTA

结合 LLM 训练方法，材料 AI 首次学会 "物理直觉"，在工业任务中取得突破。

★★★★☆ AI4S 在材料科学领域实现实质性突破，工业应用前景广阔。

🔧 开源项目

codegraph：预索引代码知识图谱，为 AI 编程助手减负

为 Claude Code、Codex、Gemini、Cursor 等工具提供本地代码知识图谱，减少 token 消耗和工具调用次数。

★★★★★ 大幅提升 AI 编程效率，降低 API 成本，100% 本地运行。

hermes-webui：Hermes Agent 的 Web 界面

提供浏览器端和移动端使用 Hermes Agent 的最佳体验。

★★★★★ Agent 使用门槛降至浏览器级别，移动端 AI Agent 体验。

headroom：压缩工具输出和日志，减少 60-95% token 消耗

在 LLM 前压缩工具输出、日志、文件，保持答案质量的同时大幅降低成本。

★★★★☆ Agent 系统 token 成本优化利器，支持库、代理、MCP 服务器。

harness：元技能系统，自动设计领域特定 Agent 团队

一个 meta-skill，能自动设计领域特定的 Agent 团队、定义专家 Agent 并生成所需技能。

★★★★★ Agent 系统自动编排，从 "写 Agent" 到 "设计 Agent 团队"。

trellis：号称 "最好的 Agent 缰绳"（harness）

专注于 Agent 系统架构设计的开源项目。

★★★★★ 呼应论文趋势，Agent 系统架构工具化开始涌现。

hyperframes：为 Agent 设计的 HTML 转视频工具

由 HeyGen 开源，写 HTML 即可渲染视频，专为 AI Agent 设计。

★★★★★ Agent 内容生成从文本扩展到视频，降低多模态生成门槛。