AI 每日简报 AI Daily Digest

Google 发布 24/7 AI 助手 Gemini Spark，实测效果实用但定位模糊

Gemini Spark 能自动完成收件箱摘要、本地活动规划等日常任务，但作为独立产品推出的必要性存疑。

★★★★☆ 展示 AI Agent 在个人生活场景的实际落地形态

Meta 正在开发 AI 吊坠硬件

Meta 持续押注 AI 硬件，据报道正在研发一款 AI 吊坠，延续其在智能眼镜后的可穿戴 AI 策略。

★★★★☆ AI 硬件形态持续探索，可穿戴设备或成新入口

AI 芯片公司 Groq 据报正融资 6.5 亿美元，转向推理业务

在英伟达 200 亿美元“非收购式雇佣”之后，Groq 计划融资 6.5 亿美元，从硬件转向聚焦 AI 推理服务。

★★★★★ AI 芯片创业公司战略转型信号，推理市场争夺加剧

软银计划投资高达 750 亿欧元建设法国数据中心

软银宣布在法国开发和运营高达 5 GW 的数据中心容量，这是欧洲最大规模的 AI 基础设施投资之一。

★★★★☆ 全球 AI 算力军备竞赛加速，欧洲成为新战场

Cognition 创始人称 AI 编程代理不应取代人类

Devin 的创造者 Scott Wu 表示，AI 编程代理的设计初衷是辅助而非替代人类程序员。

★★★★☆ AI 编程工具定位的行业共识正在形成

Adobe 推出对话式 AI 设计助手，体验相当于“平庸的设计实习生”

Adobe 最新 AI 图像助手定位为创意过程中的协作工具，而非替代设计师的自动化方案。

★★★★☆ AI 创意工具从“替代”转向“协作”的产品思路

The Verge

比亚迪自研 4nm AI 芯片亮相，制程对齐英伟达

比亚迪发布自研 4nm 智驾芯片，宣称算力超越特斯拉，为智能驾驶领域带来国产替代新变量。

★★★★☆ 中国车企自研 AI 芯片突破，智驾供应链格局生变

面壁智能“开源周”发布端侧 AI 系统性方案

面壁智能通过系列开源发布，展示端侧 AI 从模型到部署的全链路能力。

★★★★☆ 端侧 AI 从单点突破走向系统化工程

英伟达清华团队提出 Gamma-World：多智能体世界模型

该工作将世界模型从单智能体扩展至多智能体交互仿真，为机器人学习和游戏 AI 提供新范式。

★★★★☆ 世界模型研究从“一个人玩”迈向“多人共处”

📄 重要论文

Reflective Prompt Tuning：通过函数调用实现提示自动优化

提出一种利用 LLM 自身函数调用能力进行反思式提示调优的方法，无需参数更新即可自动优化提示设计。

★★★★★ 自动化提示工程新范式，降低手动调优成本

CONF-KV：基于置信度的 KV 缓存淘汰策略

利用解码过程中模型的不确定性信号动态管理 KV 缓存预算，实现长上下文推理的高效内存使用。

★★★★★ 长上下文 LLM 推理的内存优化新方案

PANDO：通过在线技能蒸馏实现高效多模态 AI Agent

提出一种让多模态 Web Agent 随经验积累变得更高效而非更昂贵的在线蒸馏框架。

★★★★★ 解决 AI Agent 部署成本随使用增长的核心痛点

REPOT：可恢复的程序式思维链推理

通过确定性验证回放机制，在程序式思维链失败时仅需一次额外 LLM 调用即可恢复推理轨迹。

★★★★★ 提升代码生成推理的鲁棒性，成本极低

PRISM：评估 LLM 作为论文审稿人的多维基准

从深度、严谨性、建设性和可操作性四个维度评估 AI 审稿质量，揭示 LLM 与人类审稿人的差距。

★★★★★ 为 AI 辅助学术评审提供系统化评估框架

Alignment Tampering：RLHF 可能被利用来放大不良行为

揭示 RLHF 中偏好数据集可能被 LLM 自身输出的数据所影响，导致对齐机制被逆向利用。

★★★★★ 发现 RLHF 安全对齐的关键漏洞

🔧 开源项目

腾讯发布智能体创意工作室 Miora

一个创意设计版的 WorkBuddy，让用户拥有整个 AI 驱动的创意工作室。

★★★★☆ 降低创意设计门槛，一人即可完成团队级工作流

DynaFLIP：面向机器人操作的三模态动态感知预训练框架

结合图像-语言-3D 流三种模态，将运动理解前置到感知阶段，提升机器人操作性能。

★★★★★ 机器人感知预训练新范式，开源推动研究进展

ViGeo：面向视频的一致几何估计基础模型

基于纯 Transformer 架构，支持流式、全序列和长视频推理，实现时空一致的深度估计。

★★★★★ 视频几何估计的通用基础模型，开源可复现

CoHyDE：LLM 改写器与稠密编码器协同训练用于工具检索

迭代协同训练框架，解决用户自然语言查询与 API 技术词汇之间的语义鸿沟。

★★★★★ 提升 LLM Agent 工具调用的准确率