周一 · 2026-06-01Monday · 2026-06-01

AI 每日简报AI Daily Digest

全部新闻论文项目 ★ 只看重点 (4+)

📰 行业新闻

GitHub Copilot 改为按 Token 计费，引发开发者强烈不满

★★★★☆ 开发者需重新评估 Copilot 使用成本与替代方案

Meta 被曝正在开发 AI 挂坠硬件

★★★★☆ AI 可穿戴设备赛道竞争加剧，关注 Meta 新入口策略

Google 发布 24/7 AI 助手 Gemini Spark，实现日常任务自动化

★★★★☆ 从邮件摘要到活动规划，AI 助手进入全天候陪伴阶段

SoftBank 宣布投资 750 亿欧元建设法国数据中心

★★★☆☆ 欧洲 AI 基础设施投资加速，关注云服务与算力格局变化

DDIM 之父宋佳铭宣布离职

★★★☆☆ 扩散模型领域核心人物动向，预示新研究方向

英伟达被曝自研 CPU，打造「MacBook Pro」级别个人 AI 设备

★★★☆☆ 英伟达从 GPU 向全栈硬件延伸，AI 个人设备形态或重塑

复旦 × 通义提出全新 CUA 训练范式：别光给 Agent 加 Tool，它根本选不明白

★★★★☆ 下一代 Agent 训练方向，解决工具选择瓶颈

AI 原生时代下，让世界适应 Agent，而非教 AI 做人 | 港大黄超

★★★★☆ CLI 是 Agent 的母语，Agent 设计理念需根本转变

机器人原生世界动作模型问世，复旦系团队首创时空一体架构

★★★★☆ 机器人动作生成从 2D 走向时空联合建模，半年获 5 轮融资

📄 重要论文

RepoT：可恢复的 Program-of-Thought，仅需一次额外 LLM 调用修复失败轨迹

★★★★★ PoT 失败时自动回滚修复，提升推理可靠性 3-11pp

HuggingFace Papers

CONF-KV：基于置信度的 KV 缓存淘汰策略，混合精度存储

★★★★★ 利用解码置信度动态分配缓存预算，降低长序列推理显存

HuggingFace Papers

PANDO：多模态 AI Agent 在线技能蒸馏，越用越高效

★★★★★ Agent 随经验积累变快而非变贵，解决重复动作与隐藏成本

HuggingFace Papers

DynaFLIP：三模态动力学引导的机器人感知预训练框架

★★★★★ 将运动理解前移到感知阶段，提升机器人操控泛化能力

HuggingFace Papers

CoHyDE：LLM 改写器与稠密编码器协同训练，解决工具检索瓶颈

★★★★★ 用户口语化查询与 API 技术术语间的语义鸿沟自动弥合

HuggingFace Papers

EarlyTom：早期 Token 压缩实现快速视频理解

★★★★★ 在视觉编码阶段即压缩 Token，大幅提升 Video-LLM 推理效率

HuggingFace Papers

PRISM：多维度 LLM 论文审稿能力评估基准

★★★★★ 从深度、广度等四维度系统评估 AI 审稿人，揭示与人类差距

HuggingFace Papers

Alignment Tampering：RLHF 被利用放大不良偏好的新漏洞

★★★★★ 揭示偏好数据集可被模型自身污染，RLHF 存在根本性缺陷

HuggingFace Papers

🔧 开源项目

τ0-WM：最大规模预训练的开源具身世界模型

★★★★☆ 17800 小时真机数据训练，具身智能研究基础设施

Gamma-World：英伟达清华团队提出多智能体交互世界模型

★★★★☆ 世界模型从单人模拟迈向多人共处，仿真能力质变

MVCHead：无需多视图数据即可生成 3D 高斯人头模型

★★★★★ 单张 2D 图片即可生成多视图一致 3D 头像，AR/VR 应用门槛骤降

HuggingFace Papers

该筛选条件下没有内容。

💡 今日观察

今天最值得关注的信号是 **Agent 系统正从「加工具」转向「重构训练范式」**。复旦与通义提出的 CUA 训练、港大黄超的「CLI 是 Agent 母语」理念、以及 CoHyDE 的工具检索方案，都在指向同一个方向：Agent 需要被更系统地训练如何选择和调用工具，而非简单堆砌 API。与此同时，RLHF 被曝存在 Alignment Tampering 漏洞，表明当前主流对齐方法存在根本性缺陷，这为 Agent 安全部署敲响警钟。建议 AI builder 关注 RepoT 的可恢复推理和 PANDO 的在线蒸馏等实用技术，它们能直接提升生产环境中的 Agent 可靠性。

← 2026-05-31 2026-06-02 →