周一 · 2026-06-01Monday · 2026-06-01

AI 每日简报AI Daily Digest

全部新闻论文项目 ★ 只看重点 (4+)

📰 行业新闻

GitHub Copilot 改为按 Token 计费,引发开发者强烈不满
★★★★☆ 开发者需重新评估 Copilot 使用成本与替代方案
Meta 被曝正在开发 AI 挂坠硬件
★★★★☆ AI 可穿戴设备赛道竞争加剧,关注 Meta 新入口策略
Google 发布 24/7 AI 助手 Gemini Spark,实现日常任务自动化
★★★★☆ 从邮件摘要到活动规划,AI 助手进入全天候陪伴阶段
SoftBank 宣布投资 750 亿欧元建设法国数据中心
★★★☆☆ 欧洲 AI 基础设施投资加速,关注云服务与算力格局变化
DDIM 之父宋佳铭宣布离职
★★★☆☆ 扩散模型领域核心人物动向,预示新研究方向
英伟达被曝自研 CPU,打造「MacBook Pro」级别个人 AI 设备
★★★☆☆ 英伟达从 GPU 向全栈硬件延伸,AI 个人设备形态或重塑
复旦 × 通义提出全新 CUA 训练范式:别光给 Agent 加 Tool,它根本选不明白
★★★★☆ 下一代 Agent 训练方向,解决工具选择瓶颈
AI 原生时代下,让世界适应 Agent,而非教 AI 做人 | 港大黄超
★★★★☆ CLI 是 Agent 的母语,Agent 设计理念需根本转变
机器人原生世界动作模型问世,复旦系团队首创时空一体架构
★★★★☆ 机器人动作生成从 2D 走向时空联合建模,半年获 5 轮融资

📄 重要论文

RepoT:可恢复的 Program-of-Thought,仅需一次额外 LLM 调用修复失败轨迹
★★★★★ PoT 失败时自动回滚修复,提升推理可靠性 3-11pp
CONF-KV:基于置信度的 KV 缓存淘汰策略,混合精度存储
★★★★★ 利用解码置信度动态分配缓存预算,降低长序列推理显存
PANDO:多模态 AI Agent 在线技能蒸馏,越用越高效
★★★★★ Agent 随经验积累变快而非变贵,解决重复动作与隐藏成本
DynaFLIP:三模态动力学引导的机器人感知预训练框架
★★★★★ 将运动理解前移到感知阶段,提升机器人操控泛化能力
CoHyDE:LLM 改写器与稠密编码器协同训练,解决工具检索瓶颈
★★★★★ 用户口语化查询与 API 技术术语间的语义鸿沟自动弥合
EarlyTom:早期 Token 压缩实现快速视频理解
★★★★★ 在视觉编码阶段即压缩 Token,大幅提升 Video-LLM 推理效率
PRISM:多维度 LLM 论文审稿能力评估基准
★★★★★ 从深度、广度等四维度系统评估 AI 审稿人,揭示与人类差距
Alignment Tampering:RLHF 被利用放大不良偏好的新漏洞
★★★★★ 揭示偏好数据集可被模型自身污染,RLHF 存在根本性缺陷

🔧 开源项目

τ0-WM:最大规模预训练的开源具身世界模型
★★★★☆ 17800 小时真机数据训练,具身智能研究基础设施
Gamma-World:英伟达清华团队提出多智能体交互世界模型
★★★★☆ 世界模型从单人模拟迈向多人共处,仿真能力质变
MVCHead:无需多视图数据即可生成 3D 高斯人头模型
★★★★★ 单张 2D 图片即可生成多视图一致 3D 头像,AR/VR 应用门槛骤降
该筛选条件下没有内容。

💡 今日观察

今天最值得关注的信号是 **Agent 系统正从「加工具」转向「重构训练范式」**。复旦与通义提出的 CUA 训练、港大黄超的「CLI 是 Agent 母语」理念、以及 CoHyDE 的工具检索方案,都在指向同一个方向:Agent 需要被更系统地训练如何选择和调用工具,而非简单堆砌 API。与此同时,RLHF 被曝存在 Alignment Tampering 漏洞,表明当前主流对齐方法存在根本性缺陷,这为 Agent 安全部署敲响警钟。建议 AI builder 关注 RepoT 的可恢复推理和 PANDO 的在线蒸馏等实用技术,它们能直接提升生产环境中的 Agent 可靠性。

← 2026-05-31 2026-06-02 →