AI 每日简报 AI Daily Digest

Meta 在 Facebook 推出 AI Mode，从公开帖子中提取信息

新 AI 搜索模式可从 Facebook 公开帖子中提取信息生成回答，同时推出照片预设等多项 AI 功能。

★★★★☆ 社交平台 AI 搜索进入产品化阶段，数据来源策略值得关注

The Verge

Salesforce 以 36 亿美元收购 AI 客服平台 Fin

Salesforce 计划利用 Fin 的技术团队增强其 Agentforce 企业 AI Agent 平台。

★★★★☆ 企业级 AI Agent 并购加速，客户服务是落地最前线

Sarvam AI 获 2.34 亿美元融资，成为印度最新 AI 独角兽

印度 IT 服务巨头 HCLTech 领投 1.5 亿美元，Sarvam 估值超 10 亿美元。

★★★★☆ 非美 AI 生态加速独立，印度市场获资本重注

NewCore 获 6600 万美元融资，为 AI Agent 提供数字身份管理

NewCore 认为企业安全的下一个挑战是管理 AI Agent 而非人类员工。

★★★★☆ Agent 身份与安全成为新赛道，基础设施层面机会显现

Meta CTO Bosworth 承认公司 AI 重组“糟糕透顶”

内部备忘录中承诺改善稳定性、沟通和福利以提振士气。

★★★★☆ 大厂 AI 组织架构调整阵痛，管理挑战不容忽视

Wired

Meta 曾与五角大楼供应商合作测试眼镜面部识别

Rank One Computing 为 Meta 智能眼镜内部开发提供面部识别技术支持。

★★★★☆ 智能眼镜+面部识别的隐私争议持续，产品方向待观察

Wired

智谱推出最新旗舰模型 GLM-5.2

据氪星晚报报道，智谱已推出新一代旗舰模型。

★★★★☆ 国产大模型持续迭代，GLM 系列保持竞争力

36氪

OrcaRouter 低成本复刻 Fable 5 效果：多模型组队性能反超

通过多模型路由策略，以更低成本达到甚至超越顶级模型性能。

★★★★☆ 模型路由策略可大幅降低成本，中小团队也能用好强模型

量子位

📄 重要论文

Pythagoras-Prover：高效形式化证明的增强 Lean 框架

提出计算高效的 Lean 定理证明器家族，4B 和 32B 参数自回归模型及扩散模型，大幅降低训练和推理成本。

★★★★★ 开源高效定理证明器，降低 AI 数学推理门槛

Affordance20Q：从物理属性评估具身推理能力

提出新的 affordance 推理基准，防止模型仅靠记忆物体-功能映射作答，强制基于物理属性推理。

★★★★★ 暴露 LLM 物理推理短板，推动具身智能评估标准化

World Tracing：生成式像素对齐几何，超越可见表面

提出新方法，为每个像素预测有序的相机空间点堆叠，同时完成可见与不可见几何重建。

★★★★★ 图像转 3D 领域突破，兼顾保真度与完整性

Quickest Detection of Hallucination Onset：幻觉起点的最快检测

将幻觉检测建模为最快变化检测问题，建立理论下界并学习 CUSUM 统计量。

★★★★★ 为流式推理幻觉检测提供理论基础和实用算法

The Arbiter Agent：持续监控多 Agent 对话发现涌现失调

设计 Arbiter 代理实时监控多 LLM 对话，识别可能失调的参与者。

★★★★★ 多 Agent 安全监控工具，防止群体智能失控

AdaSR：自适应流式推理与分层相对策略优化

提出分层强化学习方法，让推理模型在信息流式到达时动态推理和更新。

★★★★★ 流式推理新范式，适用于音视频等动态场景

Measuring Epistemic Resilience of LLMs Under Misleading Medical Context

引入 MedMisBench 测试 LLM 在误导性医疗上下文中的认知韧性，发现高分模型轻易被误导。

★★★★★ 医疗 AI 安全性评估新基准，揭示高分不等于安全

🔧 开源项目

ponytail

让 AI Agent 像最懒的高级工程师一样思考——最好的代码是没写的代码。

★★★★★ 极简主义 AI 编码哲学，减少不必要的代码生成

headroom

压缩工具输出、日志、文件和 RAG 块，减少 60-95% token 消耗，回答质量不变。

★★★★☆ 大幅降低 LLM 使用成本，支持库/代理/MCP 服务器

Agent-Reach

让 AI Agent 能搜索 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书，零 API 费用。

★★★★★ 一站式跨平台信息获取，Agent 能力扩展利器

codegraph

预索引代码知识图谱，支持 Claude Code、Codex、Gemini、Cursor 等，减少 token 和工具调用。

★★★★★ 本地代码知识图，显著提升 AI 编码助手效率

hello-agents

《从零开始构建智能体》——从零开始的智能体原理与实践教程。

★★★★★ 系统性 Agent 入门教程，适合开发者快速上手

Pixelle-Video

AI 全自动短视频引擎。

★★★★☆ 自动化短视频生成，内容创作效率工具

rtk

CLI 代理，将常见开发命令的 LLM token 消耗降低 60-90%，单 Rust 二进制文件，零依赖。

★★★★☆ 轻量级 token 节省工具，开发者友好