AI 每日简报 AI Daily Digest

谷歌发布「AI联合数学家」，刷新最难数学AI基准SOTA

AI 与数学家协同，牛津教授借助该工具解开群论悬案，标志 AI for Math 迈出关键一步。

★★★★☆ 验证 AI 在数学前沿研究中的实用价值。

百度发布文心 5.1：搜索能力登顶国内，预训练成本仅为业界 6%

搜索、知识、Agent 能力全面提升，成本优势显著。

★★★★☆ 低成本高性能模型，对国内开发者部署友好。

阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一

中国语音 AI 模型首次登顶国际权威评测。

★★★★☆ 语音赛道国产模型取得里程碑式突破。

Anthropic 发布金融行业插件 (financial-services-plugins)

专为金融领域设计的 Claude 能力扩展，GitHub 星数快速攀升。

★★★★★ 填补金融垂直领域 AI 工具空白。

Nvidia 今年已承诺 400 亿美元 AI 股权投资

持续加码 AI 生态投资，成为行业最大金主之一。

★★★★☆ 信号级资本动向，影响 AI 初创融资环境。

TechCrunch

微软内部邮件曝光：曾担心 OpenAI 跑到亚马逊并「说 Azure 坏话」

Musk v. Altman 庭审文件揭示微软与 OpenAI 早期合作中的真实顾虑。

★★★★☆ 揭示巨头间竞争与合作的底层逻辑。

The Verge

铭凡发布全闪 S5/S7 NAS，联手英特尔推动端侧智能体

搭载英特尔处理器，定位本地智算与 AI 边缘计算。

★★★★☆ AI 计算向边缘端下沉的新硬件形态。

36Kr AI

美图 RoboNeo 全新升级：首创影像创作 Agent Teams

打造「赛博乙方天团」，多 Agent 协作完成影像任务。

★★★★☆ Agent Teams 模式在创意工具中的落地示范。

📄 重要论文

EMO: Pre-training Mixture of Experts for Emergent Modularity

提出新型 MoE 预训练方法，实现专家模块的涌现式分工，打破传统 MoE 领域性能退化问题。

★★★★★ MoE 架构新范式，可支持按领域子集高效推理。

StraTA: Strategic Trajectory Abstraction for Agentic RL

引入显式轨迹级策略抽象，解决长程决策中的探索与信用分配难题。

★★★★★ 提升 LLM Agent 在长周期任务中的强化学习效果。

Prescriptive Scaling Laws for Data Constrained Training

在数据受限场景下建模重复训练的超额损失，提出新的缩放法则指导预训练决策。

★★★★★ 解决高质量数据枯竭下的训练策略优化问题。

Balanced Aggregation: Understanding and Fixing Aggregation Bias in GRPO

发现 GRPO 中序列聚合 vs 令牌聚合的偏差问题，提出平衡聚合方案。

★★★★★ 改进主流强化学习训练方法，提升推理与代码生成效果。

KernelBench-X: Benchmark for Evaluating LLM-Generated GPU Kernels

涵盖 176 个任务、15 个类别，系统评估 LLM 生成 Triton Kernel 的正确性与效率。

★★★★★ 为 AI 自动编写 GPU 内核提供标准化评测基准。

🔧 开源项目

addyosmani/agent-skills

生产级 AI 编码 Agent 技能库，来自 Chrome 团队高工。

★★★★★ 可直接复用的 Agent 工程能力模板。

datawhalechina/hello-agents

中文《从零开始构建智能体》教程，适合入门学习。

★★★★★ 系统化的 Agent 构建中文教学资源。

HKUDS/AI-Trader

100% 全自动化 Agent 原生交易系统。

★★★★★ 金融 AI Agent 的完整实现参考。

lsdefine/GenericAgent

自进化 Agent，从 3300 行种子代码生长出完整技能树，token 消耗仅为传统方案的 1/6。

★★★★★ 自进化 Agent 的高效实现范例。

rtk-ai/rtk

CLI 代理，可将常见开发命令的 LLM token 消耗降低 60-90%，单 Rust 二进制文件零依赖。

★★★★☆ 显著降低 AI 编码工具使用成本。