马斯克庭审自曝:Grok 模型曾蒸馏 ChatGPT
马斯克在诉 OpenAI 庭审中承认,其 xAI 公司开发的 Grok 模型在早期训练中使用了从 ChatGPT 蒸馏的数据,与其指控 OpenAI“背叛使命”的立场形成讽刺性反差。
Meta 收购人形机器人初创公司 Assured Robot Intelligence
Meta 宣布收购该机器人公司,以增强其用于机器人的 AI 模型能力,加速人形机器人领域布局。
五角大楼与 OpenAI、Google、Nvidia 等签署机密网络 AI 部署协议,排除 Anthropic
美国国防部与多家 AI 巨头达成协议,允许在机密环境中使用其 AI 工具,但此前合作的 Anthropic 被排除在外,因其此前在军事用途条款上与五角大楼存在争议。
微软在 Word 中推出面向法律团队的 AI Agent "Legal Agent"
该 Agent 专为合同审查、编辑历史追踪等法律场景设计,遵循结构化法律工作流,而非通用 AI 模型。
Anthropic 可能在未来两周内完成 9000 亿美元估值融资
据知情人士透露,Anthropic 已要求投资者在 48 小时内提交最新一轮融资的认购意向,估值或达 9000 亿美元以上。
苹果官方 App 误打包 Claude.md,内部运行定制版 Claude 模型
苹果某官方应用发布时意外包含 Claude 模型配置文件,揭示苹果内部正在使用定制版 Claude。
华为携手中科大发布 "灵境造物",基于全栈国产化软硬件
该项目基于 openJiuwen 和 Coordination Engineering 全栈技术,旨在打造国产 AI 生态基础设施。
突破视觉仿真算力瓶颈!新一代具身智能仿真框架开源
该框架实现高吞吐并行高保真渲染,支持真机部署"零微调",显著降低具身智能训练成本。
迪士尼乐园启用面部识别技术
迪士尼乐园已开始对游客使用面部识别技术,引发隐私关注。
AI 图像处理首次实现在轨卫星上运行
Planet Labs 的 Pelican-4 卫星成功在太空中运行 AI 模型,实时识别地面飞机目标。
Warp 推出 Agentic 开发环境,从终端进化而来
知名终端工具 Warp 正式转型为 Agentic 开发环境,支持 AI 驱动的编程工作流。
开源项目 rtk:CLI 代理减少 LLM Token 消耗 60-90%
单 Rust 二进制文件,零依赖,通过代理方式显著降低开发命令的 Token 消耗。
Nemotron 3 Nano Omni:高效开源多模态模型
NVIDIA 发布 Nemotron 3 Nano Omni,原生支持音频输入,在文档理解、长音频视频理解和 Agent 计算任务上领先。
Step-level Optimization for Efficient Computer-use Agents
提出计算机使用 Agent 的步骤级优化方法,解决当前 Agent 每步都调用大模型导致的昂贵和缓慢问题。
Safety Drift After Fine-Tuning:高风险领域证据
对 100 个模型的分析表明,微调后模型在医疗和法律等高风险领域的安全性能显著下降,而安全评估通常只针对基座模型。
Claw-Eval-Live:面向演化真实工作流的实时 Agent 基准
提出一个实时更新的 Agent 基准,解决现有基准任务冻结、无法评估 Agent 应对动态工作流能力的问题。
Efficient Training on Multiple Consumer GPUs with RoundPipe
提出 RoundPipe 流水线并行方案,解决消费级 GPU 训练 LLM 时的权重绑定问题,提升多卡训练吞吐量。
The Last Human-Written Paper:Agent-Native 研究制品
提出 Agent 原生研究制品的概念,认为传统论文线性叙事丢弃了大部分研究过程,应转向支持 Agent 理解的结构化研究制品。
PhyCo:可控物理先验生成运动
提出 PhyCo 框架,将连续、可解释的物理控制引入视频生成,解决物体漂移、碰撞不真实等问题。
mattpocock/skills](https://github.com/mattpocock/skills)
⭐503:个人技能目录,直接来自其 .claude 目录,展示了 Claude Code 技能配置的最佳实践。
★★★★☆
Claude Code 技能配置参考模板,实用性强。
ruvnet/ruflo](https://github.com/ruvnet/ruflo)
⭐222:面向 Claude 的 Agent 编排平台,支持多智能体群、自主工作流和 RAG 集成,企业级架构。
★★★★★
Claude 生态 Agent 基础设施,直接可用的多 Agent 部署方案。
withastro/flue](https://github.com/withastro/flue)
⭐193:沙箱 Agent 框架,来自 Astro 团队。
★★★★★
知名团队出品的新 Agent 框架,值得关注。
1jehuang/jcode](https://github.com/1jehuang/jcode)
⭐83:编码 Agent 工具集(Coding Agent Harness)。
★★★★★
新兴编码 Agent 框架,适合开发者快速搭建 AI 编程工作流。
virattt/dexter](https://github.com/virattt/dexter)
⭐61:自主金融深度研究 Agent。
★★★★★
垂直领域 Agent 标杆项目,展示 AI 在金融分析中的应用潜力。
💡 今日观察
今日最值得关注的信号是 **Agent 生态的全面爆发与基础设施定型**。从微软的 Legal Agent 到开源的 ruflo、flue、jcode,Agent 已从概念验证进入工程化落地阶段,且正从通用 Agent 向法律、金融、机器人等垂直领域深度渗透。同时,**马斯克庭审自曝蒸馏 ChatGPT** 和 **五角大楼排除 Anthropic** 两件事共同指向一个趋势:AI 行业的商业伦理与数据合规正在成为真正的竞争壁垒,而非口号。最后,**Nemotron 3 Nano Omni** 和 **RoundPipe** 等开源成果表明,小模型高效化与消费级硬件训练正在降低 AI 开发门槛,这对个人开发者和小团队而言是重大利好。