AI Daily Digest · 2026-05-13

全部新闻论文项目 ★ 只看重点 (4+)

📰 行业新闻

OpenAI 发布 GPT-Realtime-2，首个 GPT-5 级推理音频模型

该模型能实时理解并生成带有推理能力的语音，标志着 AI 从“听写”进化到“倾听与思考”。

★★★★★ 音频交互进入推理时代，语音应用开发范式将重塑

36Kr AI

Google Android Show 发布 AI-first Googlebooks、vibe-coded 小部件等重磅更新

Gemini Intelligence 深度嵌入系统，支持自动填表、Gboard 语音听写和自然语言创建桌面小部件。

★★★★★ Android 成为 AI 原生操作系统，开发者需关注新 API 生态

TechCrunch AI

OpenAI 推出 Daybreak 安全 AI 项目

基于 Codex Security Agent 自动发现和修复代码漏洞，对标 Anthropic 的 Claude Mythos。

★★★★★ AI 安全从被动防御转向主动攻防，企业安全架构需升级

The Verge AI

Mira Murati 的 Thinking Machines 公布“交互模型”新方向

让 AI 像人类一样持续感知音频、视频等多模态输入进行协作，而非单次问答。

★★★★★ 提出人机协作新范式，多模态持续交互或成下一代产品形态

The Verge AI

Sam Altman 庭审证词曝光：Ilya 持有 70 亿美元 OpenAI 股权，Musk 曾想将 OpenAI 交给子女

世纪庭审揭示 OpenAI 内部权力斗争与股权分配细节。

★★★★☆ 了解 OpenAI 治理结构演变，对 AI 公司治理有参考意义

量子位

Anthropic 警告投资者警惕二级市场股票交易

声明任何通过二级平台的股票转让均无效，不会在官方账簿上承认。

★★★★☆ AI 独角兽股权流动性受限，投资者需警惕二级市场风险

TechCrunch AI

Google 与 SpaceX 洽谈太空数据中心部署

将 AI 算力送入轨道，利用太空能源和冷却优势，尽管当前成本仍远高于地面。

★★★★☆ AI 基础设施向太空延伸，长期算力格局或受影响

TechCrunch AI

可灵 AI 被曝剥离快手单独融资，估值 200 亿美元

快手或将拆分出第二家“快手”，可灵独立发展加速商业化。

★★★★☆ AI 视频生成赛道资本化加速，独立估值对标国际竞品

量子位

OpenClaw 低调更新重磅版本，AI Agent 能看屏幕并操作鼠标键盘

新增屏幕感知和 GUI 操作能力，Agent 自动化能力大幅提升。

★★★★☆ Agent 从文本交互迈向 GUI 操控，自动化测试和 RPA 领域受益

量子位

Anthropic 发布法律服务 AI 工具

帮助律所自动化文档搜索、判例研究、取证准备和文件起草等事务性工作。

★★★★☆ AI 渗透专业服务领域，法律科技赛道竞争加剧

TechCrunch AI

📄 重要论文

InfoLaw: 面向大语言模型的信息缩放定律

提出质量加权混合数据和重复训练下的信息缩放框架，解决标准缩放定律在不同数据配方下无法可靠外推的问题。

★★★★★ 为预训练数据配比提供理论指导，直接降低训练成本

HuggingFace Papers

一个神经元就足以绕过 LLM 安全对齐

通过定位并操控单个拒绝门控神经元或概念神经元，即可绕过安全机制，横跨 7 个模型和两个模型家族。

★★★★★ 揭示安全对齐的脆弱性，推动更鲁棒的防御机制研究

HuggingFace Papers

ELF: 嵌入式语言流——连续扩散语言模型

证明连续扩散模型只需最小适配即可在语言建模上取得有效结果，挑战了离散 token 的统治地位。

★★★★★ 为语言生成提供新架构思路，可能改变文本生成范式

HuggingFace Papers

Crosslingual On-Policy Self-Distillation (COPSD) 多语言推理

将模型自身的高资源推理行为迁移到低资源语言，显著提升低资源语言数学推理能力。

★★★★★ 解决多语言推理不平衡问题，低资源语言应用受益

HuggingFace Papers

Conformal Agent Error Attribution: 多 Agent 系统错误归因框架

基于共形预测理论，为 LLM 多 Agent 系统提供有限样本、分布无关的错误归因保证。

★★★★★ Agent 系统调试有了理论保障，自动化恢复成为可能

HuggingFace Papers

🔧 开源项目

addyosmani/agent-skills ⭐67

面向 AI 编码 Agent 的生产级工程技能集，帮助 Agent 更好地理解和执行开发任务。

★★★★★ 标准化 Agent 工程能力，提升代码生成质量和可靠性

GitHub Trending

agentmemory ⭐80

基于真实基准测试的 #1 持久化记忆系统，专为 AI 编码 Agent 设计。

★★★★★ 解决 Agent 上下文丢失痛点，实现长期记忆和状态保持

GitHub Trending

datawhalechina/hello-agents ⭐64

《从零开始构建智能体》中文教程，系统讲解 Agent 原理与实践。

★★★★★ 降低 Agent 开发门槛，适合初学者快速入门

GitHub Trending

该筛选条件下没有内容。

💡 今日观察

今天最值得关注的信号是 **AI 产品形态正在从“问答”向“持续交互”和“环境操控”演进**。OpenAI 的 GPT-Realtime-2 让语音交互具备推理能力，Mira Murati 的 Thinking Machines 提出多模态持续协作范式，OpenClaw 新增屏幕操控能力——三者共同指向同一个方向：AI 不再只是聊天窗口里的助手，而是能看、能听、能操作的“数字同事”。对于开发者而言，这意味着应用架构需要从单次 API 调用转向长时会话管理和环境感知；对于创业者，Agent 操控 GUI 的能力将催生新一代自动化工具和 RPA 替代品。另外，Ilya 持有 70 亿美元 OpenAI 股权和 Anthropic 警告二级市场交易这两条新闻，提醒我们 AI 公司的治理和股权结构正成为不可忽视的风险因素。

AI 每日简报AI Daily Digest

📰 行业新闻

📄 重要论文

🔧 开源项目

💡 今日观察