OpenAI 发布 GPT-5.5 Instant,声称幻觉率降低 52.5%
新模型成为 ChatGPT 默认模型,在法律、医学、金融等敏感领域幻觉大幅减少,同时保持低延迟。
OpenAI 总裁 Brockman 当庭承认持有 300 亿美元股份,马斯克诉讼现重大转折
Brockman 在法庭上承认零元投入持有 OpenAI 营利部门 300 亿美元股份,且与 Altman 均持有 Cerebras 个人股份。
Google、Microsoft、xAI 同意美国政府审查新 AI 模型
美国商务部 CAISI 将对这些公司的新模型进行发布前评估,这是 AI 监管的重要里程碑。
Google DeepMind 员工投票成立工会,反对军事 AI 项目
英国员工希望通过工会力量阻止公司 AI 模型用于军事场景。
苹果同意支付 2.5 亿美元和解 Siri AI 未兑现集体诉讼
因未按时交付 Apple Intelligence 功能,苹果向美国 iPhone 16/15 Pro 用户赔偿。
Apple 计划在 iOS 27 中让用户自由选择 AI 模型
用户可自定义第三方聊天机器人驱动系统级 AI 功能,类似"AI 模型商店"。
Microsoft 放弃 Xbox Copilot AI 项目
新 Xbox CEO 宣布停止移动端和主机端 Copilot 开发,团队并入 CoreAI 部门。
OpenAI 计划推出 ChatGPT 手机,2027 年初量产
供应链分析师郭明錤透露,手机将运行定制版 OS,不依赖安卓/iOS。
Etsy 在 ChatGPT 中推出原生应用
用户可在 ChatGPT 内完成对话式购物体验,这是 AI 应用商店模式的又一案例。
Meta 用 AI 分析身高和骨骼结构识别未成年用户
视觉分析系统已在部分国家部署,将推广至更多地区。
五大出版商起诉 Meta,指控 Llama 训练"逐字复制"侵权
Macmillan、McGraw Hill 等指控 Meta 实施了"史上最大规模版权侵权"。
CopilotKit 获 2700 万美元融资,帮助开发者部署原生 AI Agent
西雅图初创公司提供应用内 AI Agent 框架,由 Glilot Capital 等领投。
MolmoAct2:面向真实部署的动作推理模型
全开源视觉-语言-动作模型,解决机器人控制中的延迟、硬件依赖和成功率问题。
HiL-Bench:Agent 何时该求助?
新基准测试发现前沿编码 Agent 在模糊需求下会崩溃,核心瓶颈不是能力而是判断力。
Haiku:链接空间生物学与临床组织学的三模态对比学习模型
整合分子、形态和临床数据,覆盖 11 种器官类型、1606 名患者。
线性时间全局视觉建模,无需显式注意力机制
证明注意力可重写为 MLP 形式,实现全局建模的线性复杂度。
计数作为语言模型可靠性的最小探针
提出稳定计数能力测试,发现模型在简单计数任务中暴露逻辑推理缺陷。
Agentic AI 应设计为边际 Token 分配器
从经济视角重新定义 AI Agent 系统,将路由、代理、服务和交易四层统一设计。
OceanPile:大规模多模态海洋语料库
解决海洋数据碎片化问题,为海洋 AI 基础模型提供统一训练数据。
ruvnet/ruflo (⭐291)
Claude 的 Agent 编排平台,支持多智能体集群、RAG 集成和 Claude Code/Codex 原生支持。
addyosmani/agent-skills (⭐96)
面向 AI 编码 Agent 的生产级工程技能集,可直接集成到 Claude Code 等工作流。
raullenchai/Rapid-MLX (⭐66)
Apple Silicon 上最快的本地 AI 引擎,比 Ollama 快 4.2 倍,支持 17 种工具解析器。
virattt/dexter (⭐55)
深度金融研究自主 Agent,可进行 AI 驱动的财务分析和报告。
1jehuang/jcode (⭐54)
编码 Agent 框架,提供统一的 Agent 开发和部署环境。
fspecii/ace-step-ui (⭐47)
ACE-Step 1.5 音乐生成的开源 UI,免费本地运行,号称 Suno 替代品。
rtk-ai/rtk (⭐80)
CLI 代理,可减少 LLM Token 消耗 60-90%,单 Rust 二进制文件,零依赖。