OpenAI Codex 登陆移动端
OpenAI 宣布 Codex 桌面端 AI 编程工具正式接入 ChatGPT iOS/Android 应用,用户可在手机上执行代码和操作应用。
微软开始取消 Claude Code 许可证
微软内部开始大规模取消 Claude Code 使用权限,此前该公司曾向数千名员工开放该工具,包括项目经理和设计师。
Cerebras 完成 55 亿美元 IPO,首日暴涨 108%
AI 芯片公司 Cerebras 完成 2026 年首个大型科技 IPO,募资 55 亿美元,上市首日股价飙升 108%。
腾讯开源 Agent 记忆技术方案,Token 消耗降低 61%
腾讯发布开源 Agent 记忆方案,在降低 Token 消耗的同时,任务成功率最高提升 51%。
Meta 推出加密 AI 聊天功能 Incognito Chat
扎克伯格宣布 Meta AI 新增"完全私密"的加密聊天模式,这是首个不存储用户对话记录的 AI 产品。
OpenAI 准备对苹果采取法律行动
据报道,OpenAI 因 ChatGPT 与苹果集成效果远低于预期(订阅用户和曝光度未达标),正在探索对苹果采取法律行动。
田渊栋 AI 创业估值 315 亿,英伟达 AMD 参投
前 Meta AI 研究员田渊栋创立 AI 公司,估值达 315 亿元,谷歌 GV、英伟达、AMD 等参与早期融资。
Edge Copilot 新增跨标签页信息聚合功能
微软 Edge 浏览器更新,Copilot 可同时从用户所有打开的标签页中提取信息进行总结和对比。
FlowCompile:结构化 LLM 工作流的优化编译器
提出一种针对多 Agent 工作流的编译器,可自动优化子 Agent 的模型选择、推理预算和工作流结构,平衡准确率和延迟。
LEAD:大语言模型的高效自适应推理
提出长度高效的推理方法,通过强化学习在正确性与效率之间寻找最优平衡,解决长 CoT 浪费算力的问题。
Federation of Experts:大模型分布式推理通信优化
提出新的 MoE 架构,将专家分布在 KV 头上,显著降低分布式推理中的通信瓶颈。
自动化 Agent 评估的实证研究
研究发现直接提示编程助手进行 Agent 评估效果不佳,执行成功率仅 30%,且会产生过度工程化的评估。
EVA-Bench:语音 Agent 端到端评估框架
提出首个同时覆盖真实对话模拟和语音特定故障模式的语音 Agent 评估基准。
FrameSkip:VLA 训练中的高效帧采样
提出数据层框架,在机器人训练中跳过低变化帧,聚焦操作关键帧,提升训练效率和模型性能。
agentmemory](https://github.com/rohitg00/agentmemory)
基于实际基准测试的 AI 编程 Agent 持久化记忆方案,提供高效记忆管理能力。
★★★★★
解决 Agent 长程任务中的记忆瓶颈,实用价值高。
react-doctor](https://github.com/millionco/react-doctor)
让 AI 编程 Agent 自动诊断和修复 React 代码的工具。
★★★★★
AI 辅助代码修复的实用工具,降低 React 项目维护成本。
agent-skills](https://github.com/addyosmani/agent-skills)
面向 AI 编程 Agent 的生产级工程技能库,提供可复用的工程能力模块。
★★★★★
为 Agent 注入专业工程能力,提升代码质量和开发效率。
hello-agents](https://github.com/datawhalechina/hello-agents)
中文开源教程《从零开始构建智能体》,系统讲解 Agent 原理与实践。
★★★★★
优质的中文 Agent 学习资源,降低入门门槛。
ruflo](https://github.com/ruvnet/ruflo)
面向 Claude 的 Agent 编排平台,支持多 Agent 协同、RAG 集成和自学习群智能。
★★★★★
企业级 Agent 部署方案,原生支持 Claude Code/Codex。
OpenSpec](https://github.com/Fission-AI/OpenSpec)
面向 AI 编程助手的规约驱动开发(SDD)框架。
★★★★☆
规约驱动的 AI 开发新范式,提升代码可预期性。
rtk](https://github.com/rtk-ai/rtk)
CLI 代理工具,可将常见开发命令的 Token 消耗降低 60-90%,单 Rust 二进制文件,零依赖。
★★★★☆
大幅降低 AI 编程成本,轻量级部署方案。