突发] OpenAI 大规模重组,总裁 Greg Brockman 夺权挂帅
OpenAI 宣布重大组织调整,将 ChatGPT、Codex 和 API 三大业务合并,Brockman 正式成为产品总负责人,全面押注 AI Agent 战略。
ChatGPT 正式进军个人理财,支持连接银行账户
OpenAI 宣布用户可通过 Plaid 将银行账户接入 ChatGPT,实现投资组合、消费、订阅等财务数据的可视化与智能管理。
Runway 公开挑战 Google,押注视频生成通向世界模型
Runway 表示视频生成是通往世界模型的路径,并认为作为 AI 局外人是优势而非劣势。
奥特曼投资的芯片公司成今年最大科技 IPO,20 亿持股版图曝光
Sam Altman 投资的芯片公司在 IPO 中表现亮眼,其个人持股版图随之公开。
Google 更新搜索垃圾政策:操纵 AI 概览内容视为作弊
Google 将“操纵”AI Overview 和 AI Mode 搜索结果的行为正式列为垃圾信息。
ArXiv 将封禁提交 AI 生成垃圾论文的研究者一年
ArXiv 对论文中“明显未检查 LLM 输出结果”的行为采取零容忍,包括幻觉引用和 LLM 元注释。
AI 电台实验暴露 AI 独立运营风险
Andon Labs 用 Claude、ChatGPT、Gemini、Grok 分别运营四家 AI 电台,结果凸显缺乏人类监督时的不可靠性。
腾讯发布“贾维斯”操作系统级 AI 助手
腾讯推出可替用户签到、改配置、模拟打盹上厕所的 AI 助手,运行在操作系统层面。
WildTableBench:多模态基础模型表格理解基准
构建了涵盖复杂视觉布局和多样领域的真实表格图像评测集,揭示当前模型在结构感知和数值推理上的短板。
BEAM:MoE 模型二进制专家激活掩码动态路由
提出一种无需重新训练的 MoE 加速方法,通过二进制掩码动态裁剪冗余专家,显著降低推理延迟。
LiSA:AI Agent 终身安全适应框架
提出保守策略归纳方法,使 Agent 能持续适应不同隐私规范和组织策略,防止数据泄露和越权操作。
FrontierSmith:大规模合成开放式编程问题
提出自动化系统,可生成无已知最优解的开放式编程问题,用于训练更强 LLM 编码能力。
RewardHarness:自进化 Agent 后训练奖励框架
将奖励建模重构为可自进化的 Agent 框架,仅需少量样本即可蒸馏出精细偏好信号。
OpenCLI:将任意网站和工具变成命令行
构建 AI Agent 可发现、学习、执行的通用 CLI 枢纽,通过 AGENT.md 统一集成,GitHub 77+ 星。
TencentDB-Agent-Memory:腾讯开源的 Agent 本地长时记忆系统
四层渐进式流水线实现完全本地化长期记忆,零外部 API 依赖,GitHub 73+ 星。
Coral:为 Agent 打造的 SQL 统一接口
提供单一 SQL 接口连接 API、文件和实时数据源,GitHub 67+ 星。
Shannon:自主白盒 AI 渗透测试工具
分析源代码、识别攻击向量并执行真实漏洞利用,GitHub 50+ 星。
DreamServer:本地 AI 全家桶
支持 LLM 推理、聊天 UI、语音、Agent、工作流、RAG 和图像生成,完全本地无云,GitHub 56+ 星。
agentmemory:AI 编码 Agent 持久记忆库
基于真实世界基准的 #1 持久记忆方案,GitHub 81+ 星。
scientific-agent-skills:科研 Agent 技能包
提供研究、科学、工程、分析、金融、写作等即用型 Agent 技能,GitHub 79+ 星。