OpenAI 推出 ChatGPT 个人理财功能,可直接连接银行账户
用户连接 Plaid 后可在 ChatGPT 内查看投资组合、支出和订阅等财务仪表盘。
OpenAI 再次重组管理层,Greg Brockman 统一负责所有产品
产品战略全面转向 AI Agent,合并 ChatGPT 和 Codex 团队。
Google 更新搜索垃圾政策:操纵 AI 生成结果将被视为垃圾内容
新规明确覆盖 AI Overview 和 AI Mode 中的欺骗性内容。
Runway 宣布从视频生成进军通用 AI,目标超越 Google
创始人认为视频生成是通向世界模型的路径,AI 外部视角是优势。
阿里发布 Qoder 1.0,全面接管代码生成、验证和交付流程
支持 Windows/macOS/Linux,从需求到部署全自动化。
Hermes 团队改写预训练范式:不改架构,算力成本降六成
论文阅读量破 41 万,被认为是 DeepSeek 之后最重大的提效路径。
蚂蚁百灵开源 Ring-2.6-1T 模型,Agent 执行能力全面增强
AIME 26 得分 95.83,开源规模达万亿参数。
ArXiv 将封禁上传 AI 生成垃圾论文的研究者
发现 LLM 生成的幻觉引用或元评论将直接封禁。
Mira Murati 新公司 Thinking Machines Lab 首次发声:坚持「人在回路中」
前 OpenAI CTO 表示不追求自动化取代人类,而是构建协作型 AI。
Meta 工程师抗议笔记本键盘鼠标追踪用于 AI 训练
内部帖子在 Meta 员工中广泛传播,涉及隐私和监控问题。
WildTableBench:野外表格理解多模态基准测试
覆盖真实场景中的复杂表格布局和数值推理,揭示当前模型在视觉表格理解上的短板。
BEAM:MoE 模型二值化专家激活掩码动态路由
无需重训即可大幅降低推理延迟,解决训练-推理不匹配问题。
LiSA:终身安全适应与保守策略归纳
AI Agent 在读取私密数据、调用工具时,需要根据上下文动态调整安全策略。
Boosting RLVR via Randomly Selected Few-Shot Guidance
通过随机选取少量示范引导,显著提升强化学习在困难问题上的样本效率。
Unlocking Complex Visual Generation via Closed-Loop Verified Reasoning
闭环验证推理框架,克服单步生成在复杂语义上的局限。