菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题
OpenAI 通用模型自主完成125页推演,解决困扰数学界80年的难题。
DeepSeek Code真要来了,ACM金牌大神崔添翼挂帅
DeepSeek 获得700亿融资,正式组建团队开发代码生成产品。
Google AI搜索因"disregard"关键词触发严重故障
搜索"disregard"时AI Overview输出ChatGPT式回复而非摘要,暴露系统安全漏洞。
李飞飞再出手:空间智能的ImageNet来了
发布专门评测具身空间智能的新基准,推动机器人感知标准化。
Spotify与环球音乐达成AI翻唱协议,粉丝可生成AI remix
Premium用户可创建AI歌曲翻唱和混音,参与艺术家获得收入分成。
腾讯混元开源全新翻译模型Hy-MT2
指令遵循能力大幅提升,同步上线小程序「腾讯Hy翻译」。
特朗普推迟签署AI安全行政令,称措辞可能阻碍发展
原要求AI模型发布前进行政府安全审查的命令被搁置。
黑客组织TeamPCP大规模投毒开源代码
GitHub遭遇前所未有的软件供应链攻击,开源生态安全面临严峻挑战。
80集短剧3天拍完:影视Agent提效数十倍
电影人下场做Agent,Token消耗直降70%,影视生产流程被AI重构。
Unsupervised Process Reward Models (uPRM)
提出无需人工标注的PRM训练方法,通过无监督方式实现步骤级推理监督。
Forecasting Scientific Progress with Artificial Intelligence
发布CUSP基准,评估AI系统预测科学进展的能力,涵盖可行性评估、方法预测等。
Efficient Agentic Reasoning Through Self-Regulated Simulative Planning
提出自调节模拟规划框架,将推理分解为三个系统,显著降低token消耗。
AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment
基于规则的鲁棒图文对齐奖励模型,替代昂贵的Bradley-Terry偏好模型。
Forecasting Downstream Performance of LLMs With Proxy Metrics
提出用代理指标预测LLM下游性能,替代交叉熵损失和直接评估。
Open-Source Software Is Starting to Help Robots Think
Hugging Face、Nvidia、阿里等大厂押注开源机器人AI平台,推动机器人推理能力开放化。
Anthropic官方Claude Code插件目录
Anthropic官方维护的高质量Claude Code插件集合,提供官方认证的扩展能力。
CodeGraph:Claude Code预索引代码知识图谱
为Claude Code提供本地化的代码知识图谱,减少token消耗和工具调用。
Multica:开源托管Agent平台
将编码Agent转化为真正的团队成员,支持任务分配、进度追踪和技能复合。
AgentMemory:AI编码Agent持久化记忆
基于真实世界基准的#1持久化记忆方案,为Agent提供长期上下文能力。
Chrome DevTools MCP:Chrome开发者工具Agent化
Google官方发布的DevTools MCP协议,让编码Agent直接操控浏览器调试。
FreeLLM API:聚合14家AI提供商的免费代理
OpenAI兼容代理,自动聚合免费API密钥并支持故障转移。
CLI-Anything:让所有软件Agent原生化
将任意软件转化为CLI接口,使AI Agent可以直接调用。