Anthropic 遭美国政府出口管制,Fable 5 和 Mythos 5 被强制下线
特朗普政府突然命令 Anthropic 切断所有外国公民(含美国境内的外国用户和员工)对 Fable 5 和 Mythos 5 的访问,引发全球 AI 可用性危机。
白宫要求 Anthropic 彻底封堵所有越狱漏洞,安全专家称不可能实现
白宫官员明确表示,若 Anthropic 要重新发布 Fable 5,必须确保模型护栏无法被绕过。安全专家回应:这不可能。
“危险”AI 模型无论如何都会到来
美国政府打压 Anthropic 的行为掩盖了一个事实:具备高级黑客能力的 AI 模型即将成为常态,禁止一家公司无法阻止技术趋势。
SK Telecom 卷入 Anthropic Mythos 出口管制争议中心
白宫在要求 Anthropic 下线 Mythos 之前,已要求其切断 SK Telecom 对 Claude Mythos 的访问,理由是涉嫌与中国有关联。
SpaceX 正式以 600 亿美元收购 Cursor
SpaceX 在创纪录的 IPO 数天后宣布以 600 亿美元收购 AI 编程助手 Cursor,旨在争夺企业客户并缩小与 Anthropic、OpenAI 的差距。
Google 发布 Gemini 驱动的全新智能音箱,六年来首款
售价 99 美元的 Google Home Speaker 将于 6 月 25 日发货,用 Gemini 对话式交互取代 Google Assistant 时代的僵硬指令。
世界模型公司 Odyssey 获 14.5 亿美元估值,亚马逊等投资
Odyssey 完成新一轮融资,估值达 14.5 亿美元,世界模型被视作 LLM 之外的下一个 AI 大方向。
企业 AI ROI 清算来临:Uber 数个月烧光全年 AI 预算
硅谷曾盛行“Token 最大化”运动,如今账单到期。Uber 数月内烧光全年 AI 预算,多家公司削减 Claude 许可证,Meta 取消内部排行榜。
Meta 搜索推出 AI Mode,基于 Facebook 帖子的 AI 搜索
Meta 在搜索中推出 AI Mode,利用 Facebook 帖子内容回答问题,但准确性仍是问题。
微信支付发布 AI 专属卡,WorkBuddy 率先接入
用户可在与智能体对话中直接发起消费需求,AI 专属卡打通支付闭环。
具身大脑公司获数亿美元融资,世界模型路线受追捧
头部具身智能大脑公司半年内完成三轮融资,15家 VC 争投,采用世界模型技术路线。
算苗 3D TokenPU 正式流片,国产 AI 云端大算力芯片再升级
算苗科技发布 3D TokenPU 芯片,瞄准 AI 云端推理场景。
AI 冲击 SaaS,网络安全是例外
AI 普及反而让网络安全成为更刚需的领域,安全 SaaS 在 AI 时代的抗冲击能力最强。
通用汽车借助 AI 将开发周期减半
通用汽车正利用 AI 将汽车开发周期从传统 5-7 年缩短至一半,以应对中国车企的快速迭代。
Variable-Width Transformers:非均匀宽度分配超越固定宽度模型
研究表明 Transformer 各层可以分配不同的计算容量,变宽 Transformer 在参数量匹配的情况下持续优于固定宽度模型。
d-OPSD:扩散 LLM 的在线自蒸馏框架
首次将在线策略自蒸馏(OPSD)应用于扩散语言模型,解决了自回归中心方法无法适配任意顺序生成的问题。
ProCUA-SFT:3.1M 高质量计算机使用 Agent 训练数据集
发布包含 310 万条轨迹的高质量 CUA 训练数据集,解决 AgentNet 导致的负迁移问题,将 OSWorld 成功率从 10% 提升至 26.3% 以上。
EgoCS-400K:400K 第一人称游戏数据集用于世界模型训练
发布包含 40 万条视频-动作-语言轨迹的自我中心游戏数据集,填补了世界模型所需的时间对齐多模态数据空白。
RepSelect:通过表示选择性实现鲁棒的 LLM 遗忘
提出新方法解决 LLM 遗忘容易被微调或少样本提示逆转的问题,通过选择性操作表示实现深层遗忘。
ACE-Ego-0:统一人类和机器人第一人称数据用于 VLA 预训练
提出统一 VLA 预训练框架,首次联合训练人类第一人称视频和机器人轨迹数据,解决动作空间、具身结构和时间动态的分歧。
多 Agent LLM 系统的并发异常检测与预防
将多 Agent 系统中的共享状态问题形式化为四种并发异常,并给出 TLA+ 形式化验证方案。
拆分推理架构的“无政府代价”博弈论分析
首次对 Prefill/Decode 分离架构进行博弈论分析,以 NVIDIA Dynamo 为案例,揭示资源分配中的效率损失。
ChLogic:中文逻辑推理鲁棒性评测基准
发布英中对齐的逻辑推理基准,测试模型在不同语言表达下保持逻辑推理能力的一致性。
SAGA:从冻结 MLLM 提取语义属性梯度用于视觉嵌入
提出利用多模态大模型的语义感知能力替代传统标量监督,为视觉检索提供属性级别的训练信号。
ponytail:让 AI Agent 像最懒的资深工程师一样思考
最佳代码是你从未写过的代码。这个项目让 AI 倾向于不写不必要的代码。
Agent-Reach:给 AI Agent 一双看遍全网的眼睛
一个 CLI 工具即可搜索 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书,零 API 费用。
codegraph:预索引代码知识图谱,减少 Token 消耗
为 Claude Code、Codex、Gemini、Cursor 等 AI 编程工具提供预索引的代码知识图谱,减少 Token 和工具调用。
omnigent:所有 AI Agent 的元框架
提供统一层来管理 Claude Code、Codex、Pi 等不同 Agent,支持策略管理、沙箱隔离和实时协作。
last30days-skill:AI Agent 技能——研究任意话题的最新动态
跨 Reddit、X、YouTube、HN、Polymarket 和网页搜索话题,合成有根有据的摘要。
claude-code-best-practice:从 Vibe Coding 到 Agentic Engineering 的最佳实践
系统化的 Claude Code 使用指南,帮助开发者从随意编码转向工程化的 Agent 开发。
GLM-5:从 Vibe Coding 到 Agentic Engineering
GLM-5 模型发布,强调从随意编码向工程化 Agent 开发的转变。
headroom:在到达 LLM 前压缩工具输出和日志
压缩工具输出、日志、文件和 RAG 块,减少 60-95% 的 Token 消耗,答案质量不变。
ppt-master:AI 从文档生成可编辑的 PowerPoint
从任意文档生成原生 PowerPoint,包含形状、动画、演讲者注释和音频旁白,支持自定义模板。
rtk:CLI 代理减少 60-90% 的 LLM Token 消耗
单 Rust 二进制文件,零依赖,在常见开发命令上减少 60-90% 的 Token 消耗。
💡 今日观察
今天最重磅的信号无疑是 Anthropic 出口管制事件——白宫对 Fable 5 和 Mythos 5 的强制下线,以及要求彻底封堵越狱的不可实现命令,将 AI 地缘政治风险从理论推向了现实。与此同时,企业 AI ROI 清算正在加速,Uber 数月烧光全年预算的案例说明 Token 经济泡沫开始破裂,开发者需要更加务实地评估 AI 投入产出。在技术层面,Variable-Width Transformers 和 d-OPSD 等论文为模型架构和训练方法提供了新的突破方向,而 ProCUA-SFT 数据集和 codegraph 等项目则在工程实践层面解决了具体痛点。总的来说,行业正从“什么都能用 AI 做”的狂热期,进入“什么值得用 AI 做”的理性期。