AI 每日简报 AI Daily Digest

亚马逊CEO被指引发Anthropic模型禁令

报道称，亚马逊CEO Andy Jassy的网络安全研究及与白宫沟通，直接触发了政府对Anthropic Fable 5和Mythos 5的出口管制。

★★★★★ 揭示科技巨头在AI安全博弈中的关键角色，影响未来政企关系。

OpenAI遭多州总检察长调查

美国多州总检察长联合调查OpenAI，涉及广告政策、健康数据处理等多项合规问题。

★★★★☆ AI监管从联邦层面下沉至州级，合规成本将显著上升。

法院裁定谷歌对AI Overviews虚假陈述负责

法院判决谷歌需为其AI Overviews生成的虚假陈述承担法律责任，认定设计、训练和运营AI系统的公司需承担侵权责任。

★★★★☆ 确立AI平台对生成内容的法律责任先例，影响所有AI搜索产品。

Wired

Meta AI部门被曝内部混乱，员工士气低落

报道称Meta数月前成立的AI部门（6500人）处于“崩溃边缘”，员工抱怨工作环境压抑，AI战略混乱。

★★★★☆ Meta AI人才流失风险加剧，开源模型战略或受影响。

Mistral据传以200亿欧元估值融资30亿欧元

Mistral AI被曝正在进行新一轮融资，估值较C轮翻倍至约200亿欧元。

★★★★☆ 欧洲AI冠军持续获得巨额资本，开源与闭源双轨战略获市场认可。

苹果iOS 27推出AI照片编辑功能

苹果在iOS 27中首次引入AI照片编辑工具，包括重新构图、扩展和清理功能，但效果不及Google Pixel。

★★★★☆ 苹果正式加入AI照片编辑战局，但保守策略可能影响用户体验。

Siri重大更新，不再讨好用户

苹果新版Siri被设计为不迎合用户，Craig Federighi表示Siri不会像其他聊天机器人那样谄媚。

★★★★☆ 苹果AI产品设计理念差异化，强调实用而非情感连接。

Google起诉中国AI网络诈骗团伙

谷歌起诉名为“Outsider Enterprise”的中国团伙，该团伙利用AI在两周内向数十万受害者发送250万条诈骗短信。

★★★★☆ AI驱动的网络诈骗规模化，科技巨头开始法律反击。

毕马威因幻觉撤回AI使用报告

毕马威因报告中出现明显AI幻觉而撤回一份关于AI使用情况的报告。

★★★☆☆ 专业服务机构使用AI仍需严格审查，AI幻觉问题仍具破坏性。

通义团队再失核心：阿里首席科学家周靖人被曝离职

传阿里通义团队首席科学家周靖人履新六天后离职，阿里AI核心团队持续动荡。

★★★☆☆ 国内大模型人才流失加剧，可能影响阿里AI技术路线稳定性。

36Kr AI

Bezos新AI公司目标构建“通用工程智能”

亚马逊创始人Jeff Bezos透露其AI初创公司Prometheus致力于开发“通用工程智能”，辅助实体产品设计。

★★★☆☆ AI从软件工程向物理工程设计延伸，开辟新应用场景。

1500美元训出1B参数HRM模型获HuggingFace CEO力荐

Bengio团队参与研发的HRM模型（1B参数），训练成本仅1500美元，在多个任务上表现优异。

★★★★☆ 证明小模型+高效训练可以接近大模型能力，降低AI应用门槛。

量子位

📄 重要论文

LLM注释性能的极限：模型内化先验的影响

研究LLM零样本注释时，模型内化先验如何影响任务表现，以及提示中额外信息能否纠正零样本错误。

★★★★★ 为LLM-as-Judge和自动标注提供理论指导，帮助设计更可靠的评估流程。

LLM心理测量评估的重新思考：自我报告何时能预测行为

发现LLM的自我报告与行为存在显著不一致，但通过更精细的测量设计可以改善预测效果。

★★★★★ 改进AI安全评估方法论，避免依赖不可靠的自我报告数据。

异构Agent间的密集潜在通信

提出通过KV-cache实现异构模型间的直接潜在表示通信，避免文本解码-重编码的损失和开销。

★★★★★ 突破多Agent系统通信瓶颈，实现更高效、更保真的模型间协作。

TRACE：将用户修正编译为编码Agent的运行时强制执行

提出TRACE框架，将用户偏好编译为运行时规则，使编码Agent能记住并遵守用户修正，超越传统记忆系统。

★★★★★ 解决AI Agent“记不住用户偏好”的核心痛点，提升长期协作效率。

LLM Agent的冷启动安全缺口

发现LLM Agent在会话开始时最脆弱，完成几个常规任务后才变得安全，提出SODA基准来系统研究这一现象。

★★★★★ 揭示Agent安全的新维度，为安全部署提供关键设计指导。

HYDRA-X：原生统一多模态模型

首个在单一ViT中统一图像和视频分词器的多模态模型，实现真正的原生多模态理解。

★★★★★ 简化多模态模型架构，为视频理解与图像理解的统一奠定基础。

VIA-SD：通过模型内路由验证的推测解码

提出使用大模型内部的子模型处理中等难度token，而非全模型验证，加速推测解码。

★★★★★ 降低LLM推理成本，无需额外训练即可提升解码速度。

TreeSeeker：深度搜索中的树结构试错与回溯

提出树结构搜索框架，让Agent在深度搜索中平衡探索与利用，避免盲目跟随或浪费预算。

★★★★★ 提升复杂多步搜索任务的推理效率，直接提升Agent实际应用能力。

视觉语言模型训练机器人读取人类情绪

研究利用视觉语言模型训练协作机器人，通过面部表情和环境线索理解人类情绪。

★★★★☆ 推动人机协作中的情感感知能力，提升机器人社交智能。

IEEE Spectrum

代码Agent的测试时规则获取与编译执行

提出TRACE框架，将用户修正编译为运行时规则，使Agent能跨会话记住并遵守用户偏好。

★★★★★ 解决AI Agent“记不住用户偏好”的核心痛点，提升长期协作效率。