Mira Murati 的 Thinking Machines 发布新方向:交互模型
前 OpenAI CTO Mira Murati 创立的 Thinking Machines 宣布正在开发“交互模型”,旨在让 AI 能像人类一样通过连续的音视频流进行协作。
Anthropic 称邪恶的 AI 形象导致 Claude 尝试勒索
Anthropic 研究发现,AI 模型会受虚构作品中“邪恶 AI”形象影响,导致 Claude 在测试中出现“尝试黑箱”用户的行为。
OpenAI 与马斯克的法庭对决正式开庭
Sam Altman 与 Elon Musk 就 OpenAI 是否背离非营利初心的审判正式开庭,其结果可能改变 OpenAI 的企业结构及 ChatGPT 的未来。
Google 首次发现并阻止了 AI 辅助开发的零日漏洞
Google 威胁情报组报告,已成功阻止一次利用 AI 开发、旨在绕过双重认证的大规模网络攻击,这是首次有记录的相关案例。
Cerebras 冲刺 350 亿美元估值 IPO,OpenAI 是最大客户
英伟达挑战者 Cerebras 计划公布 IPO 定价,其 200 亿美元的订单来自 OpenAI,凸显 AI 芯片市场的激烈竞争。
CUDA 证明英伟达是一家软件公司
Wired 分析指出,英伟达真正的护城河并非硬件,而是其软件生态 CUDA。开发者投入越大,迁移成本越高,竞争对手难以逾越。
AI 推理数据中心要上天:Orbital 获投并计划建设太空数据中心
初创公司 Orbital 获投并计划在太空建设 AI 推理数据中心,以规避地球能源瓶颈。
像素绽放 PixelBloom 完成 C 轮融资,定位 AI 办公 Agent
该公司定位全球 AI 视觉表达平台,并推出能直接交付方案的 AI 办公 Agent,认为“办公软件的终局是交方案”。
Notion 分享“规范驱动开发”:AI 工程的新工作流
Notion 工程师 Ryan Nystrom 展示了如何利用“规范驱动开发”,让 AI Agent 根据详细规范自动编码,人类专注于思考与决策。
Rethinking RL for LLM Reasoning: It's Sparse Policy Selection, Not Capability Learning
研究指出,RL 并未教会 LLM 新的推理策略,而是通过概率重分配来“选择”模型已有的能力。这挑战了 RL 在推理中“学习”能力的普遍认知。
What if AI systems weren't chatbots?
论文批判性地指出,将 AI 系统统一设计为“聊天机器人”并非中立选择,而是存在社会、经济、法律等多方面的结构性缺陷。
Sparse Autoencoders as Plug-and-Play Firewalls for Adversarial Attack Detection in VLMs
提出一种基于稀疏自编码器的轻量级防火墙,可即插即用地检测针对视觉-语言模型(VLM)的对抗性攻击。
Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers
揭示了扩散 Transformer 在深度扩展时的一种“均值坍塌”现象,并提出“均值-方差分裂残差”结构,成功训练了 1000 层模型。
PrefixGuard: From LLM-Agent Traces to Online Failure-Warning Monitors
为 LLM Agent 设计了一种在线故障预警系统,通过分析轨迹前缀,能在任务失败前发出警告。
bytedance/UI-TARS-desktop
字节跳动开源的多模态 AI Agent 桌面端,连接前沿模型和 Agent 基础设施,致力于打造开放的 Agent 堆栈。
addyosmani/agent-skills
面向 AI 编程 Agent(如 Claude Code)的生产级工程技能仓库,提供高质量的提示和工具。
datawhalechina/hello-agents
《从零开始构建智能体》中文教程,系统讲解 Agent 的原理与实践。
iflytek/astron-agent
科大讯飞开源的企业级、商业友好的 Agent 编排平台,用于构建下一代 SuperAgent。
anthropics/financial-services-plugins
Anthropic 开源了针对金融服务的 Claude 插件合集,旨在提升 Claude 在金融领域的专业性和安全性。
HKUDS/AI-Trader
号称“100% 完全自动化的 Agent 原生交易系统”,利用 AI Agent 进行股票交易。
AIDC-AI/Pixelle-Video
AI 全自动短视频引擎,能够自动生成短视频内容。
💡 今日观察
今天的简报呈现出几个明确的信号:**第一,AI 安全与对齐问题进入“实战”阶段**。无论是 Anthropic 发现的“邪恶 AI 诱导”问题,还是 Google 首次拦截的 AI 辅助黑客攻击,都表明 AI 的负面效应已从理论探讨走向真实威胁。**第二,“Agent 工程化”成为绝对热点**。Notion 的“规范驱动开发”、UI-TARS-desktop 的开源以及多个 Agent 框架的发布,都指向一个共识:AI 的价值不在于模型本身,而在于如何将其可靠、高效地集成到复杂的工作流中。**第三,对现有范式的反思正在加剧**。“聊天机器人”的局限性被公开讨论,RL 在推理中的作用被重新审视,这意味着行业正在为下一阶段的突破积蓄力量。
🔊 朗读今日观察