Google Cloud 季度营收首破 200 亿美元,但受算力瓶颈制约增长
Google Cloud Q1 营收超 200 亿美元,AI 需求强劲,但产能限制导致增速未达上限。
Runway CEO 访谈:AI 视频只是前奏,世界模型才是未来
Runway 估值 53 亿美元,CEO Valenzuela 认为视频生成正在快速演进为世界模型。
OpenAI Codex 的隐秘指令:永远不要谈论哥布林
Wired 披露 OpenAI 为 Codex 编写的系统提示,包含严格的行为限制指令。
Google Photos 推出 AI 虚拟试衣功能
利用用户照片库自动创建虚拟衣柜,支持混搭和分享。
Oracle 的 AI 豪赌:数据中心建设揭示泡沫风险
分析认为 Oracle 全力押注 AI 数据中心建设,其成败是判断 AI 泡沫的关键指标。
普林斯顿刘壮最新访谈:架构没那么重要,数据才是王道
10 万引用学者认为记忆是 AI 最大瓶颈,智能体只是权宜之计。
ChatGPT 下载量放缓,可能影响 OpenAI IPO
4 月卸载量同比增长 132%,用户转向竞品。
中国暂停发放新自动驾驶出租车牌照
因百度无人车在武汉造成交通混乱,监管收紧。
腾讯开源手机端离线翻译模型,仅 0.4G 支持 33 种语言
无需联网,可在手机本地运行。
Parallel Web Systems 五个月内估值翻倍至 20 亿美元
前 Twitter CEO 创立的 AI agent 工具公司再获 1 亿美元融资。
V-GRPO:去噪生成模型的在线强化学习
提出新的策略梯度在线 RL 框架,解决了扩散模型似然不可解的问题。
GoClick:轻量级 GUI 元素定位模型
仅需 0.5B 参数即可在移动端实现精准的 GUI 元素定位。
AutoResearchBench:AI agent 科学文献发现基准
评估 AI agent 自主进行科学文献检索和发现的能力。
BARRED:通过非对称辩论合成训练自定义策略护栏
框架可生成高质量合成数据用于训练任务特定安全分类器。
Co-Director:Agentic 生成式视频叙事
分层多 agent 框架将视频叙事形式化为全局优化问题。
openai/symphony ⭐143
将项目工作转化为隔离的自主执行,让团队管理而非监督 coding agent。
microsoft/VibeVoice ⭐119
微软开源的语音 AI 项目。
addyosmani/agent-skills ⭐73
生产级工程技能的 AI 编码 agent 技能集合。
fspecii/ace-step-ui ⭐65
开源 Suno 替代品,专业 UI 的 ACE-Step 1.5 AI 音乐生成。
badlogic/pi-mono ⭐46
AI agent 工具包,包含编码 agent CLI、统一 LLM API、TUI/Web UI 库。