GitHub Copilot 改用 Token 计费引发开发者强烈不满
GitHub Copilot 宣布从座位订阅制转向基于 Token 的计费模式,被开发者称为“笑话”,标志着微软 AI 编程助手黄金时代的终结。
Google 发布 24/7 AI 助手 Gemini Spark,实测效果实用但定位模糊
Gemini Spark 能自动完成收件箱摘要、本地活动规划等日常任务,但作为独立产品推出的必要性存疑。
Meta 正在开发 AI 吊坠硬件
Meta 持续押注 AI 硬件,据报道正在研发一款 AI 吊坠,延续其在智能眼镜后的可穿戴 AI 策略。
AI 芯片公司 Groq 据报正融资 6.5 亿美元,转向推理业务
在英伟达 200 亿美元“非收购式雇佣”之后,Groq 计划融资 6.5 亿美元,从硬件转向聚焦 AI 推理服务。
软银计划投资高达 750 亿欧元建设法国数据中心
软银宣布在法国开发和运营高达 5 GW 的数据中心容量,这是欧洲最大规模的 AI 基础设施投资之一。
Cognition 创始人称 AI 编程代理不应取代人类
Devin 的创造者 Scott Wu 表示,AI 编程代理的设计初衷是辅助而非替代人类程序员。
Adobe 推出对话式 AI 设计助手,体验相当于“平庸的设计实习生”
Adobe 最新 AI 图像助手定位为创意过程中的协作工具,而非替代设计师的自动化方案。
比亚迪自研 4nm AI 芯片亮相,制程对齐英伟达
比亚迪发布自研 4nm 智驾芯片,宣称算力超越特斯拉,为智能驾驶领域带来国产替代新变量。
面壁智能“开源周”发布端侧 AI 系统性方案
面壁智能通过系列开源发布,展示端侧 AI 从模型到部署的全链路能力。
英伟达清华团队提出 Gamma-World:多智能体世界模型
该工作将世界模型从单智能体扩展至多智能体交互仿真,为机器人学习和游戏 AI 提供新范式。
Reflective Prompt Tuning:通过函数调用实现提示自动优化
提出一种利用 LLM 自身函数调用能力进行反思式提示调优的方法,无需参数更新即可自动优化提示设计。
CONF-KV:基于置信度的 KV 缓存淘汰策略
利用解码过程中模型的不确定性信号动态管理 KV 缓存预算,实现长上下文推理的高效内存使用。
PANDO:通过在线技能蒸馏实现高效多模态 AI Agent
提出一种让多模态 Web Agent 随经验积累变得更高效而非更昂贵的在线蒸馏框架。
REPOT:可恢复的程序式思维链推理
通过确定性验证回放机制,在程序式思维链失败时仅需一次额外 LLM 调用即可恢复推理轨迹。
PRISM:评估 LLM 作为论文审稿人的多维基准
从深度、严谨性、建设性和可操作性四个维度评估 AI 审稿质量,揭示 LLM 与人类审稿人的差距。
Alignment Tampering:RLHF 可能被利用来放大不良行为
揭示 RLHF 中偏好数据集可能被 LLM 自身输出的数据所影响,导致对齐机制被逆向利用。
腾讯发布智能体创意工作室 Miora
一个创意设计版的 WorkBuddy,让用户拥有整个 AI 驱动的创意工作室。
DynaFLIP:面向机器人操作的三模态动态感知预训练框架
结合图像-语言-3D 流三种模态,将运动理解前置到感知阶段,提升机器人操作性能。
ViGeo:面向视频的一致几何估计基础模型
基于纯 Transformer 架构,支持流式、全序列和长视频推理,实现时空一致的深度估计。
CoHyDE:LLM 改写器与稠密编码器协同训练用于工具检索
迭代协同训练框架,解决用户自然语言查询与 API 技术词汇之间的语义鸿沟。