返回首页 2026年5月30日 aihot.virxact.com
头条
AI 国际

谷歌 DeepMind CEO 哈萨比斯:AGI 最快三年内到来,研发速度远超预期

谷歌 DeepMind CEO、诺贝尔奖得主德米斯·哈萨比斯预测,AGI 最快可能在 2029—2030 年前后出现,当前 AI 智能体是更强智能的预演。他同时警示,全球社会对 AGI 到来的准备严重不足,需提前建立规则与防护机制,AGI 治理议题将加速进入各国政策议程。

影响范围 全行业
紧迫程度
来源 IT之家 · 05:00前
AI 机器人 消费

Qwen-VLA:从理解世界到在其中行动——千问发布具身智能新基座

阿里千问团队发布 Qwen-VLA 模型,将视觉语言模型(VLM)升级为视觉语言动作模型(VLA),从"理解世界"进阶到"可在世界中行动",可作为具身智能、机械臂控制等领域的新基座模型,是国产具身智能的重要里程碑。

产品 企业

OpenRouter 推出 Guardrails:预算执行 + 提示词注入防御 + 数据保护

OpenRouter 推出可配置安全治理工具 Guardrails,具备预算执行、零数据保留、模型/提供商限制、提示词注入防御、数据丢失预防等功能。面向生产级智能体开发者,可大幅减少安全治理的胶水代码,是 AI 应用落地的重要配套工具。

AI 产品 国际

OpenAI 推出实时语音翻译模型:70+ 种输入语言,13 种输出语言

OpenAI 发布专用实时语音翻译模型 gpt-realtime-translate,可接收 70 多种语言的语音输入并输出 13 种语言的语音,已在智能眼镜场景落地。AI 交互从文字向语音跨语言方向加速演进,国际化产品的本地化成本将大幅降低。

产品 科技

OpenAI Codex 计算机使用功能登陆 Windows,可通过手机端远程操控桌面

Codex 计算机使用功能现已支持 Windows 系统,用户可通过 ChatGPT 移动应用启动、审查和引导 Windows 电脑上的任务,目前为早期体验阶段。AI 助手从问答工具进化为跨设备操控代理,将 AI 融入日常办公流。

AI 产品 消费

小米开源可控视频音效生成模型 ControlFoley,支持文本/参考音频引导配音

小米大模型应用团队开源 ControlFoley,支持文本引导、文本控制、参考音频控制三类视频配音任务,在多个 benchmark 上取得开源 SOTA 表现。代码、模型权重、在线 Demo 均已开放,视频创作者可直接使用,降低 AI 配音门槛。

AI 科技 国际

Cognition 创始人:AI 编程智能体不应取代人类,Devin 的设计哲学是增强而非替代

Cognition(AI 编程智能体 Devin 的开发公司)创始人 Scott Wu 明确表示,AI 编程智能体并非旨在取代人类程序员,而是作为协作伙伴提升效率。这一表态与 Cursor 同期发布的《开发者习惯报告》相互印证——AI 已将开发者周均代码产出从 3.6K 行提升至 8.6K 行,呈现增强而非替代的趋势。

政策 消费

四部门联合发文:提升全民 AI 素养,加快人才培育与深化普及应用

中央网信办等四部门联合印发《2026年提升全民数字素养与技能工作要点》,明确部署"提升全民人工智能素养"任务,包括强化 AI 赋能教育、加快 AI 人才培育、深化 AI 普及应用等。AI 教育、培训、应用落地相关企业可关注政策支持方向。

AI 科技 研究

Kog 团队实现推理速度突破:标准 GPU 上达 3000 tokens/s,是常规速度的 10-30 倍

Kog 团队通过 monokernel 设计、重建同步机制、针对性内存访问映射及 Laneformer 架构,在标准数据中心 GPU 上实现极高单用户推理速度:8×AMD MI300X 达 3000 tokens/s,8×NVIDIA H200 达 2100 tokens/s。相比常规 100–300 tokens/s 提升 10–30 倍,有望改写低延迟推理玩法。

企业 国际

波士顿儿童医院用 OpenAI 技术诊断超 40 种罕见病,AI 辅助诊断走向真实落地

波士顿儿童医院部署 OpenAI 技术用于改善患者护理、减轻运营负担,已成功帮助诊断超过 40 种罕见病。AI 辅助医疗诊断从概念验证转向真实临床落地,医疗 AI 应用进入规模化阶段。

产品 企业 消费

阿里云开源百炼 CLI:Agent 可一键调用全套模型和应用能力

阿里云开源百炼 CLI 工具,将百炼平台的全套模型和应用能力封装为命令行工具,Agent 开发无需逐个对接 API。企业智能助手开发成本将大幅降低,也进一步完善阿里云 AI 开发者生态。

科技 财经 国际

当公司过于"AI 上瘾":ClickUp 为 AI 智能体裁员 22%,2026 科技裁员潮加剧

Box 创始人 Aaron Levie 提出"AI psychosis"概念,指代不了解实际工作内容就决定用 AI 替代员工的管理层;ClickUp 近期为部署 AI 智能体裁员 22%,2026 年科技行业裁员规模已接近 2025 年全年。AI 替代与就业影响议题持续升温。

AI 研究 国际

李飞飞站台:GPIC 基准数据集发布,1 亿张商用可授权图像-文本对

由李飞飞背书的 GPIC(Giant Permissive Image Corpus)基准数据集发布,包含 1 亿张 VLM 标注的图像-文本对,完全允许商业用途,解决视觉生成训练数据版权问题。视觉生成、多模态模型训练团队可直接使用。

AI 政策 国际

OpenAI 发布第三方 AI 评估框架:前沿能力评测 + 安全防护 + 有效性验证操作手册

OpenAI 发布可信第三方 AI 评估指导框架,涵盖前沿系统能力评估、安全防护评估、评估有效性验证等内容,为第三方评估者提供完整落地操作手册。相比零散论文,该框架更具实用性,是 AI 治理基础设施的重要组成。

AI 科技 国际

技能提炼(Skill Distillation):用前沿大模型写 SKILL.md,让本地小模型直接执行

"技能提炼"是一种知识转移方法:由前沿大模型撰写并优化标准化 SKILL.md 流程文件,本地小模型(如 Qwen 35B、Gemma 26B)直接执行文件,形成前沿模型作教师、小模型作执行者的循环。核心是转移操作流程而非模型权重,比调 Prompt 更高级、更可持续。