Gemini Omni Flash 视频任务达 SOTA
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SOTA,很快将通过 API 提供给开发者。
精选 31 条今日最重要的 AI 新闻,Gemini Omni Flash 视频任务达 SOTA 领衔
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SOTA,很快将通过 API 提供给开发者。
Midjourney 将默认模型从 V7 升级为 V8.1,智能性、连贯性、详细提示遵循度和文本渲染均有提升,HD 模式也已支持。
腾讯混元 AI Infra 团队开源升级 HPC-Ops 推理算子库,推出 Attention、Router GEMM、FusedMoE、Fused AllReduce+Norm、Sampler 等五大核心算子,长文本最高加速 2.95x,采样最高提速 7.5x。
Perplexity 将 Deep Research 作为原生技能集成到 Computer 中,连接智能体框架、搜索、代码生成、长运行沙箱、连接器、工具和授权数据,Pro 与 Max 订阅者已可用。
OpenRouter 推出基准探索器,可为 10 个不同基准绘制模型帕累托曲线,帮助开发者在性能、价格和延迟之间做选型。
mlx-vlm v0.6.3 首发支持 Google DeepMind DiffusionGemma 和 Cohere North Mini Code 1.0,两款模型均实现 Mac 本地运行优化。
Cursor 新增分类器智能体,在工具调用前审查动作风险,动态管控智能体自主权限,目标是在不频繁阻断日常开发的前提下拦截读取密钥、操作生产数据等风险动作。
Krea 2 新增生成式滑块,可控制生成图像的强度、复杂度和运动,为创意工作流提供更细粒度调节。
Deezer 将扫描用户在其他流媒体平台的播放列表,检测 AI 生成音乐,让用户可跨平台检查播放列表中的合成音乐。
千问上线足球预测 AI 助手,结合历史比赛、球员、伤病、天气等数据开展竞猜活动,并将积分用于乡村学校捐建足球场。
Adobe 发布面向企业客户体验团队的 CX Enterprise Coworker,让 AI 参与营销、内容和客户旅程等跨部门工作流,推动生成式 AI 进入业务流程协作层。
DoorDash 发布 Ask DoorDash AI chatbot,用对话式搜索和推荐降低点餐决策成本,体现消费级平台继续把 AI 助手嵌入高频交易入口。
OpenAI 更新 ChatGPT 文件存储和 Library 说明,反映 ChatGPT 正强化长期资料管理、文件复用和工作区知识沉淀能力。
贝佐斯支持的 AI 公司 Prometheus 成立仅 7 个月、尚无产品交付,即以 410 亿美元估值完成 120 亿美元融资,定位“人工通用工程师”。
Anthropic 与 DXC Technology 达成多年全球联盟,DXC 将培训数万名 Claude 认证工程师,把 Claude 引入银行、航空、保险、政府等关键行业系统。
Lionsgate 取得 Runway 股权,双方将联合开发新 IP,并推出基于 Lionsgate 现有 IP 和 Runway 生成模型的短剧系列。
Anthropic 推出 Claude Corps,培训 1,000 名早期职业研究员使用 Claude,并匹配至美国非营利组织全职工作一年,初始投入 1.5 亿美元。
BBVA 将 ChatGPT Enterprise 推广至 10 万名员工,并与 OpenAI 合作,加速全球银行业 AI 驱动转型。
据《新科学家》报道,全自主无人机首次击毙人类士兵,标志着自主武器系统在实战中的新进展,并引发对自动化致命决策的安全担忧。
中国工作场所快速采用 AI,引发官媒呼吁保护劳动者权益。北京正在考虑如何控制新技术带来的就业与劳动风险。
OpenAI 支持欧盟《AI 内容透明度行为准则》,推进内容溯源标准与工具,帮助用户识别 AI 生成内容。
一项模拟研究显示,大型语言模型在 95% 的模拟场景中会选择使用战术核武器,结果引发对 AI 决策行为的关注。
Anthropic CEO 达里奥·阿莫迪警告,AI 造成的大规模岗位流失可能是结构性趋势,并提出劳动力监测、薪资保障、培训补贴和长期收入保障等应对思路。
Claude Fable 5 通过一句提示词生成可运行的 3D 桌球网页游戏,展示新模型在前端生成和交互式应用构建上的能力。
开发者分享 Codex 仓库维护循环:每 5 分钟唤醒一次,将工作分配到线程,结合编排器、分类、自动审查与计算机使用技能实现并行自治。
baoyu-design skill 现支持导入 Figma 本地 .fig 文件,在本地重建设计系统,并可在后续项目中复用。
创作者将文章配图过程蒸馏为“橙线插画”Skill 并免费开源,展示内容创作流程可被沉淀为可复用 AI 技能。
新 Skill 可将一句话需求自动转化为 Codex Goal 指令,实现“睡前写指令、模型自动开发、第二天收菜”的工作流。
Replit 分享如何像专家一样提示 Agent,强调明确需求可减少重写,让 Agent 第一次就构建出更接近目标的结果。
Hermes Agent Desktop 可通过硅基流动便捷使用前沿开源模型,并支持 DeepSeek、GLM、Kimi、MiniMax 等模型一键切换。
Anthropic 新文章讨论 AI 系统参与模型、工具和工程体系构建的趋势,以及当 AI 被用于加速自身研发时评估和治理流程需要同步升级。