大语言模型2026-05-23 16:00·Google Blog + CNET + eWeek

Google 发布 Gemini Omni 多模态模型,可从任意输入创建视频内容

Google I/O 2026 发布 Gemini Omni 模型,支持从文本、图像等任意输入生成视频,是世界理解和多模态编辑能力的重大飞跃。同时发布 Gemini Spark 24/7 个人 AI 助手。

Gemini Omni:多模态 AI 的重大飞跃

2026 年 5 月 19 日,Google I/O 2026 大会发布多项 Gemini 新模型。

Gemini Omni

  • 核心能力: 从任意输入(文本、图像等)创建任何内容,率先支持视频生成
  • 世界理解: 在 multimodality 和世界建模方面实现重大突破
  • 编辑能力: 支持多模态内容的深度编辑和修改

Gemini Spark

  • 个人 AI 助手: 24/7 全天候个人智能体
  • Google AI Studio 升级: 新增 Android 原生支持和增强 Gemini API

Antigravity 2.0

  • Agent 开发平台: 全面升级的 AI 智能体开发工具

搜索革新

  • AI 搜索: 全面重构 Google 搜索体验,引入 AI 智能体

来源: Google Blog + CNET + eWeek
链接: https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-collection/