Google Gemini 最全信息汇总 | 2025年6月更新

Google Gemini 概览

Gemini 是一系列由 Google DeepMind 开发的多模态大型语言模型 (LLM)，被定位为 LaMDA 和 PaLM 2 的后继者。它包含 Gemini Ultra、Gemini Pro、Gemini Flash 和 Gemini Nano 等版本，于 2023 年 12 月 6 日发布。 Gemini 为同名聊天机器人提供支持。

Google Gemini 最新新闻

Gemini Live 功能正式登陆 iOS 和 iPadOS: 2025 年 6 月3日，Google 宣布 Gemini Live 功能已正式登陆 Apple 的 iOS 和 iPadOS 平台，但目前仅限美国用户使用。用户无需订阅，即可通过 Gemini 应用免费使用这项功能.
相机和屏幕共享功能向所有用户开放: Gemini Live 的相机和屏幕共享功能正逐步向所有 Android 和 iOS 用户推出，包括免费用户。 Google 在最近的开发者大会上确认了这项功能的 iOS 版本，并表示该功能已开始向所有用户开放.
由 Project Astra 提供支持: Gemini Live 的相机和屏幕共享功能由 Project Astra 提供支持，后者是 Google 在 Google I/O 2024 上首次展示的 AI 体验. Project Astra 旨在将 Gemini 的多模态、记忆、视觉分析和代理控制等能力整合到可穿戴设备上，例如智能眼镜.
Gemini 2.5 Pro 获得重大升级: 2025 年 5 月 6 日，Google 推出了 Gemini 2.5 Pro 的更新版本，旨在改进其编码能力，更直观地理解编码提示并生成更强的输出.
集成 Veo 2 视频生成功能: 从 2025 年 4 月 22 日起，Gemini Advanced 订阅用户可以使用 Veo 2 生成高质量、8 秒长的视频.
推出新的 Gemini 2.0 Flash 版本: 增强版的 Gemini 2.0 Flash 于 2025 年 4 月 19 日推出，旨在提供更自然、更具协作性和适应性的对话风格.
推出 2.5 Flash 实验模型: 2025 年 4 月 17 日，用户可以尝试 2.5 Flash 实验模型，这是一个快速高效的思考模型，具有强大的性能.
Canvas 功能推出: 2025 年 3 月 18 日，用户可以使用 Canvas 与 Gemini 2.0 Flash 协作撰写文档和代码.
Gemini Deep Research 功能升级和免费开放: 2025 年 3 月 13 日，Gemini Deep Research 升级至 2.0 Flash Thinking (实验) 模型，并向所有 Gemini 用户免费开放.
新增扩展功能: 2025 年 3 月 3 日，Gemini 在所有支持的国家和语言中新增了更多扩展功能，包括 Spotify、电话、消息、WhatsApp 等.
文档上传功能对所有用户开放: 2025 年 2 月 20 日，所有 Gemini 用户都可以上传 Google Docs、PDF 和 Word 文档.
Gemini Advanced 用户优先体验新功能: 例如，从 2025 年 2 月 12 日起，Gemini Advanced 用户可以要求 Gemini 回顾过去的聊天记录，以获得更个性化的帮助.
推出 2.0 Flash Thinking 实验模型: 2025 年 2 月 5 日，用户可以尝试 2.0 Flash Thinking 实验模型，该模型经过训练可以将提示分解为一系列步骤，以增强其推理能力并提供更好的响应.
Imagen 3 图像生成模型升级: 2025 年 2 月 3 日，Imagen 3 图像生成模型得到了升级，提供了更丰富的细节和纹理.
Gemini 2.0 Flash 模型推出: 2025 年 1 月 30 日，Gemini 由 2.0 Flash 模型驱动，该模型旨在为日常任务提供更快的响应和更强的性能.
iOS 版 Gemini 应用推出: 2024 年 11 月 14 日，Google 在 iPhones 上推出了独立的 Gemini 应用.

Google Gemini 概述

Gemini 是一款多模态大型语言模型，能够理解和处理文本、音频、图像和视频等不同类型的信息。 Google 将 Gemini 描述为一种灵活的模型，可以在从数据中心到移动设备的所有设备上高效运行。 Gemini 的开发是 Google 在 AI 领域长期研究的成果，其基础始于 2013 年的 Word2Vec 论文，以及后续在 Transformer 和多轮对话能力方面的突破性进展。

Google Gemini 历史与版本

起源: Gemini 的开发基于 Google 在 LLM 方面的研究，始于 2013 年的 Word2Vec 论文.
Bard 时期: 2023 年 3 月，Google 推出了基于 LaMDA 和 PaLM LLM 的聊天机器人 Bard，作为一项实验.
Gemini 推出: 2023 年 12 月 6 日，Google 发布了 Gemini，并将其定位为 LaMDA 和 PaLM 2 的后继者.
Gemini 1.0 版本:
- Ultra: 用于高度复杂任务的最大、最强大的模型.
- Pro: 用于广泛任务的通用模型.
- Nano: 用于设备上任务的最高效模型，最初在 Google Pixel 8 上推出.
Gemini 1.5 版本:
- Pro: 具有 100 万 token 的上下文窗口，适用于处理大量信息，如一小时的视频或超过 3 万行代码.
- Flash: 轻量级且成本效益高的模型，适用于注重速度的场景.
Gemini 2.0 版本:
- Flash: 2025 年 1 月 30 日推出，Google AI Developers 网站描述它具有改进的速度、多模态能力、实时音频/视频和增强的空间理解能力.
- Flash Thinking: 2025 年 2 月 5 日推出，是一款实验性模型，展示了模型的推理过程.
- Flash-Lite: 2025 年 2 月 1 日推出，是最具成本效益的模型，可在 Google AI Studio 和 Vertex AI 中进行公共预览.
- Pro: 2025 年 2 月 5 日推出.
Gemini 2.5 版本:
- Pro: 2025 年 3 月 25 日推出，在各种基准测试中表现出色.
- Flash: 2025 年 4 月 17 日推出，截至 2025 年 5 月成为默认模型.