Google Gemini 概览
| 项目 | 内容 |
|---|---|
| 名称 | Google Gemini |
| 原名 / 前身 | Bard,后更名为 Gemini |
| 产品类型 | 多模态 AI 模型系列 / AI 助手 / 开发者 API / 企业 AI 平台 |
| 开发者 | Google / Google DeepMind |
| 所属生态 | Google Search、Google Workspace、Android、Pixel、Chrome、Google Cloud、Google AI Studio、Vertex AI |
| 首次发布 | 2023年12月,Gemini 1.0 发布 |
| 当前主要模型 | Gemini 3.1 Pro、Gemini 3 Flash、Gemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash-Lite 等 |
| 消费级入口 | Gemini App |
| 产品介绍页 | Gemini 官方介绍 |
| 开发者入口 | Google AI Studio、Gemini API |
| 企业入口 | Vertex AI、Gemini Enterprise、Gemini for Google Workspace |
| 主要功能 | 文本生成、图像理解、图像生成、视频理解、语音对话、Deep Research、Gems、Canvas、长上下文、代码辅助、Google 应用集成、Agent 能力 |
| 订阅计划 | Free、Google AI Plus、Google AI Pro、Google AI Ultra |
| 官方网站 | https://gemini.google/ |
Gemini 概述
Google Gemini 是 Google 的核心 AI 产品与模型体系,覆盖个人助手、开发者模型调用、企业 AI 平台和 Google 产品内嵌 AI 能力。
在用户端,Gemini App 可用于写作、学习、规划、搜索辅助、图片生成、文件分析、语音对话、研究报告生成和多步骤任务处理。它支持文本、图片、文件、代码、语音等多种输入形式,并可与 Google Search、Gmail、Docs、Drive、Maps、YouTube、Photos 等产品结合。
在模型端,Gemini 是 Google DeepMind 开发的多模态模型系列。Gemini 1 以原生多模态和长上下文为核心;Gemini 2 增强了思考、推理和工具使用;Gemini 3 进一步整合推理、代码、视觉理解和 agentic 能力。
在开发者端,Gemini API 和 Google AI Studio 提供模型调用、提示词调试、结构化输出、工具调用、长上下文、图像生成、语音和多模态应用开发能力。企业用户可通过 Vertex AI、Gemini Enterprise 和 Google Workspace 接入更高安全、合规和管理能力。
Gemini 名称与定位
Gemini 同时是模型品牌、用户产品品牌和开发者平台能力的核心名称。不同语境中的含义如下:
| 名称 | 所属场景 | 含义 |
|---|---|---|
| Gemini | 总称 | Google 的 AI 模型与 AI 助手品牌 |
| Gemini App | 用户产品 | 面向个人用户的 AI 助手 |
| Gemini Models | 模型系列 | Google DeepMind 开发的多模态基础模型 |
| Gemini API | 开发者平台 | 通过 API 调用 Gemini 模型 |
| Google AI Studio | 开发者工具 | 用于试验、调试和构建 Gemini 应用 |
| Vertex AI Gemini | 企业平台 | 通过 Google Cloud 使用 Gemini 模型 |
| Gemini for Google Workspace | 办公产品集成 | Gmail、Docs、Sheets、Slides、Meet 等产品中的 Gemini 能力 |
| Gemini Code Assist / Gemini CLI | 开发者工具 | 代码生成、代码解释和命令行辅助 |
| Gemini Agent | Agent 能力 | 用于执行复杂多步骤任务的 Gemini 功能 |
Gemini 的定位不是单一聊天机器人,而是 Google AI 能力在个人、开发者、企业和 Google 产品生态中的统一入口。
Gemini 发展历史
2023年2月:Bard 发布
Google 发布 Bard,作为早期对话式 AI 产品。Bard 后续逐步整合更强模型能力,并成为 Gemini App 的前身。
2023年12月:Gemini 1.0 发布
2023年12月,Google 发布 Gemini 1.0。初代 Gemini 模型从设计之初即面向多模态能力,能够处理文本、代码、音频、图像和视频等不同信息形式。
Gemini 1.0 包含多个尺寸:
- Gemini Nano:面向设备端运行。
- Gemini Pro:面向广泛任务和产品规模化使用。
- Gemini Ultra:面向更复杂任务。
2024年2月:Bard 更名为 Gemini
Bard 品牌逐步被 Gemini 取代。Gemini 成为 Google 面向用户的 AI 助手名称,并开始与 Gemini 模型系列统一品牌。
2024年:Gemini 1.5 系列扩展长上下文能力
Gemini 1.5 系列增强长上下文、多模态理解和更大输入规模,推动 Gemini 在文档分析、代码库理解、视频理解和复杂研究任务中的应用。
2024年12月:Gemini 2.0 发布
Gemini 2.0 强化了 agentic AI 方向,增加思考、推理、工具使用和多模态交互基础能力,为后续 Gemini Agent、实时语音、代码辅助和复杂任务执行提供基础。
2025年:Gemini 2.5 系列进入开发者和产品生态
Gemini 2.5 系列成为开发者和用户端的重要模型族,包含 Gemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash-Lite 等版本。
Gemini 2.5 Pro 面向复杂任务、深度推理和代码能力;Gemini 2.5 Flash 侧重速度、成本和多模态能力平衡;Gemini 2.5 Flash-Lite 定位为更快、更低成本的轻量模型。
2025年11月:Gemini 3 进入 Gemini App
2025年11月18日,Gemini 3 进入 Gemini App。该版本强化推理、代码、多模态理解和交互式界面生成能力。
Gemini 3 带来几个重要变化:
- Gemini 3:用于更复杂问题的推理模型。
- Generative Interfaces:根据用户需求生成更适合任务的交互式界面。
- Gemini Agent:用于执行复杂、多步骤任务,优先面向 Google AI Ultra 用户推出。
- 更强多模态理解:改善图像、文本和复杂上下文处理。
2026年:Gemini 3.1 与 Gemini App 持续更新
2026 年,Gemini App 围绕 Gemini 3.1 Pro、Personal Intelligence、Nano Banana、NotebookLM、Gemini Live、Google TV、Google Maps、Google Photos 等方向继续扩展。
截至本文整理时,Gemini 官方订阅页面显示,Gemini App 中已包含 Gemini 3 Flash、Gemini 3.1 Pro、Nano Banana Pro 图像生成、Veo 3.1 Lite 视频生成、Deep Research、Gemini Live、Canvas、Gems、NotebookLM、Flow、Google Search 集成和 Google Workspace 集成等能力。
Gemini 模型版本 / 产品版本
Gemini 1
Gemini 1 是 Google DeepMind 推出的第一代 Gemini 模型系列,重点是原生多模态能力和长上下文能力。
主要版本包括:
- Gemini Nano
- Gemini Pro
- Gemini Ultra
Gemini 1 奠定了 Gemini 同时处理文本、图像、音频、视频和代码的基础。
Gemini 1.5
Gemini 1.5 强化长上下文能力,适合长文档、代码库、视频和复杂信息分析。
典型应用场景包括:
- 长文件总结。
- 多文档分析。
- 视频内容理解。
- 长代码库问答。
- 企业知识库处理。
- 大规模上下文推理。
Gemini 2
Gemini 2 将思考、推理、工具使用和 agentic 能力作为重点方向,推动 Gemini 从“回答问题”走向“执行任务”。
该系列为后续 Gemini Live、Project Astra、Agent 能力、开发者工具调用和多模态实时交互提供基础。
Gemini 2.5 Pro
Gemini 2.5 Pro 面向复杂任务,强调深度推理、代码能力和多模态理解。
适合场景包括:
- 复杂研究。
- 代码生成与调试。
- 长文档分析。
- 多步骤推理。
- 数学与科学问题。
- 产品原型设计。
- 代码库理解。
Gemini 2.5 Flash
Gemini 2.5 Flash 是兼顾速度、成本和能力的多模态模型,适合高频调用、实时交互和生产应用。
适用场景包括:
- 聊天助手。
- 内容生成。
- 多模态问答。
- 图片理解。
- 快速总结。
- 中等复杂度推理。
- 应用内 AI 功能。
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite 是 2.5 系列中更快、更经济的多模态模型,适合成本敏感、高并发和低延迟场景。
适用场景包括:
- 批量分类。
- 简短总结。
- 快速路由。
- 低成本内容处理。
- 高频 API 调用。
- 简单结构化抽取。
Gemini 3
Gemini 3 是 Gemini 系列的重要升级,增强推理、代码、多模态理解和 agentic 能力。
Gemini 3 在 Gemini App 中带来更强的复杂任务处理能力,并支持 Generative Interfaces 和 Gemini Agent 等产品体验。
Gemini 3.1 Pro
Gemini 3.1 Pro 是 Gemini 官方订阅页面中面向高级用户的重要模型,定位为更强的复杂任务处理模型。
适用场景包括:
- 深度研究。
- 复杂规划。
- 高级代码任务。
- 多模态分析。
- 交互式模拟。
- 复杂问题求解。
- 大上下文任务处理。
Gemini 3 Flash
Gemini 3 Flash 是 Gemini 3 系列中面向速度和实用性的模型,出现在 Gemini App 免费层和高级计划中。
适用场景包括:
- 日常问答。
- 写作辅助。
- 快速信息整理。
- 多模态输入处理。
- 低延迟聊天体验。
Gemini Image / Nano Banana
Nano Banana 是 Gemini 原生图像生成能力的名称。其对应模型包括 Gemini 2.5 Flash Image、Gemini 3.1 Flash Image Preview 和 Gemini 3 Pro Image Preview 等。
在 Gemini App 中,Nano Banana 负责图像生成和图像编辑;在开发者端,相关能力可通过 Gemini API 调用。
Gemini Veo
Veo 是 Google 的视频生成模型系列,在 Gemini App、Flow 和部分 Google AI 订阅计划中提供视频生成能力。
Gemini 订阅页面列出 Veo 3.1 Lite 作为视频生成相关能力之一,不同计划有不同使用额度和访问限制。
功能
文本生成与写作辅助
Gemini 可用于写作、改写、总结、翻译、头脑风暴、邮件草稿、学习笔记、脚本、报告和计划生成。
常见场景包括:
- 写文章。
- 起草邮件。
- 生成大纲。
- 改写文案。
- 提炼会议纪要。
- 翻译文本。
- 生成社交媒体内容。
- 制定旅行或学习计划。
多模态理解
Gemini 支持处理文本、图像、文件、代码、音频和视频等多种输入形式。
适用场景包括:
- 分析图片。
- 理解截图。
- 解释图表。
- 总结 PDF。
- 读取表格。
- 分析代码。
- 理解视频内容。
- 从多种资料中整合结论。
图像生成与图像编辑
Gemini App 集成 Nano Banana 图像生成和编辑能力,可用于:
- 生成图片。
- 编辑照片。
- 改变背景。
- 修改风格。
- 生成海报。
- 生成图标。
- 创建视觉草图。
- 生成社交媒体图片。
- 进行多轮图像编辑。
Deep Research
Deep Research 是 Gemini 的研究代理能力,可用于检索、分析和整理大量网页信息,并生成结构化研究报告。
适用场景包括:
- 市场调研。
- 竞品分析。
- 论文背景研究。
- 行业趋势分析。
- 旅行规划。
- 采购研究。
- 复杂问题资料整理。
Gemini Live
Gemini Live 是 Gemini 的语音对话能力,适合自然语音交流、学习辅导、头脑风暴和实时问题讨论。
适用场景包括:
- 口语练习。
- 面试模拟。
- 实时答疑。
- 旅行沟通。
- 课堂辅导。
- 创意讨论。
Canvas
Canvas 是 Gemini 中用于创作、编辑和迭代内容的工作区能力,适合处理较长文本、代码、文档和创作项目。
适用场景包括:
- 写长文。
- 修改代码。
- 生成网页。
- 制作草稿。
- 迭代文章。
- 组织项目内容。
Gems
Gems 是 Gemini 中的自定义 AI 专家功能。用户可以为特定任务保存详细指令,创建定制化助手。
适用场景包括:
- 职业教练。
- 写作助手。
- 学习导师。
- 编程助手。
- 品牌文案助手。
- 项目管理助手。
Personal Intelligence
Personal Intelligence 使 Gemini 能够在用户授权后结合 Google 应用中的上下文,提供更个性化的帮助。
适用场景包括:
- 基于 Gmail 的日程和邮件辅助。
- 基于 Google Photos 的个性化图像生成。
- 基于个人偏好生成建议。
- 基于历史上下文提供更连续的回答。
Gemini in Google Workspace
Gemini 可集成到 Gmail、Docs、Sheets、Slides、Meet、Vids 等 Google Workspace 产品中。
典型场景包括:
- 在 Gmail 中起草邮件。
- 在 Docs 中改写文档。
- 在 Sheets 中分析数据。
- 在 Slides 中生成演示内容。
- 在 Meet 中总结会议。
- 在 Vids 中辅助视频制作。
Gemini in Chrome
Gemini in Chrome 是浏览器中的个人助理能力,可帮助用户理解网页内容、总结页面、处理浏览任务和辅助网页操作。
该能力在部分订阅计划中以 early access 形式出现。
Google Search 集成
Gemini 与 Google Search 结合,用于增强事实性、检索能力和搜索体验。
在 Google AI 高级订阅中,Gemini 3 Pro、Deep Search、AI Mode 和 Search Labs 等能力提供更强搜索与推理结合体验。
代码能力
Gemini 可用于代码生成、代码解释、调试、重构、测试生成和代码库分析。
相关入口包括:
- Gemini App。
- Google AI Studio。
- Gemini API。
- Gemini Code Assist。
- Gemini CLI。
- Google Antigravity。
- Jules。
Gemini Agent
Gemini Agent 是用于执行复杂多步骤任务的 agent 能力,优先面向 Google AI Ultra 用户推出。
适用场景包括:
- 整理邮箱。
- 规划旅行。
- 完成跨应用任务。
- 协调复杂信息。
- 执行多步骤研究和操作。
Google Gemini 订阅与价格
Free
| 项目 | 内容 |
|---|---|
| 价格 | 0美元/月 |
| 账户要求 | Google Account |
| Gemini App | 个人 AI 助手 |
| 模型访问 | Access to 3 Flash;对 3.1 Pro 有变化性访问 |
| 图像能力 | Image generation and editing |
| 研究能力 | Deep Research |
| 语音能力 | Gemini Live |
| 创作能力 | Canvas、Gems |
| AI credits | 50 daily AI credits |
| 存储 | 15GB Google 存储空间 |
| 适合用户 | 日常问答、学习、轻度写作、基础图像生成和轻量研究 |
Google AI Plus
| 项目 | 内容 |
|---|---|
| 价格 | 7.99美元/月 |
| 包含内容 | Free 计划全部权益 |
| Gemini App | 更高访问额度 |
| 模型访问 | 增强访问 3.1 Pro |
| 图像能力 | Nano Banana Pro 图像生成 |
| 视频能力 | 有限访问 Veo 3.1 Lite |
| AI credits | 200 monthly AI credits |
| Flow | 更多 AI 视频创作访问 |
| Google Search | 更多 Gemini 3 Pro 与实验能力访问 |
| NotebookLM | 更多 Audio Overviews、notebooks 等 |
| Workspace | Gemini in Gmail、Vids 等 |
| Chrome | Gemini in Chrome early access |
| 存储 | 200GB Google 存储空间 |
| 适合用户 | 轻中度创作者、学生、知识工作者、需要更多生成额度的个人用户 |
Google AI Pro
| 项目 | 内容 |
|---|---|
| 价格 | 19.99美元/月 |
| 包含内容 | Free 计划全部权益 |
| Gemini App | 更高访问额度 |
| 模型访问 | 更高访问 3.1 Pro |
| 图像能力 | Nano Banana Pro 图像生成 |
| 视频能力 | Veo 3.1 Lite 视频生成 |
| AI credits | 1,000 monthly AI credits |
| Flow | 更高访问额度 |
| Google Search | 更高 Gemini 3 Pro、Deep Search、agentic capabilities 和 Search Labs 访问 |
| Jules | 更高异步编码代理额度 |
| Gemini Code Assist / Gemini CLI | 更高每日请求限制 |
| Google Antigravity | 更高 agent model rate limits |
| NotebookLM | 5x 更多 Audio Overviews、notebooks 等 |
| Workspace | Gemini in Gmail、Docs、Vids 等 |
| Chrome | Gemini in Chrome early access |
| Google Home Premium | Standard plan |
| 存储 | 5TB Google 存储空间 |
| 适合用户 | 高频创作者、研究人员、开发者、专业知识工作者和需要较高 AI 使用量的个人用户 |
Google AI Ultra
| 项目 | 内容 |
|---|---|
| 价格 | 249.99美元/月 |
| 包含内容 | Google AI Pro 全部权益 |
| Gemini App | 最高模型与功能限制 |
| 模型访问 | 最高级别 Gemini 模型访问,包含 Deep Think 与 Gemini Agent 等能力 |
| 图像能力 | 更高 Nano Banana Pro 相关访问 |
| 视频能力 | 最高等级 Veo 3.1 相关访问 |
| AI credits | 25,000 monthly AI credits |
| Flow | 最高访问额度 |
| Google Search | 最高 Gemini 3 Pro、Deep Search、agentic capabilities 和 Search Labs 访问 |
| Jules | 最高异步编码代理额度 |
| Gemini Code Assist / Gemini CLI | 最高每日请求限制 |
| Google Antigravity | 最高 agent model rate limits |
| NotebookLM | 最高限制和最佳模型能力 |
| Workspace | Gemini in Gmail、Docs、Vids 等最高限制 |
| Google Home Premium | Advanced plan |
| Project Mariner | Early access,美国限定 |
| Project Genie | 美国限定 |
| YouTube Premium | Individual plan |
| 存储 | 30TB Google 存储空间 |
| 适合用户 | 重度 AI 用户、高频创作者、专业研究人员、开发者和需要最高额度的个人用户 |
Gemini 所属生态的关系
Gemini 是 Google AI 生态的核心品牌,覆盖模型、产品和平台三个层级。
| 层级 | 名称 | 说明 |
|---|---|---|
| 基础模型 | Gemini Models | Google DeepMind 开发的多模态基础模型 |
| 消费产品 | Gemini App | 面向普通用户的 AI 助手 |
| 开发者平台 | Gemini API / Google AI Studio | 面向开发者的模型调用与原型构建平台 |
| 企业平台 | Vertex AI / Gemini Enterprise | 面向企业的 AI 开发与部署平台 |
| 办公生态 | Gemini for Google Workspace | Gmail、Docs、Sheets、Slides、Meet、Vids 等产品中的 AI 能力 |
| 搜索生态 | Google Search / AI Mode | Gemini 与搜索、Deep Search、Search Labs 结合 |
| 设备生态 | Android / Pixel / Chrome | Gemini 在设备和浏览器中的 AI 助手能力 |
| 创作生态 | Nano Banana / Veo / Flow / Whisk | 图像、视频和创意生成能力 |
| 开发生态 | Gemini Code Assist / Gemini CLI / Jules / Antigravity | 面向软件开发者的 AI 编码和 agent 工具 |
Google Gemini 使用入口
Gemini App
Gemini App 是面向普通用户的主入口。
入口地址:点击查看
Google AI Studio
Google AI Studio 是开发者试验和构建 Gemini 应用的入口。
入口地址:点击查看
Gemini API
Gemini API 是开发者调用 Gemini 模型的 API 入口。
文档入口:点击查看
Vertex AI
Vertex AI 是 Google Cloud 上的企业级 AI 平台,可用于通过 Google Cloud 体系调用 Gemini 模型。






