Midjourney简介
Midjourney 是一个面向图像与视频生成的生成式 AI 创作平台。根据 Midjourney 官方网站介绍,Midjourney 是一个由社区资助的研究实验室,团队约 60人,以构建高质量 AI 模型为核心方向。根据官方文档,用户可以通过 Midjourney 网站或 Discord 与 Midjourney Bot 交互,使用文本提示词、图像参考、参数控制等方式生成图像和视频。
Midjourney信息概览
| 项目 | 内容 |
|---|---|
| 名称 | Midjourney |
| 产品类型 | 生成式 AI 图像与视频创作平台 |
| 开发者 | Midjourney |
| 组织性质 | 官方自称为 community-funded research lab |
| 团队规模 | 官方网站披露约 60人 |
| 当前默认图像模型 | Midjourney V7 |
| 最新公开实验模型 | V8.1 Alpha,于 2026年4月14日 在 alpha.midjourney.com 发布 |
| 主要功能 | 文生图、图生图、图像编辑、风格参考、图像参考、Omni Reference、视频生成、参数控制、Draft Mode、Conversational Mode |
| 使用入口 | Midjourney 网站、Midjourney Discord Bot、alpha.midjourney.com、niji・journey App |
| 订阅计划 | Basic、Standard、Pro、Mega |
| 官方网站 | https://www.midjourney.com/ |
| 官方文档 | https://docs.midjourney.com/ |
概述
Midjourney 是一个生成式 AI 创作平台,主要用于根据文本提示词、图像参考和参数设置生成图像,也支持将图像转换为短视频。官方文档显示,Midjourney 的创作流程以 prompt 为核心,用户输入文字描述后,系统会生成图像或视频结果。
Midjourney 早期以 Discord Bot 作为主要交互方式,用户可通过 /imagine 命令生成图像。现在,Midjourney 也提供基于网页的 Create 页面,用户可以在 midjourney.com 上输入提示词、上传图像、调整默认设置、管理作品,并继续使用变体、编辑、视频生成等功能。
截至本文整理时,Midjourney 官方文档显示当前默认图像版本为 V7。同时,Midjourney 已在 alpha.midjourney.com 上开放 V8.1 Alpha 预览版,但该版本尚未在主站或 Discord 中可用。
名称与定位
Midjourney 官方网站将其描述为一个 community-funded research lab,目标是探索新的思想媒介,并扩展人类的想象力。其官网“About”部分称,Midjourney 以构建高质量 AI 模型为主要方向,并正在围绕想象、协调、反思、美和人类繁荣等主题开展项目。
在产品定位上,Midjourney 主要面向以下群体:
- 视觉创作者
- 插画师
- 设计师
- 艺术家
- 广告与营销人员
- 影视概念设计人员
- 游戏美术与世界观设计人员
- 需要快速视觉草图和创意探索的个人用户
Midjourney 的核心使用方式是通过提示词控制生成结果。官方文档将 prompt 定义为用户告诉 Midjourney 想生成何种图像或视频的文本或短语。Midjourney 也提供参数系统,用户可以通过参数调整图像比例、风格化程度、随机性、版本、参考图像等生成行为。
历史
2022年:早期公开版本与 V4
Midjourney 官方旧功能文档显示,Version 4 于 2022年11月 发布,并在 2022年12月20日至2023年3月30日 期间作为默认模型。
官方文档称,V4 是一个全新的代码库和 AI 架构,由 Midjourney 设计,并在新的 Midjourney AI supercluster 上训练。与此前版本相比,V4 对生物、地点、物体等内容有更多知识,并在细节和复杂提示词处理方面有提升。
2023年3月:Version 5 发布
官方旧功能文档显示,Version 5 于 2023年3月 发布,并在 2023年3月30日至2023年5月3日 期间作为默认模型。
官方说明称,V5 相比此前版本更偏向照片级生成,并能更贴近提示词内容,但通常需要更长提示词才能达到用户希望的美学效果。
2023年5月:Version 5.1 发布
官方旧功能文档显示,Version 5.1 于 2023年5月4日 发布,并在 2023年5月3日至2023年6月22日 期间作为默认模型。
官方说明称,V5.1 拥有更强的默认美学表现,更容易通过简单文本提示词使用,并改善了自然语言提示理解、图像连贯性、锐度和重复图案支持。
2023年6月:Version 5.2 发布
官方旧功能文档显示,Version 5.2 于 2023年6月 发布,并在 2023年6月22日至2024年2月14日 期间作为默认模型。
官方说明称,V5.2 生成结果更细致、更锐利,并在色彩、对比度和构图方面有所提升。
2023年12月:Version 6 发布
Midjourney 官方版本文档显示,Version 6 于 2023年12月20日 发布,并在 2024年2月14日至2024年7月30日 期间作为默认模型。
官方说明称,V6 增强了对长输入的提示词准确性,改善了图像连贯性、知识表现,并增强了图像提示和 Remix 能力。
2024年7月:Version 6.1 发布
官方版本文档显示,Version 6.1 于 2024年7月30日 发布,并在 2024年7月30日至2025年6月16日 期间作为默认模型。
官方说明称,V6.1 生成图像更连贯,细节和纹理更精确,并且生成速度约比 V6 快 25%。
2025年4月:Version 7 发布
官方版本文档显示,Version 7 于 2025年4月3日 发布,并于 2025年6月17日 成为默认模型。
官方说明称,V7 在文本提示和图像提示处理上更精确,图像质量在纹理、细节、身体、手部和物体连贯性方面有所提升。V7 还引入了 Draft Mode 和 Omni Reference。
2026年1月:Niji 7 发布
官方版本文档显示,Niji 7 于 2026年1月9日 发布。Niji 系列是 Midjourney 与 Spellbrush 合作开发的特殊模型系列,重点面向东方美学、动画风格和插画风格。
官方说明称,Niji 7 在连贯性、眼睛、反射、小背景元素等细节表现上有提升,并更贴近提示词。
2026年3月:V8 Alpha 发布
官方版本文档显示,首个 V8 Alpha 于 2026年3月17日 发布,并在有限时间内可用。
官方说明称,V8 Alpha 是 Midjourney 当时速度最快的模型,标准任务渲染速度约比早期版本快 4–5倍,并在提示词理解和细节保持方面有所提升。
2026年4月:V8.1 Alpha 发布
官方版本文档显示,V8.1 Alpha 于 2026年4月14日 在 alpha.midjourney.com 发布。
官方说明称,V8.1 Alpha 尚未在 Midjourney 主站或 Discord 中可用,相关创作暂时不会显示在主站。由于它是 Alpha 版本,模型仍可能在测试和改进过程中发生较大变化。
V8.1 Alpha 支持默认 HD 图像,可生成更高分辨率的 2K 图像,无需再通过传统方式进行 upscaling。官方文档还说明,HD 成本为 1.33分钟 GPU 时间,而 SD 成本低于 1 分钟 GPU 时间。
模型版本 / 产品版本
Midjourney V7
Midjourney V7 是官方文档中显示的当前默认版本。用户可以通过 --v 7 参数或设置面板选择该版本。
官方说明称,V7 在文本和图像提示处理方面具有更高精度,并在图像质量、纹理、细节、身体、手部和物体连贯性方面有提升。V7 还引入了 Draft Mode 和 Omni Reference。
Midjourney V8.1 Alpha
V8.1 Alpha 是 Midjourney 官方公开的实验版本,于 2026年4月14日 在 alpha.midjourney.com 发布。
官方说明称,V8.1 Alpha 尚未在 Midjourney 主站或 Discord 中可用。该版本支持默认 HD 图像,可生成 2048px / 2K 图像,并提供更快的生成体验。
由于 V8.1 Alpha 仍处于 Alpha 阶段,官方明确提示模型可能在测试和改进过程中发生较大变化。
Niji 系列
Niji 是 Midjourney 与 Spellbrush 合作开发的特殊模型系列,重点面向东方美学、动画与插画风格。官方版本文档显示,Niji 7 于 2026年1月9日 发布。
Niji 模型有独立网站和 Discord 社区,主要服务于偏动漫、插画和日系视觉风格的创作场景。
功能
文本生成图像
Midjourney 的核心功能是根据文本提示词生成图像。官方文档说明,用户可以通过 prompt 描述想看到的图像或视频内容。提示词可以是一个词,也可以是完整短语。
在 Discord 中,用户可以通过 /imagine 命令生成图像。官方 Discord 快速入门文档说明,Midjourney Bot 通常会在一次请求中生成四个图像选项。
网页端创作
Midjourney 提供基于网页的 Create 页面。官方文档称,Create 页面是用户在 midjourney.com 上生成图像的核心入口。
在网页端,用户可以通过 Imagine bar 输入提示词,上传图像,调整默认设置,开启 Personalization、Draft Mode、Conversational Mode,并管理生成结果。
Discord Bot
Midjourney 仍支持通过 Discord Bot 使用。用户可以在 Midjourney 官方服务器的 general-# 或 newbie-# 频道中使用,也可以在已邀请 Midjourney Bot 的其他 Discord 服务器中使用。
官方 Discord 快速入门文档说明,/imagine 命令用于根据简短文本描述生成独特图像。
图像提示词
Midjourney 支持 Image Prompts。官方文档说明,图像提示词允许用户在文本提示之外加入图片,以影响新图像的内容、构图和颜色。
Image Prompts 并不是复制原图,而是让 Midjourney 将图像的核心元素作为新作品的灵感来源。
Style Reference
Style Reference 是 Midjourney 用于捕捉已有图像视觉风格并应用到新生成图像的功能。
官方文档说明,Style Reference 不复制对象或人物,而是借鉴颜色、媒介、纹理、光照等整体风格特征。该功能兼容 Midjourney V6 和 V7。
Omni Reference
Omni Reference 是 Midjourney V7 中用于把参考图像中的人物、物体、车辆或非人类生物带入新图像的功能。
官方文档说明,Omni Reference 取代了 V7 中的 Character Reference。该功能只兼容 Midjourney V7,并且使用 Omni Reference 会比普通 V7 图像消耗 2倍 GPU 时间。
Omni Reference 当前存在一些限制,例如不能与仍使用 V6.1 的 inpainting、outpainting 等功能兼容,也不能与 Fast Mode、Draft Mode、--q 4 等组合使用。
参数控制
Midjourney 提供一套参数系统。官方文档称,参数是特殊指令,可用于控制、定制和增强图像结果。
常见参数包括:
--ar或--aspect:调整图像宽高比。--chaos或--c:增加结果变化度。--no:指定不希望出现的内容。--oref:使用 Omni Reference。--v或--version:切换模型版本。--stylize:控制风格化程度。--seed:控制随机种子。--tile:生成可平铺图案。--weird:增加非传统或奇异效果。
官方文档提示,参数必须放在提示词末尾,并注意空格和格式。
Draft Mode
Draft Mode 是 Midjourney 用于快速原型创作的模式。官方文档称,Draft Mode 生成速度可达普通模式约 10倍,并且只消耗约 一半 GPU 成本。
Draft Mode 兼容 Midjourney V7。它适合快速测试创意、探索构图和迭代提示词。
Conversational Mode
Conversational Mode 允许用户用自然对话描述想法,由 AI 帮助撰写提示词。官方文档说明,该功能可通过文本或语音使用,并且支持其他语言。
官方文档显示,Conversational Mode 在 V8.1 Alpha 中受支持;文本 Conversational Mode 可以单独使用或配合 Draft Mode,语音 Conversational Mode 需要使用 Draft Mode。
图像编辑
Midjourney 的 Editor 提供网页端图像编辑能力。官方文档说明,Editor 可用于编辑和调整 Midjourney 图像以及用户自己的个人图像。
Editor 支持 Remix、inpainting、Vary Region、Pan、Zoom Out 等功能,用户可以单独使用,也可以组合使用。
视频生成
Midjourney 支持将单张图像转换为 5秒视频。官方文档说明,用户可以提供一张图像作为起始帧,并可选择添加文本提示词,让 Midjourney 生成动态片段。
官方视频文档显示:
- 所有订阅层级都可以在 Fast Mode 下生成视频。
- 只有 Pro 和 Mega 计划可以在 Relax Mode 下生成视频,且为 SD 分辨率。
- Standard、Pro 和 Mega 计划可以生成 HD 分辨率视频,但仅限 Fast Mode。
- 视频生成比普通图像消耗更多 GPU 时间。
- 视频生成支持视频专用参数,如
--motion low、--motion high、--raw、--loop、--end和--bs #。
使用入口
Midjourney 网站
Midjourney 官方网站是当前主要入口之一。用户可以在 midjourney.com 上注册、登录、使用 Create 页面、查看 Explore 页面、管理上传图像和生成内容。点击查看
Discord
用户可以通过 Midjourney Bot 在 Discord 中生成图像和视频。官方快速入门文档说明,用户进入 Midjourney Discord 服务器后,可在 general-# 或 newbie-# 频道中使用 /imagine 命令。
在其他 Discord 服务器中,如果该服务器已邀请 Midjourney Bot,也可以使用 Midjourney Bot 生成内容。
alpha.midjourney.com
alpha.midjourney.com 是 Midjourney V8.1 Alpha 的官方预览入口。官方文档说明,V8.1 Alpha 于 2026年4月14日 在该网站发布,并暂未在主站或 Discord 中提供。点击查看
niji・journey App
niji・journey 是 Midjourney 与 Spellbrush 公司合作推出的动漫/插画专属模型(Niji 系列),专门优化了动漫风格、日式审美、线条表现等。
订阅与价格
Midjourney 官方订阅文档显示,Midjourney 提供四个订阅层级:Basic、Standard、Pro、Mega。所有 Midjourney 计划都是订阅制,会按月或按年自动续订,除非用户取消订阅。
官方文档还说明,选择年度计划可获得 20% 折扣,全年费用需一次性支付。
Basic Plan
| 项目 | 内容 |
|---|---|
| 月付价格 | 10美元/月 |
| 年付价格 | 96美元/年,折合 8美元/月 |
| Fast GPU Time | 3.3小时/月,约 200分钟 |
| Relax GPU Time | 不包含 |
| Stealth Mode | 不包含 |
| 适合用户 | 轻度使用者、入门用户、偶尔生成图像的个人用户 |
Standard Plan
| 项目 | 内容 |
|---|---|
| 月付价格 | 30美元/月 |
| 年付价格 | 288美元/年,折合 24美元/月 |
| Fast GPU Time | 15小时/月 |
| Relax GPU Time | Unlimited Images |
| Stealth Mode | 不包含 |
| 适合用户 | 中度创作者、设计师、内容运营、需要较多图像生成额度的用户 |
Pro Plan
| 项目 | 内容 |
|---|---|
| 月付价格 | 60美元/月 |
| 年付价格 | 576美元/年,折合 48美元/月 |
| Fast GPU Time | 30小时/月 |
| Relax GPU Time | Unlimited Images & SD Video |
| Stealth Mode | 包含 |
| 适合用户 | 专业创作者、商业设计团队、重度用户、需要隐私模式的用户 |
Mega Plan
| 项目 | 内容 |
|---|---|
| 月付价格 | 120美元/月 |
| 年付价格 | 1,152美元/年,折合 96美元/月 |
| Fast GPU Time | 60小时/月 |
| Relax GPU Time | Unlimited Images & SD Video |
| Stealth Mode | 包含 |
| 适合用户 | 高频商业用户、大量生成需求团队、批量测试视觉方案的用户 |
免费试用
Midjourney 官方免费试用文档说明,目前 Discord 和 midjourney.com 网站没有免费试用。
官方说明,目前有限试用仅在 niji・journey App 中提供,适用于 iOS 和 Android 设备。
安全、版权与商业使用
商业使用
Midjourney 官方商业使用文档说明,用户拥有自己在 Midjourney 中创建的图像和视频,即使取消订阅也仍然拥有这些内容,并可按需使用。
官方同时列出两个例外:
- 如果用户 upscale 了其他用户创建的图像,该图像属于原始创作者,而非进行 upscale 的用户。
- 如果用户所属企业年收入超过 1,000,000美元,则需要 Pro 或 Mega Plan 才能将图像用于公司商业用途。
Stealth Mode
Stealth Mode 是 Midjourney 的隐私功能,用于控制用户在 Midjourney 网站上创建的图像和视频是否公开。
官方文档说明,Stealth Mode 仅适用于 Pro 和 Mega 计划用户。即使开启 Stealth Mode,如果用户在 Discord 公共频道中创作,内容仍会被其他用户看到。若需要更完整的隐私,应使用网页 Create 页面、Discord 私信,或在私人 Discord 服务器中配合 Stealth Mode 使用。
训练数据说明
Midjourney 官方 AB2013 训练数据文档显示,Midjourney 模型训练数据来源包括:
- 公开可用数据,包括公开网络和公开可访问仓库中的内容。
- 第三方和 Midjourney 用户提供的数据。
- Midjourney 内部生成的数据,包括用于支持训练目标和补充现实数据的合成数据。
官方文档还说明,训练数据处理步骤包括:
- 去重。
- 移除低质量图像。
- 安全过滤,移除存在儿童性虐待材料等已知风险的内容类别。
- 隐私处理,过滤或移除敏感个人信息。
- 根据相关性、质量或图像格式进行分类。
与所属生态的关系
Midjourney 是一个独立的 AI 创作平台,同时围绕多个入口形成产品生态:
- midjourney.com:网页端创作、浏览、管理和编辑入口。
- Discord Bot:传统交互入口,用于命令式生成图像和视频。
- alpha.midjourney.com:实验版本入口,例如 V8.1 Alpha。
- niji・journey:面向动漫与插画风格的相关体验,由 Niji 系列模型支持。
Midjourney 的官方文档将其功能分为网站使用、Discord 使用、提示词控制、参数控制、图像参考、视频生成、订阅与政策等多个模块。整体上,Midjourney 不只是单一文生图工具,而是覆盖图像生成、图像编辑、风格控制、角色/物体参考、视频生成和社区浏览的视觉创作平台。
适用场景
根据 Midjourney 官方功能说明,其适用场景包括:
- 概念设计:快速生成角色、场景、道具、环境和视觉风格草图。
- 插画与艺术创作:根据自然语言提示生成插画、海报、视觉艺术作品。
- 品牌与营销素材:生成广告概念图、社交媒体图片、活动视觉和产品氛围图。
- 故事板与影视前期:用于场景构图、镜头氛围、角色造型和视觉方向探索。
- 游戏美术探索:生成世界观概念、角色设定、地图氛围和道具方向。
- 图像重混与扩展:通过 Editor、Remix、Vary Region、Pan、Zoom Out 等工具修改和扩展图像。
- 风格统一创作:通过 Style Reference、Personalization、Moodboards 等功能建立稳定视觉风格。
- 人物或物体参考生成:通过 Omni Reference 将参考图像中的人物、物体、车辆或非人类生物带入新作品。
- 短视频生成:将图像转换为 5秒动态视频,用于视觉概念演示或社交媒体素材。
- 快速原型创作:通过 Draft Mode 以更低 GPU 成本和更快速度测试创意方向。
局限与公开信息缺口
目前,Midjourney 官方公开资料没有披露所有模型的完整参数规模、完整训练数据清单、训练成本、详细模型架构、全部评测集结果或完整安全过滤规则。上述信息如未在官方页面披露,本文不作推测。
Midjourney 的部分能力受版本限制。例如:
- V8.1 Alpha 目前仅在 alpha.midjourney.com 可用,尚未在主站或 Discord 中提供。
- Omni Reference 仅兼容 Midjourney V7。
- Omni Reference 与部分仍使用 V6.1 的编辑功能不兼容。
- Stealth Mode 仅适用于 Pro 和 Mega 用户。
- Discord 和 midjourney.com 网站目前没有免费试用。
- 视频生成比普通图像生成消耗更多 GPU 时间。
- Relax Mode 的可用范围取决于订阅计划。
- 商业使用对年收入超过 1,000,000美元的企业存在 Pro 或 Mega 计划要求。
此外,Midjourney 的模型版本、功能兼容性、订阅权益和价格可能随官方更新发生变化。实际使用、购买或商业部署前,应以 Midjourney 官方文档和订阅页面为准。






