DeepSeek 信息概览
| 项目 | 内容 |
|---|---|
| 名称 | DeepSeek |
| 中文名称 | 深度求索 |
| 产品类型 | AI 助手 / 大语言模型系列 / 推理模型 / 开发者 API |
| 开发者 | DeepSeek, Inc. |
| 主要入口 | DeepSeek Web、DeepSeek App、DeepSeek API、GitHub、Hugging Face |
| 当前官网重点模型 | DeepSeek-V4 Preview |
| 当前 API 模型 | deepseek-v4-flash、deepseek-v4-pro |
| 旧 API 模型名 | deepseek-chat、deepseek-reasoner |
| 上下文长度 | 当前 API 文档显示 DeepSeek-V4 系列为 1M |
| 主要能力 | 聊天问答、复杂推理、代码、数学、工具调用、JSON 输出、长上下文、Agent 任务 |
| 代表模型 | DeepSeek-V2.5、DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-0528、DeepSeek-V3.1、DeepSeek-V3.2、DeepSeek-V4 Preview |
| 官方网站 | https://www.deepseek.com/ |
| 在线聊天 | https://chat.deepseek.com/ |
| API 平台 | https://platform.deepseek.com/ |
| API 文档 | https://api-docs.deepseek.com/ |
| GitHub | https://github.com/deepseek-ai |
| Hugging Face | https://huggingface.co/deepseek-ai |
DeepSeek 概述
DeepSeek 是一个以高性价比模型、开放模型权重和推理能力为核心特色的 AI 产品与模型体系。用户可以通过 DeepSeek Web 和 App 免费体验聊天、推理和代码能力;开发者可以通过 DeepSeek API 调用最新模型,用于构建聊天机器人、代码助手、智能体应用、搜索增强系统和自动化工作流。
DeepSeek 的模型路线主要包括两类:一类是通用对话与代码模型,例如 DeepSeek-V2.5、DeepSeek-V3、DeepSeek-V3.2 和 DeepSeek-V4;另一类是推理模型,例如 DeepSeek-R1、DeepSeek-R1-0528 和 V3.2 / V4 中的思考模式。
DeepSeek API 采用兼容 OpenAI / Anthropic 的接口格式,方便开发者迁移已有应用。当前 API 文档显示,DeepSeek-V4 系列支持非思考与思考模式、1M 上下文、JSON 输出、工具调用和 Chat Prefix Completion 等能力。
DeepSeek 名称与定位
DeepSeek 既是产品品牌,也是模型系列名称。不同语境中的含义如下:
| 名称 | 所属场景 | 含义 |
|---|---|---|
| DeepSeek | 总称 | 深度求索的 AI 助手与模型品牌 |
| DeepSeek Web / App | 用户产品 | 面向普通用户的聊天和推理入口 |
| DeepSeek API | 开发者平台 | 面向开发者的模型调用服务 |
| deepseek-chat | API 旧模型名 | 当前指向 DeepSeek-V4-Flash 的非思考模式,计划 2026年7月24日停用 |
| deepseek-reasoner | API 旧模型名 | 当前指向 DeepSeek-V4-Flash 的思考模式,计划 2026年7月24日停用 |
| deepseek-v4-flash | API 模型 | DeepSeek-V4 系列快速版本 |
| deepseek-v4-pro | API 模型 | DeepSeek-V4 系列更高能力版本 |
| DeepSeek-R1 | 推理模型 | 面向数学、代码和复杂推理任务 |
| DeepSeek-V3 / V3.2 | 通用模型 | 面向聊天、代码、推理和 Agent 任务 |
| DeepSeek Sparse Attention | 模型技术 | 用于提升长上下文训练和推理效率的稀疏注意力机制 |
DeepSeek 的核心定位是提供高能力、低成本、开放生态友好的 AI 模型与 API 服务。它在开发者社区中受到关注的重要原因包括模型权重开放、API 价格低、推理能力强,以及对 OpenAI / Anthropic 接口格式的兼容。
DeepSeek 发展历史
2024年7月:API 新功能发布
DeepSeek API 增加多项新能力,包括 JSON 输出、工具调用、FIM Completion、Chat Prefix Completion 等,为开发者构建应用提供更多接口能力。
2024年8月:上下文缓存上线
DeepSeek API 上线 Context Caching,上下文缓存命中后可显著降低重复前缀请求的输入成本。
2024年9月:DeepSeek-V2.5 发布
DeepSeek-V2.5 发布,将 DeepSeek V2 Chat 和 DeepSeek Coder V2 的能力整合到统一模型中,提升通用对话和代码能力。
2024年12月:DeepSeek-V3 发布
DeepSeek-V3 发布。该模型采用 MoE 架构,总参数量 671B,每个 token 激活 37B 参数,并使用 MLA 与 DeepSeekMoE 架构,强调高效训练和推理。
2025年1月:DeepSeek App 上线
DeepSeek App 发布,普通用户可以通过移动端入口使用 DeepSeek 的对话和推理能力。
2025年1月:DeepSeek-R1 发布
DeepSeek-R1 发布,成为 DeepSeek 的代表性推理模型。它基于 DeepSeek-V3-Base 训练,面向数学、代码和复杂推理任务,并开放 DeepSeek-R1-Zero、DeepSeek-R1 以及多个蒸馏模型。
2025年3月:DeepSeek-V3-0324 更新
DeepSeek-V3 更新到 0324 版本,增强推理、前端代码生成、中文写作、多轮改写、翻译和函数调用等能力。
2025年5月:DeepSeek-R1-0528 发布
DeepSeek-R1-0528 发布,提升复杂推理、代码、前端生成、函数调用和幻觉抑制能力。
2025年8月:DeepSeek-V3.1 发布
DeepSeek-V3.1 发布,采用混合推理架构,单一模型支持思考模式和非思考模式,并增强工具使用和智能体任务能力。
2025年9月:DeepSeek-V3.1-Terminus 更新
DeepSeek-V3.1-Terminus 发布,主要修复用户反馈问题,优化语言一致性、Code Agent 和 Search Agent 表现。
2025年9月:DeepSeek-V3.2-Exp 发布
DeepSeek-V3.2-Exp 发布,引入 DeepSeek Sparse Attention(DSA),用于提升长上下文训练和推理效率。该版本上线 Web、App 和 API,并同步降低 API 价格。
2025年12月:DeepSeek-V3.2 发布
DeepSeek-V3.2 发布,定位为面向 Agent 的推理优先模型。该版本支持思考模式下的工具调用,并开放 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale 模型权重。
2026年4月:DeepSeek-V4 Preview 发布
DeepSeek-V4 Preview 发布,并在 Web、App 和 API 可用。官网将其定位为具备更强 Agent 能力和高水平推理能力的新版本。
2026年4月:DeepSeek API 切换至 V4 系列
DeepSeek API 文档显示,当前 API 模型包括 deepseek-v4-flash 与 deepseek-v4-pro。旧模型名 deepseek-chat 与 deepseek-reasoner 当前分别指向 deepseek-v4-flash 的非思考模式和思考模式,并将在 2026年7月24日停用。
DeepSeek 模型版本 / 产品版本
DeepSeek Web / App
DeepSeek Web 和 App 是面向普通用户的产品入口。用户可以免费访问 DeepSeek,体验聊天、推理、代码和日常问答能力。
DeepSeek API
DeepSeek API 是面向开发者的模型调用入口,支持 OpenAI / Anthropic 兼容格式。开发者可以通过修改 base URL 和模型名称,将已有应用迁移到 DeepSeek API。
DeepSeek-V4 Preview
DeepSeek-V4 Preview 是 DeepSeek 官网当前重点展示的模型版本,强调更强 Agent 能力和顶级推理能力。当前已在 Web、App 和 API 可用。
deepseek-v4-flash
deepseek-v4-flash 是 DeepSeek API 当前模型之一,支持非思考和思考模式,默认支持思考模式。它也是旧模型名 deepseek-chat 与 deepseek-reasoner 当前指向的底层模型。
deepseek-v4-pro
deepseek-v4-pro 是 DeepSeek API 当前模型之一,面向更高能力需求。API 文档显示它与 deepseek-v4-flash 同样支持 1M 上下文、JSON 输出、工具调用和 Chat Prefix Completion。
DeepSeek-V3.2
DeepSeek-V3.2 是 2025年12月发布的推理优先模型,面向智能体任务。它支持思考模式下的工具调用,并提供 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale 两个版本。
DeepSeek-R1
DeepSeek-R1 是 DeepSeek 的代表性推理模型,面向数学、代码和复杂推理任务。DeepSeek-R1 与 DeepSeek-R1-Zero 均基于 DeepSeek-V3-Base 训练,并开放了多个蒸馏模型。
DeepSeek-V3
DeepSeek-V3 是 DeepSeek 的代表性通用 MoE 模型,总参数量 671B,每个 token 激活 37B 参数。该模型使用 MLA 与 DeepSeekMoE 架构,并在训练效率和推理成本上强调优化。
DeepSeek 核心功能
聊天问答
DeepSeek 可用于日常问答、知识解释、资料整理、文本生成和多轮对话。
复杂推理
DeepSeek 的 reasoner / thinking 模式面向数学、代码、逻辑推理和复杂问题拆解。
代码能力
DeepSeek 可用于代码生成、代码解释、调试、前端页面生成、函数调用和软件工程辅助。
长上下文
DeepSeek-V4 API 文档显示其上下文长度为 1M,适合长文档、长代码库和多轮复杂上下文任务。
工具调用
DeepSeek API 支持工具调用,可用于构建 Agent、工作流自动化和外部工具集成。
JSON 输出
DeepSeek API 支持 JSON Output,适合结构化信息抽取、数据处理和应用后端集成。
上下文缓存
DeepSeek API 支持 Context Caching,可降低重复前缀请求的输入成本。
OpenAI / Anthropic 兼容 API
DeepSeek API 支持 OpenAI / Anthropic 兼容格式,便于开发者迁移已有应用。
DeepSeek 订阅与价格
DeepSeek Web / App
DeepSeek 官网显示用户可免费访问 DeepSeek,体验智能模型。
DeepSeek API 价格
DeepSeek API 按输入和输出 tokens 计费,价格单位为每 100万 tokens。官方价格页列出旧模型名 deepseek-chat 与 deepseek-reasoner 的价格;当前变更日志显示这两个旧模型名在过渡期内分别指向 deepseek-v4-flash 的非思考模式与思考模式。
| API 模型名 | 上下文长度 | 最大 CoT tokens | 最大输出 tokens | 输入价格:缓存命中 | 输入价格:缓存未命中 | 输出价格 |
|---|---|---|---|---|---|---|
deepseek-chat | 64K | – | 8K | 0.07美元 / 百万 tokens | 0.27美元 / 百万 tokens | 1.10美元 / 百万 tokens |
deepseek-reasoner | 64K | 32K | 8K | 0.14美元 / 百万 tokens | 0.55美元 / 百万 tokens | 2.19美元 / 百万 tokens |
注意:DeepSeek API 变更日志显示,
deepseek-chat和deepseek-reasoner两个旧模型名将在 2026年7月24日停用。当前 DeepSeek API 文档中的新模型为deepseek-v4-flash和deepseek-v4-pro。实际价格、折扣和过渡期规则应以 DeepSeek API Docs 与平台控制台显示为准。
DeepSeek 使用入口
DeepSeek 官网
DeepSeek Web
DeepSeek Web 是面向普通用户的在线聊天入口。
DeepSeek API 平台
入口:https://platform.deepseek.com/
DeepSeek API 平台用于管理 API key、调用模型和查看开发者服务。
DeepSeek API 文档
入口:https://api-docs.deepseek.com
DeepSeek API 文档提供模型、价格、调用方式、接口兼容性、工具调用、JSON 输出、缓存和更新日志等信息。
GitHub
入口:https://github.com/deepseek-ai
DeepSeek GitHub 组织提供模型仓库、技术报告、代码和开源项目。
Hugging Face
入口:https://huggingface.co/deepseek-ai
DeepSeek 在 Hugging Face 上发布部分模型权重和模型卡。






