DeepSeek最新信息汇总 | 2026年5月更新

DeepSeek最新信息汇总 | 2026年5月更新

DeepSeek 信息概览

项目内容
名称DeepSeek
中文名称深度求索
产品类型AI 助手 / 大语言模型系列 / 推理模型 / 开发者 API
开发者DeepSeek, Inc.
主要入口DeepSeek Web、DeepSeek App、DeepSeek API、GitHub、Hugging Face
当前官网重点模型DeepSeek-V4 Preview
当前 API 模型deepseek-v4-flashdeepseek-v4-pro
旧 API 模型名deepseek-chatdeepseek-reasoner
上下文长度当前 API 文档显示 DeepSeek-V4 系列为 1M
主要能力聊天问答、复杂推理、代码、数学、工具调用、JSON 输出、长上下文、Agent 任务
代表模型DeepSeek-V2.5、DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-0528、DeepSeek-V3.1、DeepSeek-V3.2、DeepSeek-V4 Preview
官方网站https://www.deepseek.com/
在线聊天https://chat.deepseek.com/
API 平台https://platform.deepseek.com/
API 文档https://api-docs.deepseek.com/
GitHubhttps://github.com/deepseek-ai
Hugging Facehttps://huggingface.co/deepseek-ai

DeepSeek 概述

DeepSeek 是一个以高性价比模型、开放模型权重和推理能力为核心特色的 AI 产品与模型体系。用户可以通过 DeepSeek Web 和 App 免费体验聊天、推理和代码能力;开发者可以通过 DeepSeek API 调用最新模型,用于构建聊天机器人、代码助手、智能体应用、搜索增强系统和自动化工作流。

DeepSeek 的模型路线主要包括两类:一类是通用对话与代码模型,例如 DeepSeek-V2.5、DeepSeek-V3、DeepSeek-V3.2 和 DeepSeek-V4;另一类是推理模型,例如 DeepSeek-R1、DeepSeek-R1-0528 和 V3.2 / V4 中的思考模式。

DeepSeek API 采用兼容 OpenAI / Anthropic 的接口格式,方便开发者迁移已有应用。当前 API 文档显示,DeepSeek-V4 系列支持非思考与思考模式、1M 上下文、JSON 输出、工具调用和 Chat Prefix Completion 等能力。


DeepSeek 名称与定位

DeepSeek 既是产品品牌,也是模型系列名称。不同语境中的含义如下:

名称所属场景含义
DeepSeek总称深度求索的 AI 助手与模型品牌
DeepSeek Web / App用户产品面向普通用户的聊天和推理入口
DeepSeek API开发者平台面向开发者的模型调用服务
deepseek-chatAPI 旧模型名当前指向 DeepSeek-V4-Flash 的非思考模式,计划 2026年7月24日停用
deepseek-reasonerAPI 旧模型名当前指向 DeepSeek-V4-Flash 的思考模式,计划 2026年7月24日停用
deepseek-v4-flashAPI 模型DeepSeek-V4 系列快速版本
deepseek-v4-proAPI 模型DeepSeek-V4 系列更高能力版本
DeepSeek-R1推理模型面向数学、代码和复杂推理任务
DeepSeek-V3 / V3.2通用模型面向聊天、代码、推理和 Agent 任务
DeepSeek Sparse Attention模型技术用于提升长上下文训练和推理效率的稀疏注意力机制

DeepSeek 的核心定位是提供高能力、低成本、开放生态友好的 AI 模型与 API 服务。它在开发者社区中受到关注的重要原因包括模型权重开放、API 价格低、推理能力强,以及对 OpenAI / Anthropic 接口格式的兼容。


DeepSeek 发展历史

2024年7月:API 新功能发布

DeepSeek API 增加多项新能力,包括 JSON 输出、工具调用、FIM Completion、Chat Prefix Completion 等,为开发者构建应用提供更多接口能力。

2024年8月:上下文缓存上线

DeepSeek API 上线 Context Caching,上下文缓存命中后可显著降低重复前缀请求的输入成本。

2024年9月:DeepSeek-V2.5 发布

DeepSeek-V2.5 发布,将 DeepSeek V2 Chat 和 DeepSeek Coder V2 的能力整合到统一模型中,提升通用对话和代码能力。

2024年12月:DeepSeek-V3 发布

DeepSeek-V3 发布。该模型采用 MoE 架构,总参数量 671B,每个 token 激活 37B 参数,并使用 MLA 与 DeepSeekMoE 架构,强调高效训练和推理。

2025年1月:DeepSeek App 上线

DeepSeek App 发布,普通用户可以通过移动端入口使用 DeepSeek 的对话和推理能力。

2025年1月:DeepSeek-R1 发布

DeepSeek-R1 发布,成为 DeepSeek 的代表性推理模型。它基于 DeepSeek-V3-Base 训练,面向数学、代码和复杂推理任务,并开放 DeepSeek-R1-Zero、DeepSeek-R1 以及多个蒸馏模型。

2025年3月:DeepSeek-V3-0324 更新

DeepSeek-V3 更新到 0324 版本,增强推理、前端代码生成、中文写作、多轮改写、翻译和函数调用等能力。

2025年5月:DeepSeek-R1-0528 发布

DeepSeek-R1-0528 发布,提升复杂推理、代码、前端生成、函数调用和幻觉抑制能力。

2025年8月:DeepSeek-V3.1 发布

DeepSeek-V3.1 发布,采用混合推理架构,单一模型支持思考模式和非思考模式,并增强工具使用和智能体任务能力。

2025年9月:DeepSeek-V3.1-Terminus 更新

DeepSeek-V3.1-Terminus 发布,主要修复用户反馈问题,优化语言一致性、Code Agent 和 Search Agent 表现。

2025年9月:DeepSeek-V3.2-Exp 发布

DeepSeek-V3.2-Exp 发布,引入 DeepSeek Sparse Attention(DSA),用于提升长上下文训练和推理效率。该版本上线 Web、App 和 API,并同步降低 API 价格。

2025年12月:DeepSeek-V3.2 发布

DeepSeek-V3.2 发布,定位为面向 Agent 的推理优先模型。该版本支持思考模式下的工具调用,并开放 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale 模型权重。

2026年4月:DeepSeek-V4 Preview 发布

DeepSeek-V4 Preview 发布,并在 Web、App 和 API 可用。官网将其定位为具备更强 Agent 能力和高水平推理能力的新版本。

2026年4月:DeepSeek API 切换至 V4 系列

DeepSeek API 文档显示,当前 API 模型包括 deepseek-v4-flashdeepseek-v4-pro。旧模型名 deepseek-chatdeepseek-reasoner 当前分别指向 deepseek-v4-flash 的非思考模式和思考模式,并将在 2026年7月24日停用。


DeepSeek 模型版本 / 产品版本

DeepSeek Web / App

DeepSeek Web 和 App 是面向普通用户的产品入口。用户可以免费访问 DeepSeek,体验聊天、推理、代码和日常问答能力。

DeepSeek API

DeepSeek API 是面向开发者的模型调用入口,支持 OpenAI / Anthropic 兼容格式。开发者可以通过修改 base URL 和模型名称,将已有应用迁移到 DeepSeek API。

DeepSeek-V4 Preview

DeepSeek-V4 Preview 是 DeepSeek 官网当前重点展示的模型版本,强调更强 Agent 能力和顶级推理能力。当前已在 Web、App 和 API 可用。

deepseek-v4-flash

deepseek-v4-flash 是 DeepSeek API 当前模型之一,支持非思考和思考模式,默认支持思考模式。它也是旧模型名 deepseek-chatdeepseek-reasoner 当前指向的底层模型。

deepseek-v4-pro

deepseek-v4-pro 是 DeepSeek API 当前模型之一,面向更高能力需求。API 文档显示它与 deepseek-v4-flash 同样支持 1M 上下文、JSON 输出、工具调用和 Chat Prefix Completion。

DeepSeek-V3.2

DeepSeek-V3.2 是 2025年12月发布的推理优先模型,面向智能体任务。它支持思考模式下的工具调用,并提供 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale 两个版本。

DeepSeek-R1

DeepSeek-R1 是 DeepSeek 的代表性推理模型,面向数学、代码和复杂推理任务。DeepSeek-R1 与 DeepSeek-R1-Zero 均基于 DeepSeek-V3-Base 训练,并开放了多个蒸馏模型。

DeepSeek-V3

DeepSeek-V3 是 DeepSeek 的代表性通用 MoE 模型,总参数量 671B,每个 token 激活 37B 参数。该模型使用 MLA 与 DeepSeekMoE 架构,并在训练效率和推理成本上强调优化。


DeepSeek 核心功能

聊天问答

DeepSeek 可用于日常问答、知识解释、资料整理、文本生成和多轮对话。

复杂推理

DeepSeek 的 reasoner / thinking 模式面向数学、代码、逻辑推理和复杂问题拆解。

代码能力

DeepSeek 可用于代码生成、代码解释、调试、前端页面生成、函数调用和软件工程辅助。

长上下文

DeepSeek-V4 API 文档显示其上下文长度为 1M,适合长文档、长代码库和多轮复杂上下文任务。

工具调用

DeepSeek API 支持工具调用,可用于构建 Agent、工作流自动化和外部工具集成。

JSON 输出

DeepSeek API 支持 JSON Output,适合结构化信息抽取、数据处理和应用后端集成。

上下文缓存

DeepSeek API 支持 Context Caching,可降低重复前缀请求的输入成本。

OpenAI / Anthropic 兼容 API

DeepSeek API 支持 OpenAI / Anthropic 兼容格式,便于开发者迁移已有应用。


DeepSeek 订阅与价格

DeepSeek Web / App

DeepSeek 官网显示用户可免费访问 DeepSeek,体验智能模型。

DeepSeek API 价格

DeepSeek API 按输入和输出 tokens 计费,价格单位为每 100万 tokens。官方价格页列出旧模型名 deepseek-chatdeepseek-reasoner 的价格;当前变更日志显示这两个旧模型名在过渡期内分别指向 deepseek-v4-flash 的非思考模式与思考模式。

API 模型名上下文长度最大 CoT tokens最大输出 tokens输入价格:缓存命中输入价格:缓存未命中输出价格
deepseek-chat64K8K0.07美元 / 百万 tokens0.27美元 / 百万 tokens1.10美元 / 百万 tokens
deepseek-reasoner64K32K8K0.14美元 / 百万 tokens0.55美元 / 百万 tokens2.19美元 / 百万 tokens

注意:DeepSeek API 变更日志显示,deepseek-chatdeepseek-reasoner 两个旧模型名将在 2026年7月24日停用。当前 DeepSeek API 文档中的新模型为 deepseek-v4-flashdeepseek-v4-pro。实际价格、折扣和过渡期规则应以 DeepSeek API Docs 与平台控制台显示为准。

DeepSeek 使用入口

DeepSeek 官网

入口:https://www.deepseek.com/

DeepSeek Web

入口:https://chat.deepseek.com/

DeepSeek Web 是面向普通用户的在线聊天入口。

DeepSeek API 平台

入口:https://platform.deepseek.com/

DeepSeek API 平台用于管理 API key、调用模型和查看开发者服务。

DeepSeek API 文档

入口:https://api-docs.deepseek.com

DeepSeek API 文档提供模型、价格、调用方式、接口兼容性、工具调用、JSON 输出、缓存和更新日志等信息。

GitHub

入口:https://github.com/deepseek-ai

DeepSeek GitHub 组织提供模型仓库、技术报告、代码和开源项目。

Hugging Face

入口:https://huggingface.co/deepseek-ai

DeepSeek 在 Hugging Face 上发布部分模型权重和模型卡。

参考资料

© 版权声明
THE END
喜欢就支持一下吧
分享