DeepSeek与SpringAI集成开发指南
本文深入剖析了在 Spring AI 框架中集成 DeepSeek 大模型的实战路径与关键避坑指南:由于 Spring AI 官方至今未提供任何 DeepSeek 的原生支持(无 starter、无 artifact、无自动配置),所谓“开箱即用”实为误导,所有成功集成均依赖手动实现 ChatModel 接口并基于 WebClient 直接对接 DeepSeek 兼容 OpenAI 格式的 API;文章不仅厘清了常见配置陷阱(如无效的 `spring.ai.providers.deepseek` 前缀)、Bean 注入失败根源和类缺失问题,还给出了精简可靠的自定义 `DeepSeekChatModel` 实现范例、环境变量驱动的 API Key 管理方案、本地部署时的硬件适配策略,并直击生产级难点——quota 安全重试、流式响应 SSE 转换与 token 使用量精准透传,助开发者绕过幻觉文档,落地真正稳定、可控、可运维的 DeepSeek 集成。

Spring AI 官方目前不提供 deepseek-spring-adapter 或 spring-ai-deepseek 这类开箱即用的 starter 模块。所有声称“Spring AI 原生支持 DeepSeek”的教程,实际都依赖手动适配或第三方非官方封装——这点必须先说清,否则后续踩坑全是配置失效、Bean 注入失败、AiClient 调不通。
为什么 Spring AI 的 AiClient 不能直接调用 DeepSeek API
Spring AI 的标准流程是:通过 Provider 抽象层 + ChatModel 实现类完成模型调用。但截至 2026 年 5 月,org.springframework.ai 官方 Maven 仓库中仍无 deepseek 相关 artifact(查证坐标 org.springframework.ai:spring-ai-deepseek 返回 404)。它只原生支持 OpenAI、Azure OpenAI、Ollama、Google Gemini 等少数几家。
这意味着你无法靠加一个 dependency 就自动注册 DeepSeekChatModel Bean;也不能用 @Autowired private ChatModel chatModel; 直接拿到能跑 deepseek-chat-7b 的实例。
常见错误现象:
Caused by: org.springframework.beans.factory.NoSuchBeanDefinitionException: No qualifying bean of type 'org.springframework.ai.chat.ChatModel' available- 配置了
spring.ai.providers.deepseek.api-key,但启动时完全无日志、无报错、也无对应 Bean 初始化 - 强行写
new DeepSeekChatModel(...)却发现类根本不存在(IDE 提示 unresolved reference)
用 RestTemplate 或 WebClient 手动对接 DeepSeek API 是最稳路径
DeepSeek 官方 API(https://api.deepseek.com/v1/chat/completions)完全兼容 OpenAI 格式,这是关键突破口。你可以复用 Spring AI 中已有的 OpenAiChatModel 结构逻辑,但底层换掉 HTTP 客户端目标地址和认证头。
实操建议:
- 不要试图魔改
spring-ai-openai的源码去“硬塞” DeepSeek;它绑定了openai.*配置前缀和特定的 error 解析逻辑,改起来成本高且易崩 - 新建一个
DeepSeekChatModel类,实现ChatModel接口,内部用WebClient发起 POST 请求 - 请求头必须带
Authorization: Bearer ${DEEPSEEK_API_KEY},不是Api-Key也不是其他变体 - 请求体 JSON 结构与 OpenAI 兼容,但
model字段必须填deepseek-chat-7b或deepseek-v3.2-think(注意大小写和连字符) - 响应体中
choices[0].message.content是你要提取的文本,别漏掉[0]下标
示例片段(简化版):
public class DeepSeekChatModel implements ChatModel {
private final WebClient webClient;
private final String apiKey;
private final String model;
<pre class="brush:php;toolbar:false"><code>public DeepSeekChatModel(WebClient.Builder builder, String apiKey, String model) {
this.webClient = builder.baseUrl("https://api.deepseek.com/v1").build();
this.apiKey = apiKey;
this.model = model;
}
@Override
public ChatResponse call(ChatRequest request) {
var body = Map.of(
"model", model,
"messages", request.getMessages().stream()
.map(m -> Map.of("role", m.getRole().toString(), "content", m.getContent()))
.toList()
);
return webClient.post()
.uri("/chat/completions")
.header("Authorization", "Bearer " + apiKey)
.bodyValue(body)
.retrieve()
.bodyToMono(JsonNode.class)
.blockOptional()
.map(this::parseResponse)
.orElseThrow(() -> new RuntimeException("DeepSeek API returned no response"));
}</code>}
application.yml 里哪些配置项真有用,哪些是摆设
Spring Boot 启动时会加载所有 spring.* 开头的配置,但 Spring AI 不识别 deepseek.* 自定义前缀。所以以下写法无效:
deepseek: api-key: sk-xxx endpoint: https://api.deepseek.com/v1
真正该做的只有两件事:
- 把
DEEPSEEK_API_KEY设为环境变量(推荐),或在application.yml顶层写deepseek-api-key: ${DEEPSEEK_API_KEY:default_key} - 在
@Configuration类中用@Value("${deepseek-api-key}")注入,再传给你的DeepSeekChatModel构造器 timeout和retry需自己在WebClient构建时配,例如.codecs(c -> c.defaultCodecs().maxInMemorySize(10 * 1024 * 1024))防大响应体 OOM
别在 spring.ai.providers 下硬凑 deepseek 块——它不会被扫描,也不会触发任何自动配置。
本地部署 deepseek-r1 时,device 和 precision 参数怎么选
如果你走的是本地加载模型路线(比如用 transformers + llama.cpp 封装的 HTTP 服务),那 Spring AI 更是完全不感知。此时你面对的只是一个普通 REST 接口。
关键点在于硬件适配:
- 显卡显存 ≥ 12GB:可设
device="cuda:0"+precision="bf16",吞吐最优 - 显存 6–8GB:必须量化到
q4_k_m或更低,且device="cuda:0"+precision="fp16",否则 OOM - 仅 CPU:用
device="cpu",但deepseek-r17B 推理延迟常超 10s/词,生产慎用 - 无论哪种,都要在启动脚本里显式 export
HF_HOME=/path/to/hf/cache,避免每次拉取模型权重
Spring AI 的 ModelOptions 在这种场景下毫无意义——它只对内置 provider 生效。你得自己控制请求体里的 temperature、max_tokens 字段。
真正的难点从来不在“怎么写通”,而在于“怎么让 retry 不重复扣 quota”、“怎么把 streaming 响应正确转成 SSE 给前端”、“怎么在 ChatResponse 中保留原始 usage 字段供计费”。这些 Spring AI 不管,但业务系统绕不开。
理论要掌握,实操不能落!以上关于《DeepSeek与SpringAI集成开发指南》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
CSS星空流星动画制作教程
- 上一篇
- CSS星空流星动画制作教程
- 下一篇
- 学信网官网入口及登录技巧
-
- 科技周边 · 人工智能 | 18分钟前 | Perplexity
- Perplexity本地服务搜索方法详解
- 184浏览 收藏
-
- 科技周边 · 人工智能 | 24分钟前 | WordEmbedding
- WordEmbedding解决OOV问题的实战方法
- 209浏览 收藏
-
- 科技周边 · 人工智能 | 42分钟前 | QoderWake
- QoderWake适合SaaS企业吗?AI全流程案例解析
- 278浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | DeepSeek
- OpenAI迁移到DeepSeekAPI教程
- 158浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | 夸克AI 夸克AI大模型
- 夸克AI转图成表,发票录入更高效
- 123浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 可灵AI制作纸飞机城市飞行跟拍教程
- 332浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- WorkBuddy部署问题与避坑全攻略
- 197浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | ClawBot
- ClawBot工单自动分派设置教程
- 400浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | CodeBuddy
- CodeBuddy前端生成效果怎么样?
- 345浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | DeepSeek
- DeepSeek与SpringAI集成开发指南
- 464浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- Vidu体育场景动态效果解析
- 392浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 | 纳逗Pro
- AI辅助导演决策,纳逗Pro分镜数据分析
- 290浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 5668次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 6082次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 5912次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 7863次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 6299次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

