当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 自研大模型教程，开发者必看指南

自研大模型教程，开发者必看指南

2025-08-11 15:54:32 0浏览收藏

想快速上手开源大模型？这份**自研大模型教程**是你的必备指南！Datawhale倾力打造的**self-llm（开源大模型食用指南）**，专为中国开发者设计，提供从Linux环境配置到模型部署、微调的全面指导。教程覆盖LLaMA、ChatGLM等主流模型，简化使用流程，让学生和研究者轻松入门。更有LoRA、ptuning等高效微调方法和实际应用案例，满足不同层次学习需求。无论你是想开发智能应用，还是进行学术研究，self-llm都能助你一臂之力。欢迎参与社区共建，共同推动开源大模型的普及与应用！项目地址：[http://github.com/datawhalechina/self-llm](http://github.com/datawhalechina/self-llm)。

self-llm是什么

self-llm （开源大模型食用指南）是Datawhale专为国内初学者打造的开源大模型教程，基于Linux平台，提供从环境配置到模型部署、微调的全流程指导，涵盖LLaMA、ChatGLM等主流模型。项目能简化开源大模型的使用流程，帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法（如LoRA、ptuning）及应用案例，适合不同层次的学习者。项目鼓励社区参与，共同完善内容，推动开源大模型的普及和应用。

self-llm的主要功能

环境配置指导：提供基于Linux平台的开源大模型环境配置指南，帮助用户搭建适合不同模型运行的基础环境。
模型部署教程：涵盖国内外主流开源大模型（如LLaMA、ChatGLM、InternLM等）的本地部署方法，包括命令行调用、在线Demo部署等。
微调方法指导：提供全量微调、LoRA微调、ptuning等高效微调方法的详细教程，帮助用户根据需求对模型进行定制化优化。
应用开发指导：结合LangChain等框架，指导用户如何将开源大模型集成到实际应用中，打造领域特色的私域模型。
社区共创与支持：鼓励用户提交问题（issue）或贡献代码（PR），共同完善教程内容，形成开源社区的协作与支持体系。

self-llm支持的模型

GLM-4.1-Thinking
- GLM-4.1V-Thinking vLLM 部署调用
- GLM-4.1V-Thinking Gradio 部署
- GLM-4.1V-Thinking LoRA 微调及 SwanLab 可视化记录
- GLM-4.1V-Thinking Docker 镜像
GLM-4.5-Air
- GLM-4.5-Air vLLM 部署调用
- GLM-4.5-Air EvalScope 智商情商评测
- GLM-4.5-Air LoRA 微调
- GLM-4.5-Air Ucloud Docker 镜像
ERNIE-4.5
- ERNIE-4.5-0.3B-PT LoRA 微调及 SwanLab 可视化记录
- ERNIE-4.5-0.3B-PT LoRA Docker 镜像
Hunyuan-A13B-Instruct
- Hunyuan-A13B-Instruct 模型架构解析
- Hunyuan-A13B-Instruct SGLang 部署调用
- Hunyuan-A13B-Instruct LoRA SwanLab 可视化微调
- Hunyuan-A13B-Instruct LoRA Docker 镜像
Qwen3
- Qwen3 模型结构解析
- Qwen3-8B vllm 部署调用
- Qwen3-8B Windows LMStudio 部署调用
- Qwen3-8B Evalscope 智商情商评测
- Qwen3-8B LoRA 微调及 SwanLab 可视化记录
- Qwen3-30B-A3B 微调及 SwanLab 可视化记录
- Qwen3 Think 解密
- Qwen3-8B Docker 镜像
- Qwen3-0.6B 的小模型用途
- Qwen3-1.7B 医学推理式对话微调及 SwanLab 可视化记录
- Qwen3-8B GRPO 微调及 SwanLab 可视化
Kimi-VL-A3B
- Kimi-VL-A3B 技术报告解读
- Kimi-VL-A3B-Thinking WebDemo 部署（网页对话助手）
Llama4
- Llama4 对话助手
- SpatialLM
- SpatialLM 3D点云理解与目标检测模型部署
- Hunyuan3D-2
- Hunyuan3D-2 系列模型部署
- Hunyuan3D-2 系列模型代码调用
- Hunyuan3D-2 系列模型 Gradio 部署
- Hunyuan3D-2 系列模型 API Server
- Hunyuan3D-2 Docker 镜像
Gemma3
- Gemma-3-4b-it FastApi 部署调用
- Gemma-3-4b-it ollama + open-webui 部署
- Gemma-3-4b-it Evalscope 智商情商评测
- Gemma-3-4b-it LoRA 微调
- Gemma-3-4b-it Docker 镜像
- Gemma-3-4b-it GRPO 微调及 SwanLab 可视化
DeepSeek-R1-Distill
- DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
- DeepSeek-R1-Distill-Qwen-7B Langchain 接入
- DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
- DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
- DeepSeek-R1-0528-Qwen3-8B-GRPO 及 SwanLab 可视化
MiniCPM-o-2_6
- MiniCPM-o-2.6 FastApi 部署调用
- MiniCPM-o-2.6 WebDemo 部署
- MiniCPM-o-2.6 多模态语音能力
- MiniCPM-o-2.6 可视化 LaTeX_OCR LoRA 微调
InternLM3
- InternLM3-8b-instruct FastApi 部署调用
- InternLM3-8b-instruct Langchain 接入
- InternLM3-8b-instruct WebDemo 部署
- InternLM3-8b-instruct LoRA 微调
- InternLM3-8b-instruct o1-like 推理链实现
phi4
- phi4 FastApi 部署调用
- phi4 Langchain 接入
- phi4 WebDemo 部署
- phi4 LoRA 微调
- phi4 LoRA 微调 NER任务 SwanLab 可视化记录版
- phi4 GRPO 微调及 SwanLab 可视化
Qwen2.5-Coder
- Qwen2.5-Coder-7B-Instruct FastApi 部署调用
- Qwen2.5-Coder-7B-Instruct Langchain 接入
- Qwen2.5-Coder-7B-Instruct WebDemo 部署
- Qwen2.5-Coder-7B-Instruct vLLM 部署
- Qwen2.5-Coder-7B-Instruct LoRA 微调
- Qwen2.5-Coder-7B-Instruct LoRA 微调 SwanLab 可视化记录版
Qwen2-vl
- Qwen2-vl-2B FastApi 部署调用
- Qwen2-vl-2B WebDemo 部署
- Qwen2-vl-2B vLLM 部署
- Qwen2-vl-2B LoRA 微调
- Qwen2-vl-2B LoRA 微调 SwanLab 可视化记录版
- Qwen2-vl-2B LoRA 微调案例 – LaTeXOCR
Qwen2.5
- Qwen2.5-7B-Instruct FastApi 部署调用
- Qwen2.5-7B-Instruct Langchain 接入
- Qwen2.5-7B-Instruct vLLM 部署调用
- Qwen2.5-7B-Instruct WebDemo 部署
- Qwen2.5-7B-Instruct LoRA 微调
- Qwen2.5-7B-Instruct o1-like 推理链实现
- Qwen2.5-7B-Instruct LoRA 微调 SwanLab 可视化记录版
Apple OpenELM
- OpenELM-3B-Instruct FastApi 部署调用
- OpenELM-3B-Instruct LoRA 微调
Llama3_1-8B-Instruct
- Llama3_1-8B-Instruct FastApi 部署调用
- Llama3_1-8B-Instruct Langchain 接入
- Llama3_1-8B-Instruct WebDemo 部署
- Llama3_1-8B-Instruct LoRA 微调
- 动手转换 GGUF 模型并使用 Ollama 本地部署
Gemma-2-9b-it
- Gemma-2-9b-it FastApi 部署调用
- Gemma-2-9b-it Langchain 接入
- Gemma-2-9b-it WebDemo 部署
- Gemma-2-9b-it Peft LoRA 微调
Yuan2.0
- Yuan2.0-2B FastApi 部署调用
- Yuan2.0-2B Langchain 接入
- Yuan2.0-2B WebDemo 部署
- Yuan2.0-2B vLLM 部署调用
- Yuan2.0-2B LoRA 微调
Yuan2.0-M32
- Yuan2.0-M32 FastApi 部署调用
- Yuan2.0-M32 Langchain 接入
- Yuan2.0-M32 WebDemo 部署
DeepSeek-Coder-V2
- DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用
- DeepSeek-Coder-V2-L