- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

华为开发者空间：基于DeepSeek构建RAG向量数据库

开发者空间小蜜蜂发表于 2025/03/03 17:21:28 2025/03/03

【摘要】还在苦恼大模型回答问题时不够精准吗？RAG来帮忙！在云主机中部署DeepSeek模型，快速搭建RAG向量数据库，轻松解锁精准回复的新世界！

一、案例介绍

还在苦恼大模型回答问题时不够精准吗？RAG来帮忙！在云主机中部署DeepSeek模型，快速搭建RAG向量数据库，轻松解锁精准回复的新世界！

RAG是检索增强生成（Retrieval-Augmented Generation，简称 RAG）是一种结合信息检索和生成式 AI 的技术架构。RAG 通过从外部知识库（如文档、数据库）中检索相关信息，并将其作为上下文输入给 LLM（大型语言模型），从而提高回答的准确性。

当 RAG 结合DeepSeek，能够极大提升检索效率，更精准地筛选出契合需求的信息，获取的回复将更加准确、专业。

二、案例时间

本案例总时长预计60分钟。

三、案例流程

说明：

云主机安装Ollama；
使用Ollama部署DeepSeek和mxbai-embed-large词向量模型；
云主机获取项目代码及调取本地DeepSeek；
上传数据集，构建RAG向量数据库。

四、资源总览

本案例预计花费总计0元。

资源名称

规格

单价（元）

时长（分钟）

云主机

2vCPUs | 4GB X86

Ubuntu 22.04 Server定制版

免费

五、云主机部署DeepSeek

5.1 安装Ollama

Ollama 是一个强大的开源工具，旨在帮助用户轻松地在本地运行、部署和管理大型语言模型（LLMs）。它提供了一个简单的命令行界面，使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构，并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。

在云主机桌面右键选择“Open Terminal Here”，打开命令终端窗口。

执行安装命令如下：

curl -fsSL https://ollama.com/install.sh | sh

5.2 模型部署

接下来可以借助 Ollama 工具来部署 Deepseek 大模型，部署 deepseek-r1:1.5b 版本，执行命令：

ollama run deepseek-r1:1.5b

部署的时间长短依赖于网络的情况，部署完成后，我们就可以与 Deepseek 大模型进行对话了：

在桌面重新打开一个终端将以下命令复制进去，下载mxbai-embed-large 词向量模型。

ollama pull mxbai-embed-large

六、RAG向量数据库创建

6.1 虚拟环境创建

打开云主机桌面CodeArts IDE for Python。

打开后，点击新建工程，输入工程名称：RAG，点击创建。

创建好后，左下角选择管理->设置。

在搜索框中输入：active，找到图中所示，在前方方框中点击勾选。

打开终端，前方出现（venv）字样表示创建成功，如果没有请点击小垃圾桶图标关闭终端重新打开一下。

6.2 RAG向量数据库构建

左下角打开终端输入命令，入完毕后按下回车进行下载。下载完毕后，在左侧目录下出现chatpdf-rag-deepseek-r1文件夹表示下载成功。

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1

下载完毕后，再次输入以下命令，输入完毕后按下回车，进入该目录下。

cd chatpdf-rag-deepseek-r1

进入到目录后在终端复制以下命令下载相应环境包。

pip install -r requirements.txt

6.3 RAG向量数据库功能实现

下载完毕后，点击后进入chatpdf-rag-deepseek-r1目录，对rag.py文件进行修改。修改rag.py文件的第23行代码，修改后的效果如下：

def __init__(self, llm_model: str = "deepseek-r1:1.5b", embedding_model: str = "mxbai-embed-large"):

修改完毕后，终端输入以下命令运行，首次运行可能会出现输入Email，出现时输入自己常用Email即可，输入完毕后效果如下：

streamlit run app.py

同时浏览器会自动弹出网址界面。

图示英文字符的意思如下：

Upload a Docunment：上传文档；

Settings（Number of Retrieved Results (k)）：检索结果数；

Similarity Score Threshold：相似度得分阈值；

Chat History：聊天记录；

Message：提示信息。

注：上传的文档格式需要为PDF格式。

这里我们将提前准备好的数据进行上传。

数据可以前往以下地址自行下载获取，上传的数据中包括AI的基础理论知识以及常用的AI框架的介绍，这里上传数据是为了使大模型能够进行RAG向量数据库的生成，使DeepSeek可以读取到数据库中的内容。

https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0026/%E6%95%B0%E6%8D%AE.pdf

下载完毕后点击图中’Browse files’字样进行数据上传。

点击后选择下载的数据，再点击打开进行数据上传。

上传后等待读取（过程需要一点时间请耐心等待），数据中包含AI方面的基础知识，所以我们进行问题提问，这里提问：机器学习有哪些核心技术？，输入完毕后回车发送消息。

可以看到返回信息，结合我们上传的数据进行检索生成。

至此本地部署DeepSeek构建RAG向量数据库实验案例到此结束。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入