华为开发者空间:基于DeepSeek构建RAG向量数据库
【摘要】 还在苦恼大模型回答问题时不够精准吗?RAG来帮忙!在云主机中部署DeepSeek模型,快速搭建RAG向量数据库,轻松解锁精准回复的新世界!
一、案例介绍
还在苦恼大模型回答问题时不够精准吗?RAG来帮忙!在云主机中部署DeepSeek模型,快速搭建RAG向量数据库,轻松解锁精准回复的新世界!
RAG是检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种结合信息检索和生成式 AI 的技术架构。RAG 通过从外部知识库(如文档、数据库)中检索相关信息,并将其作为上下文输入给 LLM(大型语言模型),从而提高回答的准确性。
当 RAG 结合DeepSeek,能够极大提升检索效率,更精准地筛选出契合需求的信息,获取的回复将更加准确、专业。
二、案例时间
本案例总时长预计60分钟。
三、案例流程
说明:
- 云主机安装Ollama;
- 使用Ollama部署DeepSeek和mxbai-embed-large词向量模型;
- 云主机获取项目代码及调取本地DeepSeek;
- 上传数据集,构建RAG向量数据库。
四、资源总览
本案例预计花费总计0元。
资源名称 |
规格 |
单价(元) |
时长(分钟) |
云主机 |
2vCPUs | 4GB X86 Ubuntu 22.04 Server定制版 |
免费 |
60 |
五、云主机部署DeepSeek
5.1 安装Ollama
Ollama 是一个强大的开源工具,旨在帮助用户轻松地在本地运行、部署和管理大型语言模型(LLMs)。它提供了一个简单的命令行界面,使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构,并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。
在云主机桌面右键选择“Open Terminal Here”,打开命令终端窗口。
执行安装命令如下:
curl -fsSL https://ollama.com/install.sh | sh
5.2 模型部署
接下来可以借助 Ollama 工具来部署 Deepseek 大模型,部署 deepseek-r1:1.5b 版本,执行命令:
ollama run deepseek-r1:1.5b
部署的时间长短依赖于网络的情况,部署完成后,我们就可以与 Deepseek 大模型进行对话了:
在桌面重新打开一个终端将以下命令复制进去,下载mxbai-embed-large 词向量模型。
ollama pull mxbai-embed-large
六、RAG向量数据库创建
6.1 虚拟环境创建
打开云主机桌面CodeArts IDE for Python。
打开后,点击新建工程,输入工程名称:RAG,点击创建。
创建好后,左下角选择管理->设置。
在搜索框中输入:active,找到图中所示,在前方方框中点击勾选。
打开终端,前方出现(venv)字样表示创建成功,如果没有请点击小垃圾桶图标关闭终端重新打开一下。
6.2 RAG向量数据库构建
左下角打开终端输入命令,入完毕后按下回车进行下载。下载完毕后,在左侧目录下出现chatpdf-rag-deepseek-r1文件夹表示下载成功。
git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1
下载完毕后,再次输入以下命令,输入完毕后按下回车,进入该目录下。
cd chatpdf-rag-deepseek-r1
进入到目录后在终端复制以下命令下载相应环境包。
pip install -r requirements.txt
6.3 RAG向量数据库功能实现
下载完毕后,点击后进入chatpdf-rag-deepseek-r1目录,对rag.py文件进行修改。修改rag.py文件的第23行代码,修改后的效果如下:
def __init__(self, llm_model: str = "deepseek-r1:1.5b", embedding_model: str = "mxbai-embed-large"):
修改完毕后,终端输入以下命令运行,首次运行可能会出现输入Email,出现时输入自己常用Email即可,输入完毕后效果如下:
streamlit run app.py
同时浏览器会自动弹出网址界面。
图示英文字符的意思如下:
Upload a Docunment:上传文档;
Settings(Number of Retrieved Results (k)):检索结果数;
Similarity Score Threshold:相似度得分阈值;
Chat History:聊天记录;
Message:提示信息。
注:上传的文档格式需要为PDF格式。
这里我们将提前准备好的数据进行上传。
数据可以前往以下地址自行下载获取,上传的数据中包括AI的基础理论知识以及常用的AI框架的介绍,这里上传数据是为了使大模型能够进行RAG向量数据库的生成,使DeepSeek可以读取到数据库中的内容。
https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0026/%E6%95%B0%E6%8D%AE.pdf
下载完毕后点击图中’Browse files’字样进行数据上传。
点击后选择下载的数据,再点击打开进行数据上传。
上传后等待读取(过程需要一点时间请耐心等待),数据中包含AI方面的基础知识,所以我们进行问题提问,这里提问:机器学习有哪些核心技术?,输入完毕后回车发送消息。
可以看到返回信息,结合我们上传的数据进行检索生成。
至此本地部署DeepSeek构建RAG向量数据库实验案例到此结束。
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
作者其他文章
评论(0)