- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

15天学会AI应用开发（七）有了大模型为什么还要引入RAG

aqi00 发表于 2026/06/20 11:24:44 2026/06/20

【摘要】前面的文章依次介绍了如何截断历史会话的对话记录，包括按照记录数量截断、按照Token长度截断，以及浓缩为摘要截断等等，其中摘要操作又分为三大类：1、使用第三方的摘要库对文本摘要；2、使用在线大模型对文本摘要；3、使用离线大模型对文本摘要；以上对会话记录的各种处理操作，统称为AI应用的上下文管理，即让AI理解用户之前的意图。接下来将开启有关RAG部分的AI应用开发教程介绍。一、什么是RAGR...

前面的文章依次介绍了如何截断历史会话的对话记录，包括按照记录数量截断、按照Token长度截断，以及浓缩为摘要截断等等，其中摘要操作又分为三大类：

1、使用第三方的摘要库对文本摘要；
2、使用在线大模型对文本摘要；
3、使用离线大模型对文本摘要；

以上对会话记录的各种处理操作，统称为AI应用的上下文管理，即让AI理解用户之前的意图。接下来将开启有关RAG部分的AI应用开发教程介绍。

一、什么是RAG

RAG的全称是Retrieval-augmented Generation，意思是检索增强生成，它是一种结合检索和生成技术的模型。RAG通过引用外部知识库的信息来生成回答，具有较强的可解释性和定制能力，常用于客服系统、智能助手等问答任务。

虽然大模型很智能了，但它有两个短板：

1、知识有截止日期，不懂新知识
因为大模型训练到某一天就停止学习，比如模型训练数据截止到2025年，那么2026年之后发生的事情就不懂了。并且用户的个人文档、公司文档等内部资料，大模型也都不知道。

2、会幻觉、爱胡说八道
大模型是靠概率猜下一个字，不是真的 “懂知识”。没人约束它时，容易编事实、编人名、编数据、编政策，一本正经地胡说八道。

而RAG会分析并消化用户提供的文档资料，从中构建专属的知识库，再把这些资料喂给大模型，使得大模型能够照着资料回答问题。
简而言之，大模型是聪明但记性差、爱吹牛的人，而RAG是翻课本、翻知识库、查笔记的人。

二、如何使用RAG

RAG的使用流程包含下列五个步骤：

1、加载文档资料
读取 TXT、PDF、Word、HTML等格式的资料文件。

2、对文本分块
读出来的资料信息为长文本，需要切成一小段一小段，比如每段300字，防止太长浪费Token、太短又缺乏上下文。

3、向量化文本
接着把每段文字变成数字向量，计算机才能理解语义相似度。

4、存入向量数据库
把数字化后的向量和原始文本保存起来，比如保存到Chroma、FAISS、Milvus。

5、在用户提问时，检索向量数据库，并把结果反馈给大模型
用户输入的问题也要转成数字向量，并从向量数据库找出最相似的几段原文，再把问题与检索到的原文一起发给大模型，好让大模型基于给到的资料来回答，而非自己胡编乱造。

三、一个简单的仿RAG程序

完整的RAG会用到多个Python库，这里为了方便理解，先用一个简单的模拟程序来演示RAG的操作过程。
无需安装任何第三方库，仅仅根据基本的字符串查找来模拟RAG，下面是具体的Python测试代码：

# 本地知识库
knowledge_base = [
    "人工智能（AI）是一门使机器模拟人类智能的技术。",
    "RAG代表检索增强生成，它通过检索外部知识来提升大模型回答准确性。",
    "本地RAG不需要调用云端API，所有计算在本机完成，不消耗Token。",
    "FAISS是Facebook开源的向量检索库，适合做本地向量库。"
]

# 简单文本匹配检索（纯Python，无任何依赖）
def search(query):
    results = []
    for text in knowledge_base:
        if any(word in text for word in query.replace("？", "").split()):
            results.append(text)
    return results if results else ["未找到相关知识"]

# RAG 主函数
def rag(query):
    print("\n===== 本地 RAG 回答 =====")
    print("问题：", query)
    print("\n答案：")
    for res in search(query):
        print("-", res)
    print("="*40)

# 运行
if __name__ == "__main__":
    while True:
        q = input("\n请输入问题（输入 q 退出）：")
        if q.lower() == "q":
            print("退出程序")
            break
        rag(q)

阅读以上代码，发现它根据知识库是否包含指定字符串来回答问题。
运行上面的Python代码，根据提示输入问题“人工智能”，输出日志结果如下：

请输入问题（输入 q 退出）：人工智能

===== 本地 RAG 回答 =====
问题： 人工智能

答案：
- 人工智能（AI）是一门使机器模拟人类智能的技术。

可见该代码按照字符串匹配的方式，一旦在某条知识中找到指定字符串，就返回这条知识。

本系列的AI应用开发文章目录为《15天学会AI应用开发全目录（零基础小白，零Token消耗）》。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

15天学会AI应用开发（七）有了大模型为什么还要引入RAG

一、什么是RAG

二、如何使用RAG

三、一个简单的仿RAG程序

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品