【愚公系列】《扣子开发 AI Agent 智能体应用》015-基于大模型的企业知识库(扣子知识库介绍)

💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主
📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node…
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析
🚀前言
通用大模型虽然功能强大,但它可能会产生“幻觉”,其回答问题的准确性无法达到100%。在对模型生成文本的准确性要求较高的应用场景中,例如企业智能客服、高精尖科学技术服务等,往往需要通过知识库来集成私有知识数据,从而丰富大模型的知识范围并提高其回复的准确性。本章将讲解基于大模型的企业知识库的相关知识,并介绍扣子知识库及其在打造汽车行业智能客服方面的实战案例。
🚀一、扣子知识库介绍
🔎1.扣子知识库概述
扣子的知识库功能支持上传和存储外部知识内容,并提供多种检索能力,是实现检索增强生成(RAG) 的核心组件。
核心功能与流程:
- 多源数据导入:支持从本地文档(.txt, .pdf, .doc等)、在线网页、飞书文档等多种渠道上传文本和表格数据。
- 智能内容处理:上传后,系统会将文档自动切分为独立的内容片段进行存储,并支持按标识符、字符长度等方式进行自定义分片。
- 灵活检索召回:提供多种检索策略(如全文关键词检索、向量相似度匹配),从存储的片段中找到与用户查询最相关的内容(即“召回”)。
- 增强模型回复:大模型将召回的相关内容片段作为上下文,生成最终准确、可靠的回答。
知识库类型与适用场景:
扣子知识库主要分为三种类型,适用于不同场景:
| 类型 | 核心特点与适用场景 | 主要数据源与导入方式 | 内容分段与索引 |
|---|---|---|---|
| 文本知识库 | 基于内容片段进行语义检索,适用于知识问答、客服、文档查询等场景。 | 本地文档、在线网页、飞书文档,或手动输入文本。 | 支持自动或手动分段。检索时基于片段整体内容进行匹配。 |
| 表格知识库 | 基于索引列进行精准匹配,适用于查询结构化数据,如产品参数、价格清单、员工信息等。 | 本地CSV/Excel文件、在线API数据、飞书表格,或手动输入。 | 默认按行分片(一行即一个片段)。需设置索引字段,系统将用户问题与索引字段内容进行相似度匹配。 |
| 照片知识库 | 基于图片标注信息进行匹配,适用于图像生成、素材管理等需要根据描述查找图片的场景。 | 本地图片文件(JPG, PNG等)。 | 不涉及文本分段。需为图片设置标注信息,系统将用户问题与标注信息进行相似度匹配以召回图片。 |
权限与限制:
- 权限:知识库暂不支持多人协作编辑。仅创建者本人可编辑、启用或删除自己的知识库。
- 容量限制:
- 单用户最多可创建 1000个 知识库。
- 单个文本知识库最多支持 300个 文件。
- 单个文件大小不超过 100MB;表格文件最多 10列。
- 存储空间:
- 基础版:总容量 1GB。
- 专业版:免费容量 10GB,可额外购买扩容。
🔎2.扣子知识库的使用流程
使用知识库通常遵循以下四个步骤,形成一个闭环:
- 导入企业文档:将所需的企业内部文档、表格等数据通过支持的方式导入,构建知识基础。
- 关联智能体或工作流:将创建好的知识库与智能体直接关联,使其能直接回答用户问题;或在工作流中通过知识库检索节点/写入节点进行集成,实现更复杂的业务流程。
- 配置知识库:关键步骤,通过配置解决 “从哪里查、怎么查、用几条” 的问题。优化检索策略、分段规则和召回数量,是提升回答准确性的核心。
- 优化回复效果:通过持续测试用户提问,观察召回结果和最终回复,不断调整知识库内容、分段方式或检索配置,以优化效果。
🔎3.在智能体中使用知识库
这是最直接的使用方式:
- 在智能体编排页面,找到“知识”功能区域。
- 点击添加按钮,从已创建的知识库中选择需要关联的文本、表格或照片知识库。
- 关联后,智能体在处理用户问题时,会自动从绑定的知识库中检索相关信息,并依据这些信息生成回答。

🔎4.在工作流中使用知识库
在工作流中集成知识库,可以实现更精准、动态的知识管理:
- 知识库检索节点:当工作流执行到需要查询知识的环节时,添加此节点。它可根据上游输入的查询内容,从指定知识库中召回相关信息,并将结果列表输出给后续节点(如大模型节点)使用。
- 知识库写入节点:当工作流需要动态更新或扩充知识库时,添加此节点。它可以根据业务逻辑,将处理后的新文档或数据上传到指定的知识库中,实现知识的积累与更新。

- 点赞
- 收藏
- 关注作者

评论(0)