【RAG】人工智能:检索增强六步学习法

举报
Freedom123 发表于 2024/05/01 19:27:04 2024/05/01
【摘要】 人工智能领域检索增强六步学习法简单介绍

每个人似乎都在担心人工智能会如何夺走我们的工作。但令人惊讶的是,很少有人真正了解在实际环境中使用人工智能模型的基本方面。到目前为止,大多数技术人员都听说过 RAG - Retrieval Augmented Generation。简单来说,RAG 只是一种将文档或某些知识源链接到 AI 模型的方法。如果您正在考处理5 个文档,这听起来很容易。但是,如果让您考虑任何人或公司如何需要对数千、数万或数百万个文件执行此操作,则这是一个不同的问题。这是几乎所有公司都存在的问题。这就是为什么我大力倡导每个人至少对 RAG 是什么有基本的了解,因为它是使用 AI 模型所需的基本知识之一。

与生活中的任何事情一样,如果你认真对待它,这将是成为人工智能专家的起点。即使您对成为 AI 专家不感兴趣,了解 RAG 的所有部分的工作原理也肯定会为您提供良好的服务,因为许多公司将整合这些工作流程。

第一步:Parsing(解析), Text Chunking(文本分块), Indexing(索引)

这里,你需要了解什么怎么对文本进行分块,如何创建您的第一个库并开始执行基本步骤,库中的文档需要解析为统一的格式,并分成更小的文本(分块),然后使用所有元数据进行索引。

第二步:Build Embeddings(构建嵌入)

你需要了解什么是嵌入、嵌入模型、向量和向量数据库?学习嵌入、嵌入模型、向量和向量数据库背后的基本概念。

您需要使用 Hugging Face 中的模型构建您的第一个嵌入,以存储到数据库并使用这些嵌入来运行查询。

第三步:Prompt Models(提示词模型)

了解如何通过加载和提示来自 Hugging Face 和 OpenAI 的模型来提示模型。使用示例开始推理模型,并了解如何使用传递的上下文检查模型是否提供了正确的答案。了解如何捕获模型的使用情况数据,例如令牌使用、输出和总处理时间。

第四步:RAG with text query(通过检索增强查询文本)

我们需要在带有嵌入的库中获取某种形式的知识,并将这些碎片与模型组合在一起。了解如何将正确的 RAG 策略与深思熟虑的检索和查询策略结合使用正确的模型来完成工作。

第五步:RAG with Semantic Query(通过检索增强进行语义查询)

现在,您可以开始语义搜索了。也称为自然语言查询,这是我们获得嵌入和向量数据库的好处的地方。您将能够使用自然语言查询您的知识库,以提出问题,以便从最复杂的法律文件中获得答案。

第六步:RAG with Multi-Step, Hybrid Query(通过检索增强进行多步混合查询)

并学习如何在笔记本电脑上使用 Hugging Face 中的量化 DRAGON-YI-6b-GGUF 模型,执行多步骤混合查询以获得所需的响应。此外,了解如何执行证据验证(防止模型幻觉)以及如何将所有输出保存为 JSON 或 CSV 文件,以供将来的数据集或审核使用。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。