AI学习笔记:核心概念术语学习

举报
乐乐爱吃鸡蛋 发表于 2025/09/09 16:45:54 2025/09/09
【摘要】 #学习笔记# 总是遇到一些名词不太懂,索性就收集下,记录起来,以备不时之需。

一、核心基础概念

  1. 人工智能 (Artificial Intelligence, AI)

    • 定义:一个广泛的领域,致力于创造能够执行通常需要人类智能的任务的机器或系统。

    • 类比:目标是制造出能“思考”的机器。

  2. 机器学习 (Machine Learning, ML)

    • 定义:AI的一个子集,它允许计算机系统从数据中“学习”和改进,而无需显式编程。模型通过识别模式来做出预测或决策。

    • 类比:不是教计算机如何下棋,而是给它几万盘棋局数据,让它自己学会下棋的规则和策略。

  3. 深度学习 (Deep Learning, DL)

    • 定义:机器学习的一个更具体的子集,使用名为“神经网络”的复杂结构来处理数据。它特别擅长处理图像、声音和文本等非结构化数据。

    • 类比:使用一个模拟人脑的、由多层“神经元”组成的复杂网络来学习,层次越深,能学到的特征就越抽象。

  4. 神经网络 (Neural Network)

    • 定义:一种受人类大脑结构启发的计算模型,由相互连接的节点(“神经元”)组成,用于处理和传输信息。

  5. 大语言模型 (Large Language Model, LLM)

    • 定义:基于深度学习(特别是Transformer架构)的海量参数模型,在极其庞大的文本数据集上训练而成。它可以理解、生成和处理自然语言。

    • 例子:OpenAI的GPT系列、Anthropic的Claude、Meta的Llama。

二、与LLM工作原理相关的术语

  1. 训练 (Training)

    • 定义:让模型学习的过程。通过给模型输入大量数据并调整其内部参数,使其能够做出准确的预测或生成合理的文本。

  2. 微调 (Fine-Tuning)

    • 定义:在一个已经预训练好的模型(如GPT-4)基础上,使用特定领域的数据集进行额外训练,使其更擅长某个特定任务(如写法律文书、医疗诊断)。

    • 类比:一个医科毕业生(预训练模型)到医院某个科室(特定领域)进行专科培训(微调)。

  3. 提示/提示词 (Prompt)

    • 定义:用户输入给AI的指令或问题,用于引导AI产生相应的回复。

    • 例子:“用莎士比亚的风格写一首关于咖啡的诗”就是一个提示。

  4. 提示工程 (Prompt Engineering)

    • 定义:设计和优化提示词的技巧和艺术,旨在从AI中获得更准确、更相关、更高质量的输出。

  5. 生成 (Generation)

    • 定义:AI根据提示词创建新内容(文本、代码、图像等)的过程。

  6. 令牌 (Token)

    • 定义:模型处理文本的基本单位。对于英文,一个token可以是一个单词或一个词缀(如“un”, “-ing”);对于中文,一个token通常是一个汉字或词语的一部分。

    • 重要性API计费通常基于使用的token数量

  7. 上下文窗口 (Context Window)

    • 定义:模型在一次交互中能够考虑和记住的令牌总数上限。这包括你的提示词和它的回复。

    • 例子:一个上下文窗口为128K的模型,可以处理一部中篇小说的文本量。

三、应用与架构相关术语

  1. Transformer架构

    • 定义:一种革命性的深度学习模型架构,由Google在2017年提出。它通过“自注意力机制”(Self-Attention)来处理序列数据,是当今几乎所有主流LLM(如GPT、BERT)的基础。

  2. 检索增强生成 (Retrieval-Augmented Generation, RAG)

    • 定义:一种将外部知识库(如公司文档、数据库)的检索功能与LLM的生成能力相结合的技术。它先检索相关信息,再让LLM基于这些信息生成答案,能极大提高回答的准确性和时效性,减少“幻觉”。

    • 应用:Coze平台中的“知识库”功能就是RAG的典型应用。

  3. AI智能体 (AI Agent)

    • 定义:一个能够感知环境、做出决策并执行动作以实现目标的AI系统。它不仅会生成文本,还会使用工具(如调用API、搜索网络、运行代码)。

    • 类比:一个不仅能给你建议(LLM),还能亲自帮你订机票、写邮件并发送(Agent)的AI助手。

  4. 幻觉 (Hallucination)

    • 定义:AI生成的内容看似合理,但实际上是错误的、虚构的或与事实不符的现象。这是当前LLM面临的主要挑战之一。

  5. 具身智能 (Embodied AI)

    • 定义:存在于物理实体(如机器人、自动驾驶汽车)中的AI,能够通过与真实世界的交互来学习和执行任务。

四、性能与评估术语

  1. 参数 (Parameters)

    • 定义:模型内部的可调节变量,其值是在训练过程中从数据中学到的。通常参数数量越多,模型越复杂,能力可能越强(但并非绝对)。

    • 例子:GPT-3有1750亿个参数。

  2. 涌现能力 (Emergent Abilities)

    • 定义:当模型规模(参数、数据、计算量)达到一定阈值时,突然出现的一些在较小模型中不存在的新能力(如推理、编程、理解复杂指令)。

五、核心集成与交互术语

  1. API (Application Programming Interface) - 应用程序编程接口

    • 通俗解释一套预先定义好的规则和协议,允许不同的软件应用程序之间相互“对话”和交换数据。它是一个软件为另一个软件提供的“服务窗口”。

    • 经典类比餐厅的服务员

      • 你(客户端)看不懂后厨(服务器)的规则,你只需要看菜单(API文档)并告诉服务员(API)你想点什么菜(请求)。

      • 服务员把你的请求传递给后厨,后厨做好菜后,再由服务员端给你(响应)。

      • 你不需要知道后厨如何运作,只需要通过服务员这个接口就能获得服务。

  2. SDK (Software Development Kit) - 软件开发工具包

    • 通俗解释一套工具的集合,通常包括代码库、文档、示例代码和调试工具,旨在帮助开发者更轻松、更快速地为特定平台、硬件或编程语言构建应用程序。

    • 类比一个乐高套装

      • API就像是乐高积木的通用接口(凸起和凹槽),保证积木能拼在一起。

      • SDK则是一个特定的乐高“星球大战战舰套装”,它包含了所有你需要的特定积木(代码库)、拼装说明书(文档)和贴纸(工具),让你能高效地拼出这艘战舰,而不需要从零开始自己设计并寻找所有零件。

  3. Endpoint - 端点

    • 通俗解释API 的一个特定地址(URL),用于接收请求并返回响应。一个API通常有多个端点,每个端点负责一个具体的功能。

    • 例子:一个天气API可能有以下两个端点:

      • https://api.weather.com/v1/current (获取当前天气)

      • https://api.weather.com/v1/forecast (获取天气预报)

  4. Webhook - 网络钩子

    • 通俗解释:一种“反向API”模式。由你提供一个API端点(URL)给另一个服务,当该服务发生某件事时,它会主动向你提供的这个网址发送数据。这是一种接收实时通知的方式。

    • 类比“有事call我”

      • 传统的API:你不停地打电话(发送请求)问快递公司:“我的包裹到了吗?”(轮询)。

      • Webhook:你告诉快递公司:“这是我的电话(URL),包裹一到你就立刻打给我(发送请求)”。这样你就不用主动去问,节省了精力。

六、数据格式术语

  1. JSON (JavaScript Object Notation) - JS 对象简谱

    • 通俗解释:一种轻量级、易于人阅读和编写的数据交换格式。它采用“键值对”的方式来组织数据,是当今Web和API之间传输数据最流行的语言。

    • 例子

      json
      {
        "name": "张三",
        "age": 30,
        "isStudent": false,
        "hobbies": ["读书", "游泳", "编程"]
      }
  2. XML (eXtensible Markup Language) - 可扩展标记语言

    • 通俗解释:另一种用于存储和传输数据的标记语言,比JSON更冗长,但结构更严格。现在很多新API更倾向于使用JSON,但一些老系统仍在使用XML。

    • 例子

      xml
      <person>
        <name>张三</name>
        <age>30</age>
        <isStudent>false</isStudent>
      </person>

七、系统架构术语

  1. Frontend - 前端

    • 通俗解释:用户能看到并直接与之交互的部分,比如网页、App界面、按钮、图片等。主要负责展示和收集用户输入。

  2. Backend - 后端

    • 通俗解释:运行在服务器上的部分,用户看不见。它负责处理前端的请求、执行逻辑(比如调用AI模型)、与数据库交互,然后将结果返回给前端。

    • Coze平台:你创建的机器人,其逻辑(工作流、插件调用)就是在后端运行的。

  3. Database - 数据库

    • 通俗解释:一个有组织地存储和管理数据的“电子仓库”。可以高效地查询、插入、更新和删除数据。

八、请求与响应术语

  1. HTTP (HyperText Transfer Protocol) - 超文本传输协议

    • 通俗解释万维网的数据通信基础,定义了客户端和服务器之间如何交换请求和响应。

  2. HTTP Method - HTTP 方法

    • 通俗解释:表示请求的目的。最常用的有:

      • GET获取数据(如:查看网页)。

      • POST创建/提交数据(如:提交表单、登录、发送一个提示词给AI)。

      • PUT/PATCH更新数据。

      • DELETE删除数据。

  3. Status Code - 状态码

    • 通俗解释:HTTP响应中的一个三位数字代码,用来告诉客户端请求的结果。

    • 常见例子

      • 200 OK成功

      • 404 Not Found找不到请求的资源

      • 500 Internal Server Error服务器内部错误

  4. Authentication / Auth - 认证

    • 通俗解释“证明你是谁”的过程,最常见的方式是使用用户名密码或API Key。

  5. Authorization - 授权

    • 通俗解释“你是否有权限做某事”的过程。比如,你成功登录了(认证),但你可能只有权限看自己的数据,而不能看别人的数据(授权)。

  6. API Key (API密钥)

    • 通俗解释:一个像密码一样的唯一字符串,用于识别和验证调用API的应用程序或用户。调用API时通常需要在请求头中带上它。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。