什么是人工智能领域的 SFT - Supervised Finetuning

举报
汪子熙 发表于 2025/10/04 12:43:51 2025/10/04
【摘要】 在人工智能(AI)领域,Supervised Finetuning 是一个重要的概念。它涉及到在预训练模型的基础上,利用有标签的数据进行微调,以适应特定的任务或领域。这个过程可以被视为在更广泛的知识基础上进行特定任务的训练,从而在新任务上获得更好的性能。Supervised Finetuning 这个名词可以被分解为两部分:Supervised 和 Finetuning。首先,Supervi...

在人工智能(AI)领域,Supervised Finetuning 是一个重要的概念。它涉及到在预训练模型的基础上,利用有标签的数据进行微调,以适应特定的任务或领域。这个过程可以被视为在更广泛的知识基础上进行特定任务的训练,从而在新任务上获得更好的性能。

Supervised Finetuning 这个名词可以被分解为两部分:SupervisedFinetuning。首先,Supervised 指的是监督学习,是机器学习的一种类型,其中模型是通过一组有标签的训练数据进行训练的。每个训练样本都有一个对应的标签或结果,模型的任务就是学习从输入数据到这些标签的映射。然后,Finetuning 指的是微调,是指在预训练模型的基础上,进行进一步的训练,以适应特定的任务。

让我们更深入地理解一下这个概念。在深度学习中,有一种常见的做法是首先在大型数据集上预训练一个模型,例如在 ImageNet 上预训练一个卷积神经网络(CNN),或者在大型文本语料库上预训练一个 transformer 模型。这样做的目的是让模型学习到一些通用的、高级的特征或模式,例如在图像中识别边缘或颜色块,在文本中理解语法或句子结构等。

然后,我们会取这个预训练模型,用它作为一个初始模型,然后在特定的任务上进行训练。这个任务有可能是图像分类,也可能是文本情感分析,等等。这个阶段就是 Supervised Finetuning,我们使用有标签的数据集进行训练,模型会学习到如何将学到的通用特征应用到特定的任务上。

例如,我们可能会在 ImageNet 上预训练一个 CNN 模型,这个模型会学习到如何识别边缘、颜色块、纹理等基础特征。然后,我们可能会在一个医学图像数据集上对这个模型进行 Supervised Finetuning,这个数据集包含了一些医学图像(例如 X 光片或 MRI 图像),以及这些图像对应的诊断结果(例如是否有肺炎或者脑瘤)。在这个阶段,模型会学习到如何将前面学到的基础特征应用到医学图像诊断这个特定任务上。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。