华为大咖说 对大模型“热”的“冷”思考——当前大模型应用的四大误区

举报
华为云PaaS服务小智 发表于 2024/10/12 09:12:36 2024/10/12
【摘要】 本文分享自时习知(时习知,你的数字化学堂——时习知是华为旗下一款面向企业学习、培训、知识管理全场景的学习平台,秉承华为数字化转型优秀实践,致力于帮助每个组织迅速开办安全可靠的数字学堂。)作者:黄一凡(华为AI算法工程师)全文约1742字,阅读约需7分钟从去年3月chatGPT4.0发布以来,大模型引爆全球,各个领域也都摩拳擦掌,对大模型的应用充满着期待,感觉大模型无所不能,无所不知。但是大模...

本文分享自时习知时习知,你的数字化学堂——时习知是华为旗下一款面向企业学习、培训、知识管理全场景的学习平台,秉承华为数字化转型优秀实践,致力于帮助每个组织迅速开办安全可靠的数字学堂。

作者:黄一凡(华为AI算法工程师)全文约1742字,阅读约需7分钟


从去年3chatGPT4.0发布以来,大模型引爆全球,各个领域也都摩拳擦掌,对大模型的应用充满着期待,感觉大模型无所不能,无所不知。但是大模型的兴起犹如股市的泡沫,通过一年多的摸索逐步发现,真正可以让大模型发挥价值、带来收益的场景还需要进一步挖掘,这场大模型的技术竞争其实是企业场景应用的竞争。

大模型时代下存在很多误区,投入大量人力财力,但是价值度难衡量,运营难持续等问题不断涌现,换句话说“投资大模型有成本,应用需谨慎”。笔者总结了当前大模型应用的四个误区,分享出来与大家共鉴之。

 

 

误区一 不要盲目跟风,要精准投资

 

大模型时代下,让人最先想到的场景就是知识问答。很多领域的知识问答平台并没有真正解决用户问题。在用户需要提供快速且准确的答案时,问答系统并不能给到用户想要的知识。

为什么会这样?因为缺乏对业务价值的深入理解与思考。比如在最开始的场景识别环节,并没有深入考虑问答平台的收益是什么,解决什么场景的什么问题,以及目前的技术是否可以达到用户预期。对企业而已,他们的场景是需要严谨的答案,而大模型的幻觉无法让答案100%正确。

因此在做大模型应用的时候,切勿盲目跟风,应做好场景价值估算和预期目标管理,进行精准投资。以问答场景的价值衡量为例,可以用人员/业务规模*知识问答评测*知识价值转化率(如每次节约的时间成本,转化为客户的满意度,销售收入增加等)来度量。

 

误区二 不要贪大求全,要循序渐进

 

据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为140万美元,对于一些更大的 LLM大型语言模型),训练成本介于200万美元至1200万美元之间。以 ChatGPT 1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达 A100 GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。

而巨大“算力、人力、数据”资源成本构建的领域模型,他给业务带来的价值到底是多少?需要业务自己算账。

做大模型应用需要避免大炮射蚊子,而应该循序渐进,比如先用初阶方案一个prompt(prompt:提示工程,提示工程是在大模型中引导模型输出符合预期结果的关键技能)解决,再尝试RAGRAG:一般指检索增强生成,是当下热门的大模型前沿技术之一),然后中阶方案模型微调最后再考虑基于数据量、价值收益比的基础上尝试全参微调或二次预训练;模型也是从小到大考虑进行选用

关于要如何将大模型强大的能力落地应用,并从中实现商业闭环,创业者们仍在探索。

 

误区三 不要一建了之,要立足长远

 

有人说AI大模型存在一种只管“生孩子,不管养孩子”的现象,其实有的时候真的不是不想养,而是“培养个孩子“成本太高了。以大模型问答场景为例,要持续保持问答的准确性,需要两个循环(知识循环和模型循环),三个配套(一个运营平台,一套运营机制,一个运营组织),这就意味着业务需要有流程、有平台、有专人看护知识内容更新,不断标注badcase,不断迭代模型等。

当一个项目的收益已经全部被收割转运营时,组织是否愿意再耗费人力财力做这个运营,其实就指向第一个误区很重要,这个项目到底有没有产生价值影响到业务作业,相信当大模型带来的变化影响到“业务作业”且和业务的目标相一致时,业务是愿意运营的,就像孩子是父母的唯一,父母愿意倾尽全力培养他,但是企业中老板是挑选为公司带来巨大价值的员工进行培养。

在做大模型应用时一定要和业务流程相结合,嵌入到作业系统当中,实现作业即标注,减少业务主动运营成本投入,但不影响模型迭代效果增强。

 

误区四 不要一哄而上,要集中作战

 

中国改革开放总设计师邓小平说过“允许一部分地区、一部分人先富起来,先富带后富,后富赶先富,最终达到共同富裕”。现在各个领域都在如火如荼的开展AI辅助变革项目,部分领域确实处于领先状态,平台也需要跟紧大家的部分把先行者的经验和方法不断的沉淀,让后来者可以少些试错,高效尝到大模型的甜头。 

有的公司做大模型的部门很多,建设大模型平台能力的业务也很多,重复的高代码开发对公司来说是资源的浪费,分享与共建才能使公司利益最大化,而不是个体利益一枝独秀。毕竟“一个人可以走很快,一群人可以走很远”,大家都希望和公司共同发展进步。

总之,大模型时代下的动工更需要谨慎,遵从“三层五阶八步”,通过“场景+流程+组织+数据+IT”的变化,实现应用落地,拥抱AI变革。


编者提示:关于“三层五阶八步”,我们之前在推文《华为大咖说 | 企业应用AI大模型的“道、法、术” -- 法:落地篇》中有详细介绍,感兴趣的小伙伴可以去进一步了解哦~

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。