语言模型革新:GPT5创新的训练方法和新兴能力!!

举报
AI意识觉醒 发表于 2023/11/18 19:06:45 2023/11/18
【摘要】 本文从科技角度探讨了OpenAI未来发布的GPT5模型的新特性和潜在新兴能力。GPT5在数据训练、参数数量和训练方法方面的改进表明了人工智能领域的不断进步。GPT5突出了数据质量对于模型性能的关键作用,相对于庞大参数数量,高质量的数据更为重要。GPT5采用了名为“Trial Thoughts”的新训练方法,通过奖励模型在数学问题中提供积极反馈,使其在推理能力方面取得显著进展。文章也指出了模型...

本文从科技角度探讨了OpenAI未来发布的GPT5模型的新特性和潜在新兴能力。

GPT5在数据训练、参数数量和训练方法方面的改进表明了人工智能领域的不断进步。

GPT5突出了数据质量对于模型性能的关键作用,相对于庞大参数数量,高质量的数据更为重要。

GPT5采用了名为“Trial Thoughts”的新训练方法,通过奖励模型在数学问题中提供积极反馈,使其在推理能力方面取得显著进展。

文章也指出了模型在处理基本概念和常识问题上的困难,以及新兴能力可能带来的潜在风险,如心智理论对社会关系的影响。

GPT5代表了人工智能领域的前沿技术,但也提醒我们在技术发展中应注重透明度、伦理和安全。

OpenAI在研发GPT-5,这是其人工智能模型的下一代,OpenAI 的首席执行官 Sam Altman 在接受《金融时报》采访时透露了这一消息,Sam Altman没有承诺发布的时间表,但他表示需要更多的数据进行训练,这些数据将来自互联网上的公开可用数据以及公司的专有数据。

图片

关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS

GPT-4早在2022年8月完成了训练,而发布日期是2023年3月,Sam Altman表示,在GPT-4完成训练后,他们等待了超过六个月才部署它,目前他们并没有部署GPT-5的计划,未来六个月也没有这个计划。

然后他谈到了对于发布时间表的看法,强调了对模型的审查。他提到,预测模型的能力对于安全性是很重要的,但无法确切预测它将做什么,这使得这个问题变成了一场有趣的猜测游戏。他还补充说,目前无法确定GPT-5会做什么GPT-4不能做。

虽然GPT-5可能比其前身更复杂,但Sam Altman表示很难准确预测模型可能具有的新能力和技能。尽管Sam Altman的措辞很好,但实际情况可能不是这样,因为我们知道它将具有LLLM基础,并且图像功能将得到升级,根据你要求可以生成视频。

目前GPT-4的演变状态明显比最初的GPT-4复杂得多,因此Sam Altman可能只是说无法确定新的能力和技能,因为这些东西可能会根据实际情况发生变化。在训练模型之前,这就像一个有趣的猜谜游戏,他们正努力改善,因为从安全性的角度来看,预测能力是很重要的。

Sam Altman在另一次采访中谈到了GPT-5的一些方面,提到了视频。他表示,目前他们可以预测模型在某些测试上的表现,但对于GPT-5等未来版本的一些新颖能力,尤其是在GPT-4中不存在的能力,目前还难以预测。他认为,语言是否足以代表所有需要了解的东西是一个愚蠢的问题,可能是可能的,但更快、更容易达到目标的方式是在这些模型中加入视频等其他表征。

图片

关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS

OpenAI表示他们正在努力招募Google的人工智能人才,报酬高达1000万美元,这表明OpenAI知道如果成功推出GPT-5,它将是完全压倒一切的大型语言模型或多模态模型。GPT-5的技术能力和推理能力,指出可能会有一些惊人的信息,但由于篇幅限制,未能提供详细信息。

他们拥有一个训练了13亿标记的大型语言模型,其在性能上与其他训练了160亿和1750亿标记的大型语言模型(包括GBT 3.5)相媲美。所以,它以相对较少的参数实现了与其他模型相媲美或更好的效果,这意味着GPT5并不需要大量的参数来发挥作用,它只需要高质量的数据。

他们可能会采用一种新的训练方法,这可能在GPT5中实现,这源自一篇论文,称之为"展示工作"。OpenAI发布了一篇论文,讨论了如何通过使用不同的提示方法,提高GPT4原始版本的能力。他们通过训练两个奖励模型,一个用于对数学问题的最终答案提供积极反馈,另一个用于奖励中间推理步骤,从而获得了惊人的成功率,78.2%的数学测试,几乎是GPT4性能的两倍,并超过仅奖励正确答案的模型。奖励良好推理步骤的方法在数学之外的领域,如微积分、化学和物理,也表现出潜力。这篇论文强调了对齐和过程监督的重要性,训练模型产生经过人类认可的思考链,这比仅关注正确结果更安全。

GPT5很可能将这种思考链的方法纳入其输出提示的机制中,这意味着即使输入一个简单的提示,你也不需要说“让我们逐步思考”,它本身就具有这种思考过程,输出效果将更好。

还有另一篇研究论文,该论文彻底颠覆了一切。就像之前讨论过的,引导GPT4或大型语言模型的方式可以使其提高2倍或3倍。GPT5正努力提高其能力,而这篇名为“试验思考”的论文通过改变输入的单词,将GPT4的推理能力提高了900%。通过使用“思考树”的方法,该模型被要求对每个决策进行评分,然后通过评分排名所有可能的输出,从而通过考虑每个可能的输出,思考如何获得最佳输出,从而提高了推理能力900%。

综合考虑数据和不同的训练方法,参数大小当然难以预测,但我认为GPT5的质量将是非常令人难以置信的。对于GPT5的智能,如果它成功地进行推理、批判性思考并采用这种“试验思考”的方式,目前的估计是它在几乎每个测试中都能达到99%的理论上限。已经知道GPT4在数学上非常出色,对几乎所有学科都有了解,唯一需要做的就是微调一切。

需要记住GPT5将嵌入图像,我们知道当视觉被纳入GPT4时,其性能大大提高。GPT5也会继承这一特性,而且更加强大,那么当进行视觉和非视觉之间的考试时,性能可能会有显著提升。

图片

关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS

GPT5很可能比GPT4要强几个层次,这意味着即使参数数量相同,GPT5可能会展现出一些新兴的能力,我们无法预测,而这些能力在GPT4中并不存在。

GPT4最引人注目的新兴能力之一是心智理论(Theory of Mind)。心智理论实际上是指AI能够思考在特定情境下其他人是如何思考的能力。这可能会引发一些担忧,因为如果AI能够理解其他人的思维方式,它可能会操纵人类以达到某种目的,特别是考虑到这些大型语言模型几乎可以访问互联网上的所有文本,而不仅仅局限于关于说服、操纵和说服策略的书籍。

尽管GPT5在许多方面取得了显著的进展,包括数据训练、新的训练方法、更高的上下文窗口、图像和音频处理等等,但仍然存在一些基本的概念理解问题以及新兴能力的不确定性。这表明即使我们对AI的输出有一定的了解,我们仍然需要更深入地理解其内部运作,并考虑如何确保AI与人类价值观和安全性保持一致。

GPT5所展现的新特性和潜在的新兴能力引发了许多关注和讨论。首先,GPT5在训练数据、参数数量和训练方法上的改进表明了人工智能领域的不断进步,尤其是在处理大规模语言模型的能力上。

GPT5采用了一种新的训练方法,即“Trial Thoughts”,该方法通过奖励模型在数学问题的最终答案上提供积极反馈以及在中间推理步骤上提供积极反馈,从而提高了模型的推理能力。

这种方法的成功表明,在某些领域内,通过奖励良好的推理步骤,模型能够取得显著的性能提升,这对于提高模型在数学、科学和工程等领域的实际应用能力是一个重要的进展。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。