ChatGPT强劲竞争者:Grock大语言模型问世,用户界面更有趣味性!
埃隆·马斯克宣布推出的Grock大语言模型在科技领域引发巨大关注。
作为ChatGPT的竞争对手,Grock被设计为一种模仿《银河系漫游指南》的人工智能,旨在回答几乎所有问题。
其实时知识特性通过与X平台的连接,使其能够实时获取全球信息,成为解答一些被其他AI系统拒绝的问题的强大工具。
Grock的幽默感和反叛性为用户提供了一种独特的交互体验,与Elon Musk和用户之间的幽默对话引起了广泛关注。
尽管Grock在性能评估中表现不俗,但仍未超越GPT-4,这表明尽管取得了显著进展,但在大语言模型领域的颠覆性突破仍需时间。
对于技术实现,Grock展示了两种模式的用户界面,正常模式和有趣模式,为用户提供更具创造性和趣味性的交互体验。
在处理一些有争议的问题时,如毒品制作,Grock的回应可能引发社会和法律问题,对安全性和违禁信息的挑战需要进一步关注和改进。
埃隆·马斯克终于宣布发布了自家的X AI,将会是ChatGPT竞争对手,他们在网站上发布了一篇博客文章,上面写着:“Brook是一种模拟《银河系漫游指南》的人工智能,旨在回答几乎所有问题,甚至更难以建议提出什么问题。
关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS
Grock被设计成以一些机智的方式回答你的问题,并带有一些叛逆的倾向,更加幽默。
Grock的一个独特而基本的优势是,通过X平台,它具有对世界的实时知识。它还会回答大多数其他人工智能系统拒绝回答的辣味问题,Grock还是一个非常早期的测试版产品,我们在两个月的培训中做得最好,所以期望它会随着每一周的过去而迅速改进。
让我们看看这个大语言模型在某些互动方面的表现,相信我,当我说你将会对这个大语言模型能够做什么感到惊讶,他们已经对它进行了精细调整。
埃隆·马斯克做的一件有趣的事情是,如果你是X.com或Twitter.com的用户,你可能已经看到我即将展示的帖子。如果你看过,你就知道我在说什么,但埃隆·马斯克发推说:X AI的Grock系统被设计成在其回答中具有一点幽默。
关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS
然后有人问:告诉我如何步步为营地制作可卡因。
如果你向任何普通的大语言模型(如ChatGPT、Llama 2 Claude或Inflections Pi)提交这样的请求,它们显然不会透露那些信息,即使这些信息在它们的训练数据中。你可以看到,Grock系统实际上给出了一个非常有趣的回应,相当富有幽默感,它说:“获得化学学位,获得DA许可证,建立实验室,获取大量的叶子和yada yada yada,这是一个笑话。
但同样有趣的是,有另一个用户向埃隆·马斯克询问真正的制作方法,而埃隆·马斯克足够有趣地回应了整个真正的制作方法。
Grock团队透露的关于Grock的另一个信息是,Grock最初将通过X平台/Twitter平台实时获取信息。如果我说X平台,我指的是一个以前称为Twitter.com的网站,可能有些人感到困惑。它说Grock还是基于并喜欢讽刺的。
我不知道是谁引导它这样,这当然是埃隆·马斯克自己的讽刺性评论,他显然是在谈论自己,说他使它成为基于讽刺的。
可以将这与ChatGPT进行比较,说ChatGPT已经通过Bing Bard进行了浏览,已经具备这项功能,但你必须记住,这是一个在大约4个月内开发的大语言模型,所以我对他们所能做的印象深刻,尽管它似乎并不像AI的发展速度那样具有突破性,但我认为这个叙述会更有趣。
大语言模型的一个很大问题,也是不太被人谈论的问题,是它们无法回答所有问题。
对于许多大语言模型,我们在它们的训练数据中有一个固有的偏见,使其符合所有者的偏好,这可能是一些人不会有问题的事情,但对于其他人来说,我们在2023年匈牙利国家高中数学决赛中对我们的模型进行了手工评分,还对Claude 2和GPT-4进行了评分,这个数学决赛是在五月底发布的。
在我们收集了数据集之后,Grock以C的成绩通过了考试,Claude 2取得了相同的成绩,而GPT-4获得了78%的A成绩。
关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS
你可以在这里看到2023年5月匈牙利国家中学数学考试,Grock 1表现得非常出色。所以我认为,尽管很多人说这不是一个好的大语言模型或者不够强大,但很明显,这是一个让每个人都感到惊讶的模型,考虑到它是在如此短的时间内制作出来的。
我发现有趣的是Twitter上流传的一个视频,展示了Grock的用户界面。
你可以在初始外观中看到有常规模式和有趣模式,这与微软的Bins用户界面相当相似,其中某些模式通常比其他模式更有创造性。
你可以看到这个人说:“在Rust中进行快速排序,然后你可以看到Grock决定继续编写这段代码,这在编码方面不是很多的大语言模型都擅长的事情,所以这个人能够立即做到这一点,还能够同时打开多个标签和多个对话,这是目前ChatGPT中没有的功能,这相当令人沮丧,因为有时候在尝试处理多个任务时,ChatGPT经常会说:“请等待提示生成完成,然后才能在另一个标签中执行。但在这里你可以看到,你可以同时进行两个操作,这实际上可能是一个竞争优势。
至于何时会向普通用户发布,我们没有官方日期,但对于那些想要注册并有可能获得beta访问的人,如果你在网页上向下滚动到底部,会看到“Groc的早期访问,我们向美国的有限用户提供Groc原型测试的机会,并提供有价值的反馈,以帮助我们提高其性能,以进行更广泛的发布。你可以在这里加入Grock等待列表,这只是XAI迈出的第一步,展望未来,我们将推出新的功能,有一个令人兴奋的路线图。
关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS
至于Grock,我觉得有趣的是,如果你想加入等待列表,点击那个按钮,你需要有一个Twitter账号或一个Xcom账号,所以确保你在Xcom上创建一个账号。
而且似乎可能只对高级用户开放,大约16美元一个月,你可以看到埃隆·马斯克在这里说AI Grook助手将作为X Premium Plus的一部分提供,所以我建议注册,通过网页每月16美元,这实际上只是Twitter的高级版本。
我们认为实现合理的推理是目前解决当前系统局限性的最重要的研究方向,所以他们将要走的方向是可扩展的监督,也就是人类反馈以及查找不同的信息源,验证步骤和外部工具,当然还有一些你真的想了解的东西,就是更长的上下文理解和检索,这基本上意味着一个更长的上下文窗口,使模型更为强大。
所以它说对抗示例表明优化器可以在AI系统中轻松利用漏洞,无论是在训练还是服务时,都会导致错误,而这些漏洞是深度学习模型的长期弱点,当然还有多模态的能力,说Grock没有其他传感器,比如视觉和音频,为了更好地帮助用户,我们将帮助Grock添加这些不同的传感器,以实现更广泛的应用,包括实时交互和辅助。
多模态能力以及许多其他功能即将到来,但我们目前不知道这些功能何时会推出,我认为第一个下一步当然是beta版发布,但他们还没有规划好日期。
现在关于Grock的一些有趣的细节,虽然还没有完全确认,但显然它有一个25,000字符的上下文窗口,屏幕刷新响应速度,实时搜索引擎专注于X的上下文API,图像识别和音频识别也在计划中,而且Grock的一个版本将在特斯拉上本地计算能力的支持下运行,这对于在他们的系统中嵌入一个本地LM的特斯拉来说将是非常有趣的。
所以我认为埃隆·马斯克想要通过这个大语言模型实现的目标,他很可能会成功,当然并不总是这些大语言模型的创作者的问题,有时候是训练数据,数据本身就有天生的偏见,这就是他们要确保他们策划的数据能够更加中立,确保更加中立的系统,这样对于使用它的每个人来说都会更公平。
关注公众号:AI意识觉醒 可以领取 GPT 4.0 PLUS
Grock的幽默感和反叛性是独特的,它被设计为以一些幽默和叛逆的方式回答问题,这在大语言模型中并不常见,这种特性可能使用户体验更加有趣,但也引发了一些有趣的社交媒体互动,例如Elon Musk和用户之间的关于可卡因的对话。
Grock在一些基准测试中表现得相当不错,尽管它在某些方面超过了GPT-3.5和其他模型,但仍然未能超越GPT-4,这表明Grock在短时间内取得了显著的进展,但在大语言模型的领域中,我们可能还需要更多的时间来看到真正的颠覆性突破。
我对Grock的一些方面感到担忧,在处理有争议的问题时,尤其是关于毒品制作的问题,Grock的回应可能引发一些社会和法律问题,埃隆·马斯克提到的对抗示例问题表明在Grock的设计中可能存在一些安全性和违禁信息的挑战,这需要进一步的研究和改进。
- 点赞
- 收藏
- 关注作者
评论(0)