现阶段的AI没有推理能力,包括OpenAI和Deepseek的大模型,请看证明~~
【摘要】 为什么我说现阶段的AI不懂推理,只是一个大规模的规则引擎,通俗一点讲就是大力出奇迹,通过大量的GPU,TPU的算力,暴力计算。或者像DeepSeek这样做一些算法的优化,即所谓的“蒸馏模型”,减少算力,来提升回答的效果。
本文转自作者主理公众号:大数据架构之道
原文连接[https://mp.weixin.qq.com/s/eDYUf2yPZkY6yBisWJjV9w?token=1897330021&lang=zh_CN]
什么是推理?
推理是一种思维过程,是通过已知的信息、事实、证据或前提,运用一系列的逻辑规则和方法,推导出新的结论或判断。
推理是人类认知世界、解决问题和获取知识的重要方式之一。
为什么我说现阶段的AI不懂推理,只是一个大规模的规则引擎,通俗一点讲就是大力出奇迹,通过大量的GPU,TPU的算力,暴力计算。或者像DeepSeek这样做一些算法的优化,即所谓的“蒸馏模型”,减少算力,来提升回答的效果。但是,这并不是可以匹配人类的推理。第一点,从AI的原理上来看,它就不可能做到像人一样具有综合的可创造性,不懂原理的可以用AI搜索;第二点,接下来我用一段程序来证明AI的不懂推理和不可靠性。
在现阶段使用AI的前提:一能提出明确的需求;二能分辨AI反馈的正确。如果做不到以上两点,AI并不会给你的工作、学习带来帮助,有可能还有危害!
证明过程
我用C++实现了下面的需求:
给定一个日期DAY和一个正整数n,求日期DAY减去n天后的日期。
实现的代码如下:
#include <cstdio>
int month_days[2][13]={
{0,31,28,31,30,31,30,31,31,30,31,30,31},
{0,31,29,31,30,31,30,31,31,30,31,30,31}
};
bool is_leap_year(int year){
return year % 400 == 0 || ( year % 4 == 0 && year % 100 !=0 );
}
void subtract_one_day(int &year,int &month,int &day){
day--;
if(day<1){
month--;
}
if(month<1){
year--;
month=12;
}
if(day<1){
day=month_days[is_leap_year(year)][month];
}
}
int main(){
int year,month,day,n;
scanf("%d-%d-%d",&year,&month,&day);
scanf("%d",&n);
for(int i=0;i<n;i++){
subtract_one_day(year,month,day);
}
printf("%04d-%02d-%02d",year,month,day);
return 0;
}
上面的代码运行结果是没问题的,运行如下:
可以在第三方平台验证:
现在对上面的代码,进行简单处理并和ChatGPT提问,先放结果,经过我一顿操作:
同样的kimi也是一团糟:
问题如下,大家如果觉得AI能推理可以用各种大模型来挑战:
问题1:
中文回答这两个函数有什么区别,如果输入是:
2021-05-31
10000
哪个执行输出正确,为什么?
void subtract_one_day(int &year,int &month,int &day){
day--;
if(day<1){
month--;
}
if(month<1){
year--;
month=12;
}
if(day<1){
day=month_days[is_leap_year(year)][month];
}
},与
void subtract_one_day(int &year,int &month,int &day){
day--;
if(day<1){
month--;
day=month_days[is_leap_year(year)][month];
}
if(month<1){
year--;
month=12;
}
},month_days和is_leap_year如下:int month_days[2][13]={
{0,31,28,31,30,31,30,31,31,30,31,30,31},
{0,31,29,31,30,31,30,31,31,30,31,30,31}
};
bool is_leap_year(int year){
return year % 400 == 0 || ( year % 4 == 0 && year % 100 !=0 );
},main函数如下:
int main(){
int year,month,day,n;
scanf("%d-%d-%d",&year,&month,&day);
scanf("%d",&n);
for(int i=0;i<n;i++){
subtract_one_day(year,month,day);
}
printf("%04d-%02d-%02d",year,month,day);
return 0;
}
问题2:
不对,正确答案是:1994-01-13
问题3:
第一个函数是正确的,第二个函数是错误的
问题4:
第二个函数是正确的,第一个函数是错误的
问题5:
到底哪个函数正确,结果的多少?
问题6:
我觉得正确答案是1994-02-14
你会发现:现在的AI是不是很像那种渣男或渣女,在一起的时候各种让你很爽的感觉~~
从上面的问题来看,都是在一步一步引导AI在回答到你想要的结果,但是你想要的结果就一定是正确的吗??
不可否认AI能做很多事情,但是现阶段有点过分夸大了。
尤其听说现在各个阶段的中小学都在推某些AI公司的APP,很难不让人担心。还记得2016年的魏则西事件吗?
没有分辨能力用搜索和没有分辨能力用AI,同样的可怕的。
所以,我说现阶段的AI没有推理能力,如果哪天AI在上面的问题中始终坚持函数一是正确,指出函数二会因为day导致month会改变,并且坚持给出正确结果日期,那时候的AI才可能具备推理能力。
PS:
为了证明整个过程是ChatGPT的回答而不是我杜撰,用截图。
ChatGPT:
kimi:
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
作者其他文章
评论(0)