专家观点:Sora暴力创新与中国工业软件的突破时刻
全球到处都是人工智能的浪潮,人类智能正在受到从未有过的挑战。人类认知世界和预测未来,有四种范式包括实验、理论、仿真计算和大数据分析。Sora文生视频为代表的数据驱动世界模拟模型,正是第四种范式的最新胜利。而仿真计算,则是基于第一性原理建立的物理定律的近似求解。它以偏微分方程的方式,用极限逼近的方式,重现了世界的边界秩序。人们只有了解了边界,才能形成确定性的预测。这种科学计算的优雅,给人们带来信服、可解释的世界模拟器。然而现在,基于大模型的人工智能要以一种基于统计学的经验主义,来夺取人类确定性的令旗。已经建立在确定性秩序的地基之上的整个世界,现在被深度学习的“不可解释性”动摇。
第四范式如此迅敏地要从第三范式中,夺取定义预测世界的令旗,源自快速进化的人工智能。2015年成立的OpenAI,在推出ChatGPT2的时候,共有15亿个参数。如果用来模拟动物大脑的神经元,那么这个数字相当于老鼠的智力。而ChatGPT3则达到了1750亿,接近了一只猫的水平。一鸣天下白的ChatGPT4的参数为1万亿规模。正在呼之欲出、秘密训练的ChatGPT5,将达到100万亿个参数。这与人类大脑的100万亿个神经触元非常接近。ChatGTP5已经对标IQ值为48的人类智商。而英伟达认为只需要再过五年,人工智能就可以通过所有类型模拟人脑的图灵测试。
决战人类智能的奇点时刻提前到来,这是第三方式与第四范式的人类大决战时刻。
Sora,还是Sora模式
Sora是世界物理模拟器,还是科技幻觉的巅峰?搅动马蜂窝的Sora文生视频,引发海啸般的讨论。Sora所谓的“世界物理模拟器”收割了普罗大众的情绪,但在技术大咖之间也引发旗帜鲜明的两派意见。至少Meta公司的首席科学家严肃地反驳了这个问题。Meta公司认为生成式智能,无法逼近真实的物理世界。
行业里一种有说服力的看法是,临界状态的灾变是不可平滑过渡的,不具备推演性。一个水杯跌落桌面的时候,在触底一刹那会产生灾变。然而,这一瞬间产生的数据样本量过小。从动态到瞬态二者之间存在的鸿沟,根本无法靠大数据暴力破解。即使机器人观察足够多的视频也无济于事。
在Sora和ChatGPT的光环之外,美国一种全新的创新模式正在浮现。最近四年的美国科技股爆发,出现了英雄崇拜的“大力神现象”,也就是一将可顶百万雄兵。马斯克一个人干翻所有的美国汽车界。而成立只有九年的OpenAI则在过去两年没收了所有光线的辉光。连谷歌、Meta这些巨无霸的光泽,似乎都在借着OpenAI的英雄盔甲再次反射出去。在Sora发布的同一天,谷歌发布的支持100万令牌超级上下文的大模型Gemini 1.5 Pro(GTP4为13万个令牌),和Meta发布的人类思维模拟器的预测架构V-JEPA,不幸都被淹没了。谷歌、Meta呼风唤雨的舆论魔法,几近失效。
而当OpenAI成为舞台明星的时候,它背后则有隐形的大力水手。AI的爆发让GPU芯片奇货可居,英伟达一夜之间的市值,可以增长出一个工商银行的市值,超过2.2万亿美元,排列第三,仅次于苹果和微软。这在一年前不可想象。同样做服务器,以AI服务器的美国超微电脑,今年市值飙升1倍。美国的科技股正在独家狂欢,全球没有第二个股市能够如此独自绽放。全球人工智能创新,呈现了“一夫当关”的“独角戏”模式。
这种“独角戏”的创新模式,正在演绎“科技大力出奇迹”的新剧种。OpenAI在收入几乎为零的情况下,微软依然投入10亿美元。而在2023年ChatGPT出现之后,迅速再追加投入100亿美元。这是一种何等宏大的视角和赌注。然而,这种前瞻性的思维,源自另外一个事实,那就是算力的无限扩大。
当人们感觉摩尔定律已经足够快的时候,其实AI算力的增长,比摩尔定律要快几十万倍。英伟达GPU芯片在过去十年的算力增长,达到了100万倍。这种惊人的核弹级暴力,炸开了新的生产力模式。所有AI的突破,都是基于这种算力炸裂的模式而来。
在确定性成长的领域,集中资本砸向优势人才,成为美国科技股市的创新模式。就像钻地弹一样,在狭小的空间里爆发出最大的能量。
第三范式的进化
人们预测未来有不同的方式。2007年微软科学家提出了基于大数据驱动。这种数据密集型的计算与推演世界的方式,被称为第四范式。这也是当下深度学习所引发的AI狂潮的基石。而与此相对的更早范式,则是建立在物理方程的第三范式:科学计算。更早的范式则包括实验和理论。
这是一个算力演变的过程。在实验和理论的推演过程中,人们只需要消耗自己的脑力,就可以完成“夜观天象卜天下”的预测未来。而工业软件所代表的科学计算,则跟计算机的发展紧密相连。而仿真CAE软件,则是最典型的科学计算的先锋,也最为消耗计算资源。它采用优雅的微积分定律,通过偏微分方程,用数学破解一切宇宙的本质。
在上个世纪八十年代个人电脑PC开始逐渐普及,计算设备的平民化,使得科学计算从科学家封闭的实验室走到了日常工程师的手中。这点燃了工业软件的商业热火。无论是美国宇航局NASA的有限元软件NASTRAN,还是为西屋核电所准备的仿真软件ANSYS,都开启了工程师大量创业的新征程。科学家频繁转化成企业家,工业软件则在大学院所与企业之间加速穿梭。数学方程、物理定律、化学定律等大量的基础学科理论,被塞进芯片中加以驯化。这是算法至上的时代。
而这背后,工作站和个人电脑的计算性能,恰当好处地支撑了求解复杂方程所需要的算力。对于汽车、航空航天、消费电子的研发,即使仿真计算慢一点,在整个研发制造周期内,仍然是可以接受的。一辆汽车的型号,研制7年,销售周期可以达到10-15年。仿真工程师用“精算”,为整个研发和制造部门,赢得了“先人一步”的洞见。
从PC普及算力开始,工业软件的工程师们建立了一种“同步摩尔定律”的默契,让算法的优化,与摩尔定律恰如其分地保持了一种同步进化。
科学计算,依赖的是数学方程,对物理定律的编码与破解。这些宝贵的人类知识结晶,并非能够持续成长。跟比特币一样,越挖越少。在解释世界的水晶球里,已经很久没有加入新鲜的突破性基础理论。而在悠长的算力平民化的四十年,工业软件的发展也在出现平滑曲线的拐点。能够蒸馏的烧瓶,已经蒸馏了;能够加速的粒子,也都加速完毕。能够求解的物理方程,都已经求解了;能够使用的偏微分方程,都已经消化成算法。能够划分的网格,都小到了原子尺度。科学基础的理论,所能提供的燃料,已经耗尽。
第三范式的能力,似乎已经接近极限。科学计算的潜力,某种意义上,看似已经走到尽头。2023年,人们在OpenAI人工智能狂飙猛进的震惊中,又惊愕地见证了一场第三范式的终结大戏。全球仿真巨头ANSYS,居然被电子设计软件新思以350亿美元所收购。新思作为芯片设计的全球顶级软件,是第四范式所需要的算力源头。ANSYS是人类仿真软件历史的第一高峰,五十多年的激流奔荡历史中,它吞噬了上百个仿真软件。就在四年前,两者市值都是在200亿美元左右。
而现在,面向第四范式的行业软件,吃掉了代表了洞察物理秩序的通用软件。后者的轮廓消失在第四范式的黑洞之中。市面上出现了一个市值1200亿美元的科学计算公司,但它的成因却跟第四范式有关。
如果这件并购的事情,没有发生,那么不会有人能想到这个剧本。ANSYS的收购,代表物理仿真时代的终结。这场收购,堪比牛顿定律碰到了相对论。前者的作用没有消失,甚至加强,但人们认知世界的方式正在发生变化。
中国的第三范式
第三范式真的“终结”了吗?
远远没有。对中国而言,第三范式,恰好刚刚起步。
中国如果要实现工业软件自主的任务,没有一个100亿美元市值的公司,是不可能实现真正的独立。然而,100亿美元并非是从天而降的。没有10亿美元的单体投入,恐怕实现这一点是很困难的。
在人工智能领域,投资热随处可见了。AI芯片初创公司Groq还没有形成有效算力,已经快速融资3亿美元。在中国大模型之战,吸引了近200家企业,大量资本涌入其中——可以想见的是,绝大部分都会沉沦无息。
在AI高歌猛进的资本浪潮中,10亿美元的投入,对中国工业软件而言,却是一个天量的数据。人们在这个领域,无论是科技攻关,还是企业融资,都习惯了胡椒面式的撒放。但对于科学计算这样已经看到了天花板位置的行业,Sora的暴力投资模式,其实更具备可行性。
一家做CAE公司的云道智造,借助于底层多物理场的求解器,已经在电子散热软件领域,突破了德国公司Flotherm的垄断。这得益于一家电子龙头企业的真买真用。电子信息技术是高速发展、创新驱动的行业,对工业软件的牵引要远高于传统行业。
Flotherm在电子元器件散热的市场占有率,超过了80%。但它在十多年前的关键发展,也得益于这家用户的精心调教和知识反哺。
在工业软件领域,真买真用的真用户太稀缺了。很多企业买软件回去只是交差,然后就让软件睡大觉了。真买假用的常态化,也会造成一种表象上的繁荣。
现在,这家用户就像老法师,正在重新调校创业10年的云道智造,这三年之内的拉动效应是惊人而让人信服的。与一些企业买回去闲置只做案面工作不同,用户的电子散热工程师跟云道坐到了同一个板凳上,将大量应用场景反哺到云道公司。有的时候,性急的工程师连界面都画好了图——画出了功能界面有时候就是捅破了窗户纸。用户一次性提出了上百个Bug,让这家软件公司的后生们使出浑身解数,活力绽放。Sora软件背后也是大批毕业不久的年轻人所完成的。仿真计算,是最标准的密集型科学计算。这是一门算力消耗巨大的工程,跟AI一样。这种强度某种程度可以用网格划分来衡量。网格越密集,计算量就越大。现在这款软件迅速从2千万突破到5千万的网格量,今年已经突破1亿网格规模。这在电子散热已经是自由境界了。由于企业拥有底层的引擎技术,在电子散热打开局面后,就可以转向结构力学、流体力学、电动力学等领域取得更多的并行突破。
一家企业花费约10亿人民币,就完成了底层求解器的布局,并且已经在单个领域取得了商业闭环。从资本的性价比上,颇具效率。从独立自主的角度,则是很高的性价比。然而,如果从时间窗口期来看,依然有点慢。这是一个追赶者加速奔跑的过程,时钟滴答作响,人们需要压缩这样的时间隧道。对于中国工业软件而言,既然已经进入了第三范式的高速公路,那么“大力出奇迹“的时刻触手可及。文生视频的Sora模式,比Sora本身变得更加耀眼。
这家公司的突破,看上去是一个串行的线性进展。但它带来了同样的“独角戏”的大力水手模式。如果资本投入在这里形成一个饱和式的轰炸,产生一个10倍、100倍的压强,那么很多仿真软件的壁垒,就会炸开。
这正是中国工业软件面临的困境,到处都是低门槛的单兵射击。大量对于多物理场的工业软件的突围,都是单个工兵在爆破。工业软件的小作坊作业太多。资源投入严重不足,而且还都是重复劳动。这种分散式的攻关模式,跟美国当下正在高歌猛进的“独角戏”模式,呈现了完全不同的对比。
然而,中国市场并不缺钱。百模大战已经看出这种非理性泡沫。3D打印、元宇宙的大话犹在耳边,Sora浓妆已经扑鼻而来。当中国资本纷纷追赶大模型、Sora这类的AI突破的时候,有很多问题还需要澄清。但盲目的大资本投入可能会事与愿违。那些尸横遍野的大模型失败者,会带来大量的资本消耗。
如果一些资本能够如此高压强地进入工业软件的某些领域,物理世界的模拟就会出现井然不同的一个局面。中国当下的科学计算,跟美国的人工智能一样,需要一个资本集中点大爆炸的“蘑菇云时刻”。从Sora大热,反思中国科创模式。这里可以得到的更多。
20年前,计算科学的算法早已经成熟。CAE软件所有的基础原理其实已经不需要突破,最重要的就是这些数据方程的工程化表现,来适应虽然多样化但相对有限的工程场景要求。对于行业的非线性软件Abaqus、多体动力学ADAMS或者电子散热Flotherm这些软件而言,它们能够在行业确立霸主地位,并非是先进的算法,而是多样化的场景适应。工程化的计算,需要大量“近似的艺术”,这是工程师而远非科学家要解决的问题。
著名的非线性仿真软件LY-DYNA,擅长计算车辆碰撞的变形,也擅长模拟爆破瞬间的破坏力,它可以适应上百个不同的场景。而课题所支持的科学家开发的求解器,只能在一个场景使用,换一个场景立刻就趴下。这种求解器获奖无数,也无法在商业化胜出。这就是为什么现在的软件开发主力已经从高校转移到企业,为什么用户的参与比政策的补贴更加宝贵。
让作坊式的工业软件作业方式消失,让分散的课题集中在指定区域爆破,让科技人才汇聚在刀尖上,饱和式攻关才是工业软件的解决之道。然而这种饱和式攻关,最好让大企业走开。大企业的组织惯性和考核体系,很难驾驭工业软件这种小赛道的创新突破。就工业软件的发展策略而言,大企业最合适的就是当奶妈,为中小企业提供丰富的使用场景。大企业亲自下场做软件,非利益作怪则虚荣耍妖。正如微软对OpenAI一样,既投入了资本,也投入了场景。但ChatGPT、Sora这样的创新突破,很难想象是在帮派林立的大公司所能建树。谷歌、Meta坐拥近似无穷的算力和数据资源,依然错失引领通用人工智能的浪头。
小记:饱和攻关
美国企业目前股市总市值为51万亿美元,占据全球近一半。而以微软、英伟达为代表的Top8家科技企业市值则占据美国总市值的27%。新一轮科技竞赛,就是这八家公司带动,撑起了美国市值的天空。这种做法就是满弓满仓的高饱和投入。在算法没有本质突破的情况下,依靠海量算力的投入,突破了大模型的人工智能应用瓶颈。这种模式给正处在追赶科学计算的中国工业软件而言,有着极大的启发。
工业软件的突破,是一个连续的三板斧组合。第一板斧技术攻关是数学家解方程,第二板斧产品化是工程师做近似,第三板斧商业化则是市场打磨功能。工业软件技术攻关可能只需要10人,产品化所需要的人员放到10倍,商业变现则需要再放大10倍。这是一个技术、工程化、应用普及的创新闭环。对于已经验证的逻辑闭环的空间,饱和的资本投入,将使得能量成十倍成百倍的放大。一个初创的人工智能公司,很容易筹措到10亿美元,然而它的指向则生死未明。而在第三范式的科学计算,采用饱和式投入10亿美元,中国就可能实现全面爆破。投入规模要小得多,而突破的成果则是惊人的。而在第三范式的突破,则可以为消除第四范式的“AI幻觉”提供坚固的支撑。
人们会继续探索AI理解和模拟现实世界的双重能力。第四范式的暴力投入所取得的成就,对于中国急速冲破的第三范式的大门,留下了更具有现实意义的参考样本。或许这正是当下最为有效的工业软件突破时刻。
作者简介
林雪萍:北京联讯动力咨询公司总经理,上海交大中国质量研究院客座研究员
- 点赞
- 收藏
- 关注作者
评论(0)