7月4日上午,2024罗汉堂数字经济年会如期举行。上海科学智能研究院院长漆远与大家探讨了AI驱动在科技产业中的创新和范式变革问题。
漆远首先对比了人脑和AI。他指出,人脑里的链接是百万亿到千万亿级别,而GPT-4最大的模型的参数才到万亿级,在他看来,AI的scaling law还有潜力,但是只靠scaling law并不能走到通用人工智能。
另外,人脑与当前的大AI模型在能耗上还存在着巨大差异,漆远指出,如果继续按照现有的架构发展,达到百万亿、千万亿参数级别的大模型将面临着巨大的能源挑战。
“一个人脑的功耗是15瓦左右,一个白炽电灯泡是60瓦,一个GPU是千瓦,但如果为了训练千万亿参数级别的大模型可能所需的几百万卡的集群,地方供电都可能受挑战。”漆远如是说。
因此,目前国内外都开始关注可控核聚变等新型能源技术,以便能够解决未来可能面临的能源短缺等问题。此外,人脑在活动时不到10%的神经元被激活,大部分神经元处于非活跃状态,但目前的深度学习网络模型在推理时神经元都在进行计算。
因此,漆远指出,目前的深度学习模型在架构上存在提升空间,包括硬件和软件层面的优化,以便减少不必要的计算和资源消耗。
谈及通用人工智能(AGI),漆远表示,AGI的最高体现之一是发现复杂世界的未知规律,不过当前的Scaling Law(扩展法则)不太可能直接带领我们到达AGI,因此AI领域需要不断创新和融合不同的技术,以应对日益复杂的现实世界问题。
此外,漆远还讲到了AI系统的融合、AI在金融和科学领域的应用以及合成数据在AI中的重要性等问题,现场他还向观众展示了AI在推动社会进步和发展中的巨大潜力。
演讲尾声,漆远介绍了上海科学智能研究院和复旦大学在气象预报领域的一些重大突破,展示了“伏羲气象大模型”的成就和应用。
据悉,该模型是全球首个可以实现60天连续天气预报的大模型,在预报精度和稳定性方面也优于其他竞争对手,为全球天气预报技术的发展做出了重要贡献。