当前位置: 首页 » 技术前沿 » 创新技术 » 正文

沈向洋院士在2024年外滩大会上的演讲全文:大模型时代的机遇和挑战——技术融合 产业跃迁

字体: 放大字体  缩小字体 发布日期:2024-09-10  来源:智能超参数  浏览次数:3491
 

 

    编者按:这篇文章是香港科技大学校董会主席、美国国家工程院外籍院士沈向洋(Harry Shum)在2024年9月5日开幕的2024年外滩大会上的演讲实录。在题为《大模型时代的机遇和挑战——技术融合 产业跃迁》的演讲中,沈向洋院士分享了他对算力、数据、大模型、以及AI Agent、AI 治理等话题的思考。

 

精彩观点:

 

    摩尔说我们18个月涨一倍算力,现在GPU算力是一年涨四倍。如果18个月只是涨一倍,那么十年下来大概上涨100倍。一年涨四倍,那么十年下来就是100万倍。我再强调一遍,100万倍。

 

    如果大家关注大模型,都知道大模型整个模型越来越大,参数量越来越大。所以算力要求,随着参数的增长,实际上还不仅仅是线性增长,更加像是一个平方向的增长。

 

    真正做大模型的公司,如果你一万张卡都没有,你就根本不要讲自己是在干大模型的公司了。

 

    GPT-5出来的时候,到底会用多少数据?我们现在只能猜一猜,我猜大概会是200个T的数据。

 

    今天你要做通用大模型,那肯定至少是万张卡,而且再向前走,1万张A卡都不行了,要一万张H卡。行业大模型需要千卡级别的资源。每家企业要做企业大模型,可能需要百卡训练。

 

    我觉得接下来,人工智能的发展很重要的一点,从各个国家、全球的角度来讲,一定要做主权人工智能,所谓的Sovereign AI。主权人工智能背后一定需要有个主权云Sovereign cloud,来支持Sovereign AI的发展。

 

    GPT-3出来了以后,大家讲有个东西叫做智能,有个东西叫做智能涌现。但实际上,为什么涌现出来,什么时候涌现出来,是什么方式涌现出来,都是讲不清楚的。

 

    以下是“智能超参数”根据演讲视频整理而来的演讲实录,enjoy:

 


    大家早上好,非常高兴又回到美丽的上海,跟大家一起分享一下最近在人工智能的科研方面、产业方面的一些心得和体会。今天我讲的题目是《大模型时代的机遇和挑战——技术融合 产业跃迁》。


 

    我们今天大会的主题是科技的发展和未来可持续发展。其实我们应该首先看一看人类历史的发展。它实际上从头到尾就是一个技术发展的历史,推动了人类整体发展。

 


    如果我们聚焦到最近,就不要讲以前发明的火、发明了轮子,那么现在最近这些年的这样的一个发展,大家可以看得到整个科研的发展,科技的发展的话,它实际上整体是在加速的。刚才Kevin Kelly的三个观点里面也提到了一个加速的发展。

 

    现在这个阶段,今天我们在这里,主要讨论的实际上是人工智能的发展。人工智能的发展也非常有趣。就是刚才Michael讲的,这样一些跟人工智能有关的字,Cybermetics、AI等。

 

    最近这些年,对普罗大众来讲,大家对人工智能的理解,我觉得可能有三件事情是非常家喻户晓的。第一个事情当然就是ChatGPT,实际上是从文生成文;第二个实际上是 DALL-E,就是所谓的文生成图;第三个是 Sora,是文生成视频。

 


    很神奇的事情,这三件事情,首先都是由OpenAI这样一个初创公司首先推出来的。当然接下来很多公司在竞争,做非常类似的东西。比如ChatGPT,我今天来外滩大会来演讲,没有什么思路,我就问问ChatGPT——我到外滩大会来演讲,到底应该讲些什么东西?

 

    今天早上我们香港科大谢源教授跟我讲,今天晚上要不要一起看足球,中国对日本,我也问了问ChatGPT或者类似的一些产品,说今天晚上中国对日本有没有戏?现在这些人工智能可以回答得非常好,洋洋洒洒讲了半天,大概率是没啥希望,说不定还是可以爆冷的。

 

    中间这个例子,实际上我非常喜欢的。这是人类历史上第一次一张人工智能生成的照片,成为一张杂志的封面,有史以来第一次。也就两年前,有一个数字艺术家Karen Cheng,用DALL-E系统,给了一段话提示符,说在浩瀚的星空中,一个女宇航员在火星上昂首阔步走向一个广角镜头。那么人工智能的这种生成能力,实际上已经相当惊人。更不要讲今年早些时候出来的Sora文生视频,可以生成 60秒钟的高清视频。

 

    到了今天这个时刻,我们应该怎么样去思考大模型,特别是对产业方面,到底有什么样的一些深入影响?

 

    前面的演讲者也都提到了,实际上整个人工智能的发展,特别是过去这段时间深度学习的发展,最重要的事情,实际上是三件事情——算法,算力、数据。我接下来跟大家分享一下最近这段时间自己的一些思考。

 


    第一个思考——算力是门槛。今天做大模型,做深度学习,首先最重要的事情实际上你要有算力。这里画了一张图。从2010、2012年开始,包括Geoffrey Hinton的学生做AlexNet,从那时候开始,所有这些大模型每年需要的算力是以一个什么样的规模向前成长。

 

    开始几年的话,有六七倍的成长,最近这几年稳定下来,大概每年有一个四倍的成长。每年四倍的成长是什么概念?大家平时不想这个问题,我先留一个题目给大家。你现在先想一想,待会我再问你。每年涨四倍,十年涨几倍?

 


    算力这样一个增长,很重要的一件事情,就是今天大家要大模型。如果大家关注大模型,都知道大模型整个模型越来越大,参数量越来越大。所以算力要求,随着参数的增长,实际上还不仅仅是线性增长,更加像是一个平方向的增长。为什么呢?因为模型大了以后,你还要有更多数据来去训练大模型。所以整体对算力的要求,过去这些年是非常非常的大。英伟达股票之所以这样高举不下,这是最重要的一个原因。

 


    这几年我演讲,讲了一句话叫做——讲卡伤感情,没卡没感情。今天如果复旦的教授问校长,我是个人才吗?其实很简单了,你就问校长给不给我100张卡。

 

    你一定要去弄个公司做大模型,不要说做大模型,(就是)做行业模型,就要跟投资人讲,你能保证给我钱买1000张卡吗。真正做大模型的公司,如果你一万张卡都没有,你就根本不要讲自己是在干大模型的公司了。所以我就讲——讲卡伤感情,没卡没感情。

 

    但没卡以后,没钱以后最大的一个问题是什么呢?就是贫穷。以前讲叫贫穷限制了我们的想象力,我觉得现在是贫穷扭曲了我们的想象力,就不敢去想这样可以有突破性的一些问题。

 

    讲起卡,这个必须要讲一讲整个计算机芯片行业的发展。从原来的摩尔定律,已经变成了黄氏定律。以前CPU的增长,大家都知道英特尔非常了不起。摩尔说我们18个月涨一倍算力,现在GPU算力是一年涨四倍。如果18个月只是涨一倍,那么十年下来大概也就是上涨100倍。一年涨四倍,那么十年下来那就是100万倍。我再强调一遍,100万倍。

 

    刚才王院士也讲了,1000倍就是一个什么样的进展。那么100万倍是什么样一个情况?为什么会这样呢?

 


    这是我的第二个思考,就是这里面数据的重要性。给大家看一个关于数据的数据。GPT-3出来的时候,两个T的token。GBT-4的时候,从外面看到的数据,当时大概是 12个T左右的数据。那么它后来还在不断加数据,我们猜的话,现在GPT-4大概是20T的数据。

 

    今天大家望穿秋水,天天在等GPT-5什么时候会出来?那么GPT-5出来的时候,到底会用多少数据?我们现在只能猜一猜,我猜大概会是 200个T的数据。实际上你在互联网上挖来挖去,挖不出200T的数据了。这200T的数据怎么出来的?实际上你还要再想其他办法。

 


    当GPT-3出来的时候,GPT-4出来的时候,这个给我的非常大的震撼,实际上是好像我们互联网40年,天天大家急急忙忙的,今天写个网站,明天弄个东西搬到网上去,激动的不得了。首先是(数据)被Google利用了,弄来做搜索。然后今天再想想,可能最主要的是积累了这个东西,就是用来做ChatGPT,就是为了这样一个AI的时刻。

 


    做到今天了,下一步到底要干什么?我讲就是非常清晰的,就是这样一条思路,特别是最近DALL-E、Sora实际上也给大家指明了一个方向。就是从原来的语言模型、文本,接下来要做多模态,我们仔细做computer vision的同学们,就有用武之地了。

 

    未来再向前走,Sora模型虽然做的非常好了,大家也可以看得到,实际上这样一个多模态Sora模型,它还不是那么强大。实际上这里面的物理性质是不能保证的,做不到世界模型。未来肯定是要往具身智能走,一定要往机器人走。机器人这件事情,当然这里面的一个特别的形态,实际上就是自动驾驶。



    技术上来讲,肯定是要走一条生成和理解综合起来的一条道路,这样一个AGI。当然大家有不同的看法,比如(王)小川,一直觉得不需要视频,不需要视觉,也是有希望走向AGI的。

 


    这里就介绍一下我几个学生做的一个公司阶跃星辰,这样一个多模态可能是今年大模型公司里面做的最好的一个多模态的工作了。

 

    今天不举其他例子,就讲一个最左边这个例子。比如,你把一张图上传到跃问这个APP上面去,你问他为什么图中这个行为被称之为无效技能?你看一下也搞不清楚为什么叫无效技能。这个APP会告诉你,为什么叫无效技能呢?因为小朋友躺在街上打滚,他妈妈无动于衷,一直继续看手机,所以小孩这个技能叫做无效技能。当然视频分析现在也可以做的很好,图片分析都可以做的很好。

 


    第四个思考,毫无疑问大模型现在只是对整个行业的影响,刚才王院士也讲到了,AI+有很多很多机会。

 

    那么我再回到对算力的需求。今天你要做通用大模型,那肯定至少是万张卡,而且再向前走,1万张A卡都不行了,要一万张H卡。行业大模型需要千卡级别的资源。自己一家公司,每家企业要做企业大模型,可能需要百卡训练。

 

    但是我自己特别激动人心的事情,实际上是个人大模型。现在像联想、微软在推的AIPC,苹果所谓的apple intelligence,都是朝着personal intelligence这个方向向前发展。

 


    这里我给大家分享一个数据,到7月底,中国备案大模型一共是197个。197个备案的大模型里面,可以看得到,大概是30%是通用大模型,70%是行业大模型,未来肯定是越来越多的行业大模型。

 


    这里我简单给大家看一个例子。这个是财跃公司做的一个“财跃”大模型,可以对整个金融行业进行一个分析。比如说英伟达的财报出来了,然后很快可以做出一些非常好的结果。

 


    第五个分享,大家都在讲大模型出来,人工智能时代真正了不起的超级应用是什么?实际上超级应用一直存在,就是大家干不出来。实际上,超级应用就是AI Agent。

 

    ChatGPT虽然很了不起,很强大,但是还远远没有到agent的一个地步。整个agent这件事情,实际上是把人的生产力提高到了一个非常大的高度。从进来到出去,整个一个工作。

 


    今天大家都知道,在公司里面,工作上整个工作流是非常之复杂的。GPT到今天,基本上还是相对比较单点的突破。真正向前走的话,要把整个工作流弄起来。今天时间关系,我就不展开讲了,就是你要把这个行业进行一个分析,从大模型应用框架,到平台,到知识技能、任务、对话全部要接起来,才可以做到这样的结果。

 

    这是非常简单的一个例子,比如说让AI顾问为您定制健康美丽方案。

 

演示视频对话内容:

 

    “您好,我是您的健康美丽顾问,非常高兴为您服务。请告诉我您的需求,我将为您量身定制个性化的方案,祝你焕发自信和活力。

 

    给我推荐一个好用的洗面奶吧。

 

    当然可以。在为您推荐洗面奶之前,我想了解一下您的年龄、性别和肤质,这样我才能更准确的为您推荐适合您的产品。

 

    我是混合干皮。

 

    小西马上帮您进行查询,了解了您的肤质,我可以为您推荐一款适合混合干皮肤的洗面奶,佰草集净透保湿洁面乳。这款洗面奶采用氨基酸型洁面配方,温和清洁肌肤。”

 

    我想大家都看到了,刚才这个视频里面,真正做到这样一个虚拟员工,这样一个工作流,你要把整个技能、数据库跟你公司的所有数据打通,配以底层大模型,可以做出很了不起的事情。在应用方面,我对很多中国公司接下来的发展是充满信心的。

 


    第六点,实际上就回到,WAIC世界人工智能大会今年的主题,就是AI治理这件事情。这个事情非常重要,而且每个国家对这件事情看法也很不一样。这件事情,AI对民众的冲击,公司的冲击,政府监管的冲击,社会发展的冲击,现在大家都在担心。比如讲美大选,人工智能对大选产生一些影响,会不会有人用人工智能的一些技术去操纵大选的一些结果。它的确是非常的困难。

 

    今年7月5号的时候,我有幸跟三个图灵将得主,包括我的导师罗杰·瑞迪(Raj Reddy),曼纽尔·布卢姆(Manuel Blum),还有姚期智先生一起讨论这样一个问题。特别是今天,刚才王院士前面讲到阿里云,就是基础设施,我也非常赞同。

 

    我觉得接下来,人工智能的发展很重要的一点,从各个国家、全球的角度来讲,一定要做主权人工智能,所谓的Sovereign AI。主权人工智能背后一定需要有个主权云Sovereign cloud,来支持Sovereign AI的发展。

 

    时间已经差不多了,所以我很快把最后两点跟大家分享一下。

 


    大家很激动地讲大模型这件事情,但我想问一个问题,GPT给我们带来的冲击,有多少是人机交互的震撼,还有多少到底是机器智能的发展?大家好像觉得是机器智能的发展。我想感谢Michael,刚才提到IA这个词,让我不必再解释了。

 

    约翰·马可夫(John Markoff),原来纽约时报的专栏作家,写了一本非常好的书叫《machines of loving Grace》(注:国内叫做《与机器人共舞》),梳理了过去50年计算机科学发展的两条主线。

 

    一条主线就是AI,Artificial intelligence,是我导师的导师约翰·麦卡锡(John McCarthy)创造了这个词。第二个就是IA这条线,就是这帮做UI的人讲的,这个世界最重要的事情是智能增强intelligence augmentation。

 

    如果你沿着这条道路想,实际上我们过去这几十年的进展,主要是人机交互里面的一个突破。而且你要去想,人工智能这件事情,相当长的时间它还是一个工具。那这样想的话,你就可以看得到过去这四五十年的话,整个行业的进展。

 

    原来图形用户界面出来一个了不起的东西,叫做windows,产生了一家伟大的公司叫微软。互联网时代来了,出来一个东西叫搜索,出来一家公司叫谷歌,然后就到了移动互联网,现在到了AI时代了,它的人机交互最本质的是什么?最本质的是对话,就像ChatGPT这样。那么ChatGPT加上微软会不会成为AI时代最伟大的公司?我想只有时间才能够验证。

 


    最后我也想鼓励大家研究,虽然GPT已经弄得如火如荼了,大家都等着GPT-5出来,说不定哪天还有GPT-6。实际上,我们应该从做学问的角度,回过头来再想想,实际上今天对智能的理解还是非常非常有限,这个跟物理学真的是非常不一样。

 

    我们念物理的话,上到浩瀚的星空,下到微小的量子,希望弄一个大一统的理论能够解释。但是今天深度学习,虽然系统做的好像很像模像样,但是大多数东西不可以解释,也不是很鲁棒。GPT-3出来了以后,大家就讲有个东西叫做智能,有个东西叫做智能涌现。但实际上,为什么涌现出来,什么时候涌现出来,是什么方式涌现出来,都是讲不清楚的。

 


    去年,我在厦门科技大学聚集了一批海内外的一些计算机科学家,特别是一些数学非常好的科研人员,大家一起讨论,要深刻讨论涌现智能背后的数据原理到底是什么。

 

    实际上今天人工智能的发展,还在一个相对比较早期的阶段,但是行业上已经有很多应用,我们真的下定决心去做了,特别是有王坚院士弄的基础设施在后面加持,我对未来发展充满信心。

 

    谢谢大家。

 

 
免责声明:
本站所提供的文章资讯、图片、音频、视频来源于互联网及公开渠道,仅供学习参考,版权归原创者所有! 如有侵犯您的版权,请通知我们,我们会遵循相关法律法规采取措施删除相关内容。


 
[ 技术前沿搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 
 
 
一周资讯排行
图文推荐