周鸿祎:应结合企业场景打造专业化大模型
2024清华五道口首席经济学家论坛于9月28日在北京举行。360集团创始人、董事长兼首席执行官周鸿祎出席并演讲。
周鸿祎指出,大模型会重构每个行业和每家公司。中国公司不用等到超级通用人工智能做出来之后再应用,而是应该充分发挥工业门类多,企业场景丰富的优势,结合企业场景打造专业化大模型。
以下为演讲实录:
周鸿祎:在座的诸位,像王小川、孙老师都是人工智能的信徒,因为对人工智能现在还是有很多争论,到底大模型是人工智障还是真正的智能?包括美国也涌现出了一些争论,到底GPT-5能不能出来,包括人工智能是不是泡沫?是不是需要6000亿美金的收入规模才能证明?所以,我的观点还是讲,大模型已经实现了一个智能的突破,而且会是一场工业革命。但是,我不会像网上那么悲观,说它会摧毁什么行业,我觉得它会重构每个行业和每家公司。
大模型最近的一个重大突破,我在今年7月份已经开始思考这个问题,就是从人类的快思考能力,变成了慢思考的能力。今天一个再牛的人,要求他不假思索地现场回答一个复杂问题,不打底稿,没有纸张的介入,不分步,快速回答问题答案的能力都是有限的。
但是,我们人类解决复杂问题的时候实际上是分成多步,比如老师让写个论文,我总得先拟个提纲,去查点资料,再找别人看一看,再到处抄袭抄袭,反正最后写完的文章再润色一下,你会发现分成很多步,这实际上是慢思考的能力。
最近Open AI发布了o1,给大家又带来了信心。因为原来自己使用GPT的时候就觉得人工智能就这样,还经常疑问是不是产生幻觉,是不是出错,感觉GPT像一个死记硬背的学生,但是o1很不一样。很多人在谈强化学习,这个肯定要向几位老师请教了,我也不太懂强化学习。我觉得用多种方法,最重要的是实现思维链的能力,也就是慢思维的能力。所以,这样的话,我觉得人工智能又找到了新的发展方向。因为传统的模型,对于算力,对于显卡,对于能源,对于数据的大力出奇迹的方式实际上已经是碰到瓶颈了,因为训练数据用得差不多了,所以o1开始考虑用强化学习合成高质量数据的方法开辟了新范式。
奥特曼最近发了一篇文章,我仔细看了看,他这个文章看起来乐观,实际上是悲观,说人类经过几千天就能实现突破。猛然一听很乐观,我一算几千天,大概还得十年。所以,我自己觉得比较乐观,我觉得中国其实可以走一条路,就是不用等到一个超级通用人工智能做出来之后再来应用,而是充分发挥我们工业门类多,企业场景丰富,应该结合企业的场景打造专业化的大模型。
另外,慢思考不是只有学习一种方式,我们最近半年探索的专家模型协同的COE方法,我跟国内16家大模型厂商合作,接入了50多个大模型,我们尝试,比如说,王小川的模型负责回答问题,百度的模型负责来挑战,千问的模型负责来辩论,最后可能字节的模型来负责总结,通过几个大模型像一个幕僚参幕团一样这种,通过相互的讨论也能实现基于协同的慢思考,解决复杂问题的能力,而且将来在很多问题上超过了GPT-4o,可以看一看演示。
(大模型演示)
最后分享一个简单的故事,前一段网上流传一个视频,Google的前CEO埃里克·施米特有一个对话,视频标注为他故意开玩笑表示为“保密”,结果反而传播量很大。所以,我们今天这个会也是保密的,对吧?(笑)。国内热炒了很多,其实我倒不喜欢施米特的一些言论,我觉得那个主持人的言论特别棒,但是大家没有注意到。斯坦福的一个教授解答了一个故事,也解答了我的一个疑问。他就说到底工业革命如何发生的?他讲当年蒸汽机被电动机取代的时候是经过了30年,最早的时候简单地拿电动机取代蒸汽机,因为没有改动工厂的格局和传统机构,整个的业务链条。所以,并没有带来效率的本质提升。因为最早的工厂都是一个蒸汽机通过传送杆把动力传给整个工厂。所以,整个工厂是以这个中心驱动来设计它的整个的架构。
后来30年之后人们突然意识到,电动机可以做小,做成很多个电动机,所以工厂里各个传送带,工厂里各个动力驱动装置都用了不同的电动机,从中心驱动变成了单元驱动,整个工厂的格局、流程,包括管理、组织机构都发生了变化,才带来了电动机驱动的工业革命。所以,我觉得这个例子特别恰当。就是我们今天不能就技术论技术,一方面我跟大家分享了最近人工智能上碰到一段徘徊期之后的一个新的关于思维链突破。
第二个,我最爱举的一个例子就是大模型不是产品,只是能力,还有大模型不是操作系统,全世界只需要两三套,大模型更像电动机,就是它可大可小,可快可慢,无处不在,最后在中国众多的使用场景中,每个人的加强可能会有多个大模型,你的手机、车、电脑,包括你们家的人形机器人,你们家的智能硬件都会有大模型。在每个企业里也不会有一个大模型解决所有的问题,所谓的中心驱动,而是叫单元驱动。就是每个企业的不同部门,它的不同业务的不同流程中会有多个专用的大模型在解决各自的问题。这些大模型像人类专业员工一样,通过一个组织的能力进行协作,进行相互的刚才说的这种交流、讨论、反思、辩论,最后总结出正确的答案。所以,这种模式很有可能针对大模型,能够避免我们今天遇到的所谓模型能力不足的问题,能解决所谓模型能力容易出错的问题,解决一个我们现在最卡脖子,就是算力芯片不足的问题。
时间有限,下来再跟大家分享,谢谢大家!
海量资讯、精准解读,尽在新浪财经APP
责任编辑:梁斌 SF055