C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  少尉

注册:2010-4-285
发表于 2024-12-18 19:11:35 |显示全部楼层

两年前,大模型刚兴起时,周鸿祎开始用四个「你相不相信」呼吁现场建立 AI 信仰,从此踏上「AI 布道者」之路。

去年,作为国内第一批发布大模型的互联网企业,360 的战略调整为「All in AI」。今年,360 在 AI 领域取得不少进展,1 月底上线 360 AI 搜索;7 月发布国内首款儿童 AI 手表 360 儿童手表 A9 AI 红衣版;8 月宣布与国内 15 家大模型厂商达成合作,共同推出新一代 AI 产品「AI 助手」……

如今,大模型技术的出现,深入影响了各行各业的发展轨迹,成为不可忽视的重要力量。但在周鸿祎看来,大模型不应被神化,而是应该被视为一种赋能工具。

在极客公园 IF2025 创新大会上,360 集团创始人周鸿祎在「在大模型时代年轻人值得干点什么」的主题演讲中谈到,AI 的本质是「赋能」,而非单纯的「颠覆」。在 AI 时代,AI 的作用是为各个行业提供赋能、重构游戏规则,而不是单纯打破现有的格局,AI 应该像电动机一样嵌入到各种应用场景中,推动产业革命。

周鸿祎总结了他眼中关于未来的六个趋势:
AGI(通用人工智能)和超级人工智能发展放缓;

大模型趋向专业化;

模型越做越小;

训练数据质量提高;

成本降低;

InfraStructure 建设基本完善。
同时,他也列出了六大应用方向,希翼年轻人能够从大模型的六大应用方向中寻求到属于自己的机会。
人人智能;

从万物互联走向万物智能;

数转智改,助力传统产业打造新质生产力;

未来和新兴产业;

打造科研新范式;

AI 安全。
如今,大模型正在把所有行业、把所有赛道都重写一遍,时代的游戏规则已改变,新的机会摆在了所有人面前。

以下为周鸿祎现场演讲实录,由极客公园整理。

周鸿祎:今天在讲人工智能之前,先跟大家说说我为什么拍短剧。我之前唯一看的一集短剧是《二十岁总裁爱上保洁阿姨》,看的时候有两个周鸿祎,一个理性的周鸿祎一边看一边吐,能这么拍?感性的周鸿祎说快点下一集。那么我为什么拍一部短剧呢?有些部门审核了之后说:大家发现你拍的不是短剧,完全是广告片,所以大家拍短剧的目的是什么,等下跟大家分享一下。

国内把这个事说得太神秘了,一说就是企业家做 IP,一说做 IP 在座很多人就觉得我又不是什么著名人物,我有什么 IP 可做的?

但其实说白了在短视频和短剧时代,短视频和短剧已经把大家头脑格式化之后,过去传统公关部和市场部或者用户增长部要干的一件事就是要搞流量。

我前一段时间去硅谷,跟很多创业企业谈,他们没有什么 IP 的概念,但是你问每个企业说如何冷启动你的企业,如何冷启动你的产品?答案都是一致的,就是做魔性的短视频,在国外短视频平台上获取免费流量,这是大家拍短剧的目的。现在这个短剧也正在拍续集。

最近有一个概念叫 Founder Mode。在短视频时代,传播游戏规则发生了改变,跟用户沟通方式发生了改变,更大的改变是在于大模型,它的出现改变了技术架构和商业模式。所以我现在是在带领 360 二次或者三次创业。

我今天分享一下我对大模型发展的思考,关于在大模型时代年轻人值得干点什么。

许多互联网行业的「老兵」可能会认为,AI 与互联网的发展规律相似,甚至会产生一种绝望感,觉得互联网已经经历了二十年的发展,许多机会和格局已经初步成型。前几天,马云在蚂蚁集团的讲话中提到的一个观点我非常赞同——AI 是比互联网更大的机会。因此,互联网时代的规则和思维方式不一定适用于 AI 时代。如果大家在 AI 时代仍然沿用互联网时代做 APP 或 Web 的思维来开发 AI,那就像刻舟求剑。

举个简单的例子,互联网能否提升生产力?互联网确实能够提高沟通效率,但这并不是互联网的本质。互联网的核心在于连接——连接人与信息、连接人与人。

亚星游戏官网-yaxin222


周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园


互联网完全跟现实世界无关,而是创造了一个虚拟的时空,在互联网里又产生了很多独特的社交、社区模式。而人工智能的最大不同之处在于,它是一种直接提升生产力的工具,而且生产力更强。

硅谷的一些人曾经讽刺互联网,称自己原本希翼得到的是一艘宇宙飞船或一辆会飞的汽车,却最终得到了一个 140 字的推特。互联网是很牛,但是互联网很多事干不了,而今天人工智能可以研究蛋白质的结构,可以让自动驾驶、无人驾驶成为可能性,包括推动机器人的发展。

所以这是我第一个分享的内容——人工智能应当被视为一种赋能工具。之前一个经济学家陈龙发表过一篇文章,我认同他的观点。过去,互联网常被视为一种「颠覆性」力量,我也写了一本书叫《颠覆者》。但在 AI 时代,大家必须承认,AI 是赋能者,而不是单纯的颠覆者。至于它到底能否颠覆,这个问题可以以后再讨论。

01 关于未来的六个趋势

网络上有很多关于 AI 将颠覆各行各业的焦虑文章,但我认为最重要的是,AI 正在把所有行业、把所有赛道都重写一遍。所以这可能是各位和大家最大的机会,所以不要刻舟求剑。

先说几个预测/趋势:

第一个预测是 AGI(通用人工智能)和超级人工智能发展放缓。我曾经非常看好 AGI 的前景,甚至觉得它会在 2025 或 2027 年出现。不过现在看起来这个发展步伐正在放缓。

亚星游戏官网-yaxin222


周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园


这两天 Ilya 有一个新的演讲,但是 GPT5 还没发布,包括最近出现的一些新模型依然侧重于多模态能力的提升,尤其是在编程和推理能力方面。OpenAI 最初目标是幻想构造一个全宇宙超级无敌通用人工智能,能够在各个方面超越人类,现在我觉得这个事在逻辑上不太成立。

过去很多人认为,Transformer 模型模拟了人类的多层神经网络推理,只要提供足够的计算能力和数据,AGI 就会「自然而然」地出现。但是从现在来看,Ilya 承认互联网上能用的数据用得差不多了,好像 AGI 也没有到来。

有人说不是可以合成数据吗?合成数据是能解决一部分问题,像数理化的推理合成数据可以。但是有个问题是,人类常识往高处走,越泛化还是越专业?当你从硕士到博士,再到教授,再到院士时,科技树的走向通常是越来越专业化。

比如说如何写一个操作系统,如何造一个战斗机?如何造一个航母?如何造一个发动机?这种常识并不在互联网上,不是靠互联网阅读足够多的网页和八卦就能够掌握的,而且现在合成数据不能涵盖这个领域。

有人说 O1 推理能力很强,但是 O1 没有那么神秘,其实国内已经有好几家企业做出了类似的东西,核心就是通过思维链和强化学习,让模型进行多次推理,并在得出初步答案后,反向反馈,检查是否有错误。甚至大家试验过让百度先给答案,阿里的来批驳它,头条来收拾残局,最后 360 和和稀泥。你们可以试一下 PlayGround,就让国内大模型互相 PK 一下,每个智力都会提升很多。

所以 O1 的推理能力不细究了,我的观点不代表真理。不过 O1 的推理能力比较难泛化是一个问题。因为要做强化学习就要有价值函数,价值函数就是得先判断对和错,数学题倒是挺容易判断对和错的,但是如何写一个操作系统是一个好的操作系统,甚至说问题再小一点,如何写一个浏览器,它的价值函数怎么判断?

最后 AGI 我觉得一定会来到的,但是可能不是在今年明年。

第二个趋势:大模型进一步发展,无论训练还是推理,都在往专业化发展。

除了少数几家巨头企业,许多其他企业也在往更加专业的领域发展。王小川转向医疗领域,但还是有点宽泛。最近很多人讨论的 MOE(专家混合模型)架构,实际上也是通过多个专家模型来组合能力。

我最近重新思考了GOOGLE的战略,突然发现GOOGLE的战略似乎有些后来居上的意味。大家可以想想,DeepMind 这家企业开发的 AlphaFold 在蛋白质结构解析方面几乎无与伦比,AlphaGo 也曾击败了人类围棋的超九段高手。但大家并没有看到 AlphaGo 能写诗,AlphaFold 能解奥数题,这些系统有其局限性。包括 AlphaChips,它专注于芯片设计,据说已经超越了人类设计师。那大家为什么还要追求一个既能写诗又能解奥数题的大模型呢?

第三个趋势是模型越做越小。一年前如果站在台上我肯定不是这个观点,大模型刚出来时,大家都在比拼参数量:你有千亿,我有万亿,大家普遍认为只有参数越大,才能带来更多的能力。

但经过这一年的发展,很多小规模参数的大模型架构开始崭露头角。小模型的定义变得越来越模糊,实际上大家正进入一个模型轻量化的时代。最典型代表是面壁智能,他们名字起得土一点叫小钢炮。

包括今天模型要上手机,苹果在手机上也会有一个非常小的模型,MicroSoft也在探索 1B、2B 参数规模的模型。所以模型不一定越做越大,因为越做越大的话就变成马斯克的游戏了,他确实有钱,一说就是 10 万卡集群,要买个核电站,如果模型都是这个玩法,那跟大多数人就没有太大关系。

第四个趋势:训练数据质量提高。过去有一个误区,大家觉得模型越大能力越强,但还是面壁智能提出一个能力密度的概念,实际上是常识密度,就是大家发现过去以为模型越大,能力越强,才会涌现。但现在发现模型虽然小,只要常识含量高、常识纯度、常识质量高,也能展现出强大的能力。

比如把大模型想象成人,有两个大学同学,一个特别聪明,脑子容量特别大,天天在网上看八卦,你问他谁跟谁出什么事他都一清二楚。另外一个同学大学一年级只做高数题,就把高数 3000 个题做得滚瓜烂熟,谁的高数推理能力强?一定是后一个同学,但是你问他汤姆汉克斯的妈妈是谁,他可能回答不了这个问题。

现在,全球做大模型的人都意识到这个问题了,大家把互联网上的八卦拼命学进去之后,变成了一个快速问答的常识小能手,但是推理能力并没有特别强。所以 O1 走的就是另外一条路,它很多问题回答不了,但是不影响它的推理能力很强。

所以真正常识今天不在互联网,而是在很多专家脑子里,在很多企业内部业务流程里,那现在这些常识可能是通用大模型的厂商搞不到的。所以大模型的能力增强需要依赖其他途径。

小模型能力增强方法就是多推理几次,大家本来觉得 Scaling Law 碰到了障碍,大家以为老黄的显卡卖不动了,又发明一个方法——不依赖快速思考,而是通过慢思考来增强能力。慢思考并不是让模型马上回答问题,而是让它自己在内心中反复推理,消耗更多算力,这也能显著提升小模型的推理能力。

吴恩达老师有一次讲:如果我用 gpt 3.5+一个 Agent 框架,能力可以超过 gpt 4.0,开始我没有理解什么意思,后来发现当大模型通过快速思考直接回答问题时,其答案质量可能不如通过一个较小的模型,先进行反思、反复推理,并自我纠正后得到的答案。

最后一个好消息,大模型发展趋势之五——成本越来越低,现在行业里还有人整顿开源好,闭源就好吗?Tencent混元都开源了,千问开源一直做得不错,开源越做越好,能力上来了,开源成本基本为 0,尽管训练和推理的成本依然存在。

国外和 GPT4 等效的模型价格下降了数百倍,国内抓紧时间用他们的 AGI,比如说混元开源了,你自己部署一套,自己成本比直接接他们 API 都要贵很多。

他们投了那么多 Infra,投了那么多显卡,三年以后就折旧折完了,不用也是白费,他们给的 API 价格都是低于成本价,所以大家可以用起来。

第六个趋势,InfraStructure 投资已经差不多告一段落。为什么?看看英伟达股价就知道,英伟达卖了无数显卡。为什么有人在怀疑人工智能有没有泡沫呢?实际上大家花了几千亿美金买这么多显卡,实际上是给了一个信号——基础设施已经准备好,该做应用了,这一点很像互联网第一次泡沫破碎的时候,思科卖了无数路由器,各个国家拉了很多海底光纤,但是没有应用,第一轮互联网泡沫就破碎了,而基于这些基础设施的很多互联网应用做了起来。

目前开源能力和 API 能力肯定是准备好的,所以 2024 年是应用场景之年,2025 年是 Agent 之年。

大家现在谈大模型,很多事混在一起谈不清楚的,我还是希翼分成两条路:一条是 AGI 之路,这条路承载了人类梦想,让有钱人继续卷数据、卷算力,朝着万亿十万亿参数发展,最近 X.AI 三个月就搞了十万卡集群,中国还是万卡集群。但是这条路跟大家没什么关系,反正大家都面临人生痛苦的问题就是没钱。

他们有些企业就没有搞清楚自己究竟是做 AGI,还是在做应用。这条路不要摇摆,要坚定地选择一条路走到黑,别做着做着说我是在大模型的通用能力,做着做着说我又做了一个场景应用来证明我的能力,这完全是两件事情。

我有一个观点,大家都说大模型要掀起一场工业革命,但怎么掀起工业革命呢?就得把大模型拉下神坛,大模型要往产业化、垂直化、场景化、应用化发展,所以做场景、做产品,我觉得一点都不丢人,正因为有无数的应用,互联网才能起来,否则互联网光靠海底光缆、靠思科的高端交换机,是没有任何意义的。

AGI,我今天就不谈了,这是少数巨头的游戏。我这次去美国也见了一个 VC,已经没有人在投做通用大模型的企业了,Anthropic 后面是AMAZON,OpenAI 背后是MicroSoft,再加上老黄、马斯克等,你能数得出来在美国做这样的企业不会超过 10 家,而且这个格局确实对「门票」的要求太高。大家国内有些创业者还是很聪明的,表面上看来在做通用大模型,实际上他的钱都拿来做投放了,这是非常 smart 的做法,因为投放好歹能弄来用户数据,你说预训练,训了大模型,还不如开源微调的好,这钱不是白花了嘛。

走应用之路,我的意思是让大模型从「原子弹」变成「茶叶蛋」,别再卷算力、卷数据、卷参数了,说白了,我觉得走应用之路的一个非常重要的理念,就是不要希望大模型什么都能干,大家前面被误导太久了,大家陷入了迷思,天天出来「秀肌肉」,就是大模型什么都能干,好像无所不能才叫大模型,你企业里雇过这样的员工吗?请了一个司机,又能当保镖,又能当司机,又能当保姆,还能做饭,还能给你揉脚,还能写程序,还能做公关,还能拍短视频,还能剪辑,要碰到这样一个人,他自己就创业了。

所以要做专业大模型。去年看了一个影片,有句话说的特别真理,说「解决问题的关键,就是找到关键的问题」,我觉得解决问题的关键就是放弃对大模型的执念,不要高估它的能力,当然大家也不低估它的潜力,让一个大模型就干一件事,换这样的思路去想一想,会发现模型更小、算力更少、成本更低,而且应用难度更低。

02 大模型是能力,不是产品

所以大模型是什么?我从一开始赌错了很多东西,唯一赌对的东西就是我一直不相信大模型是产品,我也一直不相信大模型是操作系统,你把什么东西比喻成操作系统这就坏了,全世界就需要 3-4 套,还有你什么事?

大模型不是操作系统,有人老喜欢拿云计算做比喻,我后面会讲到大模型也不是电力,大家一想到电力就想到了云计算,就应该在云端,但大模型更像一个电动机,所以大模型是能力,不是产品,能力是什么概念?

亚星游戏官网-yaxin222


周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园


能力很好,但是要结合应用场景才能产品化,大模型是要藏在产品后面,所以我最喜欢的产品经理是谁你们知道吗?你们喜欢周星驰吗?看过他很著名一部教人怎么做产品的影片吗?叫国产《007》,我就经常反省,它里面最经典的例子是这看起来像一个刮胡刀,实际上是一个吹风机。

今天无论各位女士用的吹风机,还是男士的刮胡刀,还是电牙刷,还是扫地机,里面都藏着一个电动机,但你意识到电动机的存在吗?不存在。会有人买个电动机回来接上电说:来,给我转个 27000 转吗?也不会。

实际上你买了一个电动机你要装上轮子才能变成汽车,装上扇叶才能变成鼓风机,装上齿轮才能变成传送带,大模型这个东西挺庸俗的,它就是个电动机。

我今天讲的就是要把大模型拉下神坛,不供着它,不顶礼膜拜,好像干大模型就积极伟大,其实这东西要变的很庸俗。

当年 IBM 做出超级电脑之后,就跟今天的超算一样,说全世界五台就够了,最后超算真正没有掀起信息革命,掀起信息革命的是谁?是 PC。PC 最早从苹果 2 开始算,到 IBM PC 到MicroSoft的成功,把这玩意做得跟玩具似的,今天大家做的服务器端都是 PC,PC 进入了百行千业,进入了千家万户,这才能掀起工业革命。

AI 能不能颠覆?肯定最终是能颠覆的,因为啥都能颠覆,你把东西做的比别人便宜很多也能颠覆,你能在晚上不需要开仓储,在网上直播带货,一分钟能卖出 1 个亿的东西也叫颠覆。

但是从 AI 来讲,我的建议是不要一上来就想着颠覆这个、颠覆那个,先想想赋能,就是当你有了一个电动机之后,如何取代原来的蒸汽机,如何取代原来手工干的事情,能不能润物细无声的嵌入到应用场景中,不是不可以做新东西,但这里面最大的机会是有了 AI 之后,有了生产力提升、生产力赋能工具,很多产品可以重做一遍。

走应用之路,我觉得要对大模型的能力重新做一个划分,因为我觉得过去两年里面,大家都被自己误导了,你看各企业一说大模型,出来讲案例,都是讲它的两层基本能力,都是讲写诗作画写文章、阅读理解、翻译、编程,实际上我把这个定义成它的基本能力。

比如说大模型的 AIGC 这面,有可灵、海螺、vidu、即梦,这两天 Sora 出来了不过没有那么惊艳,这些模型是落在创作和营销能力。但是多模态能力值得大家关注,这两天 Gemini 2.0 它把多模态能力展现到极致,但是多模态能力和 AIGC 还是要划分开,因为两个用处不一样,所以要结合场景,而不是笼统地说能够处理图象、视频、声音是多模态,原来我认为能产生视频图像也是多模态,这个概念不一样,我觉得理解非常重要,因为它是让大语言模型从看见、看懂到理解的重要差别。

业务能力的对接也至关重要,特别是如何与企业的核心业务相结合。比如,情报分析、常识管理、业务自动化以及组织协作等,这些能力过去常常被忽视,但它们正是人工智能能够提升企业生产力的关键领域。特别是在自动驾驶这种新兴产业里面,具身智能这些创新能力,实际上提供了新的工作范式。

还有一个场景是 AI for Science,在座诸位也有人在这个领域可以思考一下,未来科学研究可能有一些专业模型来辅助,AlphaFold 就是是一个例子。

所以如果有人在这个基础上把模型能力分得层次更细,分得更多是没有问题,用户购买的并不是工具本身,而是一个切实能够解决问题的结果。所以大模型过去两年里面,大家自嗨太多了,不断说这个能力那个能力,今天要搭一个桥,而是要看这些能力到底给企业、用户创造什么价值。

03 六个方向里,有哪些机会?

我大概列了六大应用方向,看看大家是不是能够在这六大方向中寻找创业和创新的机会。

第一是人人智能。

我一直认为 AI 是人类有史以来发明最重要的生产力工具,除了对企业提升生产力之外,对个人来说,我觉得它可以解锁你很多不具备的能力,甚至让大家个人具有超能力,比如说不会做音乐的也能产生音乐,不会作画的也能把想法变成海报,所以大模型要提高每个人的生产力,打造个体的超能力,这里面有很多机会。

大模型在第一步,尽管大家都想着做工具的人挺吃亏的,赚工具的钱还不如做社区的,做社区有网络效应,工具的话用完就走,但是大模型首先工具属性还是非常重的。所以在这一块,大家可以想一想,当然不要只是去卖课,卖课是不成功的模式。

360 在这做的是纳米 AI 搜索和 AI 办公大全,是瞄准了帮助个人来提高个人获取信息、分析信息的能力,这一块有很多机会,就看能不能深入研究,人还有哪些能力可以被 AI 去提升。

第二个方向:从万物互联走向万物智能。万物互联的观念,IoT 的概念已经很成熟了。现在 AI 的发展从云端到终端,从云端到边缘,模型越来越小,现在像苹果手机的策略是手机上有个小模型跟云端模型星座,荣耀的照明说,手机算力、芯片发展到 2027 年手机上上个百亿的模型是没有问题的。除了汽车,明年以后没有大模型上车的车可能卖不掉了,联想也在给 PC 上模型。

大家想的更广一点,所有的智能硬件如果都跟大模型发生关系,但是不是把一个通用大模型连上来,而是在所有智能硬件上有一个专业模型增加一两个能力会怎么样?

比如说半夜里肚子饿了,打开冰箱找瓶啤酒,冰箱能够跟你说话,它看见你,它告诉你太胖了,不要在晚上再喝啤酒了,而且它会自动给你的监护人发个短信。

那有人老说要做新的硬件,AI Pin 大家都知道比较失败了,他们画蛇添足非要带一个投影仪,还要做手势,手机被证明是人类比较能接受的随身携带的物品。还有戒指、手表、眼镜,Meta 最近做了一个眼镜,也是蛮成功的,我也准备推出大家的纳米眼镜,这不是玩笑,因为苹果做 Vision Pro,老是想做 VR 和 AR,这个搞得眼镜太重,功能太多。但是大家发现如果眼镜跟 AI 搜索结合起来和拍照结合起来,变成轻量级的,据说 Meta 眼镜卖了好几百万副眼镜了。在大模型的推动下,元宇宙、虚拟现实有可能梦想成真,大家想想智能硬件是不是会有机会?

第三个机会是,在中国做事情要顺势而为,国家很重要的战略是传统产业数字化,有一个词叫数转智改,也是新质生产力,大模型特别适合提升打造新质生产力。

如何帮助企业数转智改?大模型可以发挥很重要的作用。现在通用大模型肯定不适合给企业去用,我问过很多企业家和政府领导,通用大模型因为并不了解内部业务,所以说的话比较泛泛而言,而且这种聊天你们如果做过企业级应用就知道,这种 Coplot 的模式是企业最不能接受的。如果你们做过企业级应用就知道天天请一个聊天机器人回去,头三天还能有兴趣聊,长期对工作效率提升没有意义的。

在企业内部我也讲不要幻想用一个大模型解决所有的问题,企业内部将来一定是多个业务智能体的组合,背后是多个业务大模型,这目前是最大的市场,而且这个市场需要你沉到行业里,沉到客户里,,因为很难有通用的解决方案,这里面提供了比 SaaS 更大的机会。

第四个方向是未来和新兴产业。

比如说生物医药、具身智能(人形机器人)、低空经济(无人机),无人机是颠覆式的创新,还有就是智能网联车的自动驾驶到无人驾驶。这个行业里面如果不用大模型,这些行业都做不起来,因为大家想想为什么最近特斯拉 FSD 可以实现端到端的自动驾驶,端到端有两个说明,大家学术上是说基于训练学习的方法取代了基于规则的方法,用一个黑盒子系统,从输入到输出。也有人把它说明为从一个停车位到另一个停车位,不知道哪个说明更好。

第五个机会是打造科研新范式。大模型工作范式很简单,就是给我好的例子,经过足够学习之后就能产生举一反三的涌现理解,以后就能模仿;而基于规则,我曾经跟做自动驾驶的人聊过,他们大概自动驾驶的规则,像萝卜快跑就是基于规则做的,据说规则有几十万条,所以你要想吓唬一个萝卜快跑,只要把自己化装成熊猫在马路上过,我打赌百度肯定没有写规则,如果遇到熊猫在路上是撞上去还是应该停车。但是我在学驾照过程中深刻领悟到人的泛化能力,无论是否放个纸箱子,还是放一个塑料墩子,我都能灵活地绕过去。

包括具身阶段没有大模型的加持也是不可能的,原来深圳有一家企业叫优必选,大模型出来之前,它快成玩具企业了,他们机器人主要在表现团体操,但是有了大模型之后,这个企业就迅速地迎风而起,所以新兴行业对大模型的借鉴是非常多的。

AI for Science,我只能说个方向,这个具体我也不懂,但是值得关注,就是它是科研的新范式。

大模型的本质在于对语言、图像、视频和声音的理解,但其核心原理是将训练数据转化为一种序列,称为 Token。虽然「Token」这个词的翻译可能存在歧义,但从本质上来看,如果你能将需要处理的数据转化为 Token 序列,那么就有可能通过预测下一个 Token 来获得有意义的结果。这也是为什么 AlphaFold 能够成功的原因。它将蛋白质的结构视为一种序列,而人类已经研究出这些序列的规律,可以作为样本进行学习和微调。接着,AlphaFold 使用 Diffusion 方法随机生成各种可能的结构,并对这些结构进行判断。

这种思路不仅可以应用于蛋白质结构预测,也可以扩展到其他领域。例如,天气预报、股市预测、交通分析,甚至工业领域中的生产控制,都可以通过将行业数据序列化来进行处理。这时,并不需要依赖大语言模型的语言处理能力,而是要找到一种方式,将行业数据转化为可以进行序列化的形式。一旦数据能被序列化,Transformer 模型就可以用来尝试预测和推理。

我曾经发过一个关于人类长寿的视频,提出人类有可能活到 150 岁。虽然这个观点听起来似乎很极端,但美国在医学领域的观点也支撑这一想法。英伟达的创始人黄仁勋多次举例提到,人的细胞最终也会以一种序列的形式表达,而人类基因的表达同样可以视为一个序列,甚至新药分子的分子结构也能以序列的方式表现。研究人员认为,只要能够将某个领域的内容转化为序列,Transformer 和 Diffusion 等技术就能进行有效的预测和推理。

在中国,关注这个领域的人还相对较少。MicroSoft研究院的前院长马维英博士,现在在清华大学专注于医学和生物领域。我相信,未来会有更多的领域等待着通过 Transformer 和类似的技术进行改造和创新。

第六个场景,就是安全场景。

为什么要加这个场景?因为我是做安全的。这里面谈的主要是 AI 安全。在很多场景中都涉及到大模型的应用,AI 的安全性显得尤为重要。顺便提一下,最近 Ilay 提出了一些耸人听闻的观点,他认为未来的智能必然依赖于推理,而推理会带来不确定性,不确定性会导致幻觉,幻觉进一步演变为意识。因此,他强调了人工智能安全性的问题。但我个人认为,专业领域的大模型不太可能产生意识,就像你雇佣一个专业员工,他不太可能会摧毁你的企业业务一样。有超级人工智能才会对人工智能的安全构成终极威胁。通用人工智能方面只有几个问题:

一是数据隐私保护和数据投毒污染的问题;二、注入攻击的问题;三、幻觉;四、AIGC 产生的虚假信息问题。

大家提出的思路是以模制模,用魔法对付魔法,用专业安全大模型对付安全问题,所以安全问题不是今天重点。

如今,发展专业大模型的核心已经不再是大模型本身,而是找场景。找场景对大家最大的挑战,是要对某个行业、某个业务有深入的理解和了解,如果业务不了解,天天在玩大模型,天天用大模型做一些屠龙之技,在炫技,这个很可怕,再怎么炫,OpenAI 明天发布一个新功能,把技术一下就覆盖了,OpenAI 和这些巨头今天他们最缺的是行业和领域常识,这在美国也不例外,比如说现在美国有很多创业企业是悄无声息的在做金融的解决方案、医疗的解决方案。

我简单提出四个发展方向,或者说四个「十倍」目标:

一个方向是对上,满足老板和高管的需求,比如说这次张鹏推荐的做面试的一家美国企业,他们两头通吃,他们做了两个领域,先做人人智能领域,做了一个作弊工具,你面试的时候能够帮你在旁边提示如何回答面试官问题。他们又做了一个数转智改的应用场景,帮助老板解决如何利用机器,HR、主管面试个人的问题,所以想想都很美,大家都用他的App,机器人面试机器人,但他挣了两份钱。

第二个方向是对下,是面向员工,看员工有什么痛点和刚需?

第三个方向是往内看,企业内部如何提高自己的效率,内部有什么管理业务流程;

第四个方向是往外看自己的产品和服务体系能否找到企业的卡点,卡点的一个衡量指标是说能不能减少 10 倍的人力、降低 10 倍的成本、提高 10 倍的效率、提升 10 倍的体验。

我跟河北钢铁企业在谈的时候,谈到群体智慧,过去你想干、干不了的事,今天大模型能干了;过去你想解决、解决不了的困难,今天大模型能解决了,就找这种卡点和堵点,这就是大模型应该发力的地方。所以一定要细分场景,包括要把业务流程拆解的足够细,大模型初期的时候,我至少做了 100 个失败的案子,你们别听今天很多人上来说六小虎接了多少大模型的例子,其实很多项目都难以交付,我也吃过这种亏,刚开始大家对大模型都极其崇拜,有人来找我说,鸿祎,大家做个养猪大模型,也会有人说大家做个钢铁大模型,还有人说做个医疗大模型,你反问他一个问题,大哥,你要解决什么问题?你把他给问死了,因为都不知道要解决什么问题怎么做?最重要的是一定要细分场景。

举两个例子,河北省的钢铁是最发达的,大家都知道中国的钢铁含量不含河北,河北的钢铁产量不含唐山,唐山的钢铁产量不含迁安,大家就到迁安去了,他们最开始也说要提升钢铁的生产效率、提高钢铁的质量,大家都认同这个目标,但他们说要做钢铁大模型,我想没有钢铁大模型,只有细分的场景,所以他们就把钢铁的整个过程列出来了,把流程划成了 142 个场景,分的特别细,这 142 个场景,可能有些场景都能单独训一个大模型出来,或者单独做一个智能体,你要分到这么细的程度才可能解决传统企业数转智改的问题,否则只做一个问答、只做一个 Copilot、只做一个办公,这些通用方案都可以解决他们的问题,如果真的要直接提升生产力就得分析到这种程度,但这种程度,我觉得巨头一个都干不了,实在太细致了,OpenAI 也干不了,因为它没有这样的数据和常识。

再举个更简单的案例。这次我在美国见了一家跟王小川做同行的事情,但做法是不一样的,你们可以听听差别,对比一下,觉得是小川的好,还是这家企业的好,这家企业是中国小伙子创办的,他们跟斯坦福医疗中心签了一个约,美国看病跟中国看病不一样,我一会要去看病,直接到医院挂个号就行了,我想到斯坦福医学院挂号,人家不给我挂号,说需要你的家庭医生或者社区医生先看过,然后发传真,把你的病情情况先容给大家,大家再预约某一个时间来看病,他们把这个场景分的很细,发现了三个卡点或者三个堵点:

斯坦福医学院有 100 多人的队伍每天收传真,美国现在还在用传统的传真,传真才有法律效率,医生写字是全世界最潦草的,所以看传真的人都很费力,所以要打电话来回多次确认才能把你登记到数据库里,还要给病人打电话预约看病的时间,病人看完病之后要到保险企业报销,这也是一个挑战。

保险企业会拒赔,他们要请很有经验的专家有理有据的写一个为什么我这个病,根据我的诊疗过程,写最后能够报销多少,这家企业做了三个 Agent,相当于是三个大模型,第一个是多模态大模型 OCR 识别传真,现在比人做的好,可以把 100 多人看传真的队伍给取消掉了。

第二个场景是数字人用语音和病人打电话,因为这个打电话不是通用客服,是来回预约时间。

第三件事,他们把医院里历史上给病人写过的十几个万份给保险企业的报销报告训练成一个常识模型,人家不是一个通用写作产品,不是说给我写一篇小说,就是专门写如何给保险企业报销的。

他们就做这三件事,就是一个很了不起的项目,这就是典型的帮助传统企业数转智改,为什么医院愿意付钱?医院能算出节省的人力、能算出提升的效率、能算出工作量,这和大家原来做工具有个最本质的不一样,比如说很多时候企业买了大家的App,为啥中国的 SaaS 付费一直做不起来,一个很重要的原因是你的App有没有也不是特别重要,所以提高效率也很难算。

原来大家做的App是什么概念,还是人的工具,但今天 AI 在这些关键点上,AI 基于一个大模型,封装出来了 Agent,实际上是一个数字专家,是一个数字员工,完全可以直接取代人的工作能力,这个企业的付费意愿就比原来提升了很多。

04 如何做好专业大模型?

做专业大模型,最重要的有这几个点:

1. 常识管理。很多失败的例子,是因为客户的数字化做的不好,没有足够多的常识,比如说斯坦福如果收到的所有传真都销毁掉了,没有过去历史的数据做训练,这个事不一定能做到,如果过去写的保险企业的报告都没有了,可能也无从训练,所以常识非常重要。

2. 业务大模型打造。这就比较容易了,用通用大模型进行蒸馏变成基座大模型,而且从现在的趋势来看,微调用的越来越少,RAG 用的越来越多。

3. 构建智能体。Agent 就不展开讲了,因为 Agent 过去是一个技术辅助,但今天 Agent 成了大家今天给企业做做应用的核心诉求,最近我准备把我做的 APP 都改成 Agent,你卖一个 APP 给企业,听起来就像卖了一个App,App不值钱,但是我的 APP 全都变成了 Agent 之后,我卖的就是数字人,你雇一个人得 2 万块钱,我这一个月才 1000 块钱,多便宜,价值感马上就不一样了。

4. 融合工作流。为什么大家现在谈 Workflow?你们都知道 comfyui,它的功能强大,就是因为它知道很多节点只能完成单个任务和单个技能,很多时候大家要把技能组合起来才需要 Workflow,所以 Workflow 会变的很重要,因为没有 Workflow 你就做不出复杂的智能体,就做不出合作的智能体。

5. 常识管理。大家要有思想准备,这比训大模型还困难,真到一个企业之后,发现他的常识都是暗常识、浅常识,有些常识藏在大数据里,需要把大数据进行加工,有的常识存在人的脑子里,有的常识存在员工的硬盘里,有的常识存在工作流程中。比如大家经常说一看你就是新员工,一看这个人就是老员工,为什么?因为他有很多企业潜规则的常识,如何把这些常识能够训到你的大模型里去,如何能搜集出来?所以我提出一个概念叫常识捕获,采集都不一定采集得到。

6. 业务大模型打造,要做 RAG。

7. 构建智能体。智能体最早是调 API,我问个问题向大家请教,最近 Claude 推出 MCP,我的理解是用大模型做一个黑盒子,自己调 API,我觉得这个模式应该不 work,最好的模式还是应该由 Agent 来调 API,Agent 来调大模型,由 Agent 来做整体的协作,为什么?

因为 Agent 有个很重要的价值,要实现慢思考能力,这个能力是由 Agent 多次调一个或调多个大模型,当多个大模型协作的时候,Agent 它负责发起协作并在大模型之间进行有效的调度。

2025 年是 Agent 之年,包括把日常重复性的业务流程形成 Agent,自主性的响应。

8. 融合工作流。可以认为是 Agent 操作系统,就像今天人会用钉钉、企微,另外我听到上一个 Speaker 讲一人企业、两人企业,我这里吐槽一下,我认为不可能,别被这种东西忽悠,你们读一读赫拉利的书,智人之所以成功,因为智人是最懂得群体合作的,人一定需要团队合作。

所以大家企业级的,今天钉钉也好、飞书也好,并不是为 Agent 打造的,还是为人打造的,这在未来也是一个巨大的方向,相当于是 Agent OS,如何把 Agent 工作流能够做好,当然我不能透露大家在做。

大家有一点要向美国的创业者和投资人学习的,他们编的词特别打动企业客户。他们在重新定义 SaaS,SaaS 原来的定义是什么?Software as-a Service,现在他们重新谈了一个新概念,叫Service as-a Software,这就像绕口令一样,什么叫 Service as-a Software 呢?

过去有很多事是App干不了的,或者App只能起到辅助工具的作用,比如说看传真,虽然有了传真机,还得有人在读传真,往数据库里录入,写保险企业报销报告,或者律师给你写个文件,都是人写的,这个市场叫 Service 市场。

美国的 Software 市场大概是 1 万亿美金,但是 Service 人力市场是 10 万亿美金的市场。有了大模型之后,在一个细分的节点上,它可以取代人,或者可以该原来干不了的事,可以解决原来解决不了的困难了,意味着这个 Service 可以用App来干了,意味着App从原来 1 万亿美金的市场在往 10 万亿的市场上在侵蚀,这给大家做App的人提供了一个 10 倍的机会,从企业级市场到智能App反攻服务市场。

过去大家交付的是App,今天直接交付的是能力,换句话说,直接交付的是人力,我觉得未来 APP 还会在,看最近智能手机的演示,Siri 可以直接操纵各种 APP,甚至是智能体和 APP 最大的差别,APP 做的再牛,还是给人用的、是人的辅助工具,但 Agent 可以自主或者应人类要求独立地完成一个任务,换句话说,过去是工具辅助人创造价值,未来 5-10 年会变成 AI 直接创造价值,这就是各位最大的机会。

最近网上流传一个视频是在斯坦福的内部录像,主持人讲了一个故事,我可以把这个故事分享出来作为我的演讲结尾。大模型不是中心化云化的电力,大模型是去中心化的电动机。

亚星游戏官网-yaxin222


周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园


他讲了最早工业革命在电动机取代蒸汽机,用了 30 年,为什么用了 30 年?因为蒸汽机一般的企业很难用得起,所以一个工厂如果有一座蒸汽机,蒸汽机给工厂里所有需要动力的地方都提供动力,但是蒸汽机是通过很长的连杆来输出动力,所以连杆的强度有限,不能太长,工厂的布局是以蒸汽机、锅炉房为核心,来做工厂的布局和业务流程的设计。电动机刚发明之后,老板只是把蒸汽机换掉,换等了电动机,效率一点没有提升,也没有产生额外的价值,因为所有的东西都没有变化。

后来经过了 30 年的技术发展,人们的意识和技术能力突然发现可以把电动机做小,今天小到一个电动牙刷里也是一个电动机,实际上它和小米汽车用的电动机是一个基因发展出来的,但是一个 27000 转蓬勃有力,一个就是给你刷牙用。

人们把电动机做小之后、做便宜之后,突然发现工厂里的动力不需要中心驱动了,变成单元驱动了,所有需要动力的地方装一个自己的电动机就好了,就像我说的,甚至工厂的格局都变化了,工厂可以变成不同的车间、不同的 Location,不同的 Location 之间可以用生产线、流水线连起来,工厂的鼓风机,包括纺织机都有各自的动力。

所以你们想想,如果不是这样的革命,如果大家家里买一个电动机,这电动机一方面给大家当风扇用,又给大家当吹风机用,一会还给我刷牙,还给我刮胡子,可以想象一下多可怕,买了一个大电动机,啥活都干…… 这样一来,整个工厂的业务流程、管理体系,甚至商业模式都逐渐地发生了变化。

如果这里把电动机换成大模型,是不是很贴切?大家干嘛一定要相信用一个 API 也好,或者用一个中心的超级无敌通用的大模型来解决大家在企业内部不同地方遇到的不同的业务问题呢?

现在大模型的成本很低,有开源的,有免费的,大家把每个大模型只干一件事情,就当风扇用,就当传送带用,就当鼓风机用,这种新型的架构是不是代表了大模型将来在企业和在行业内部的应用场景?反正我是相信的。


来源:36kr

举报本楼

本帖有 3 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-1-22 12:20 , Processed in 0.640794 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图