大模型不是吹出来的

2023-05-09 06:11:10 来源 : 北京商报

5月7日晚，在俞敏洪直播间内，三六零创始人周鸿祎谈及对当下火热大模型与ChatGPT的看法。他表示，国内大模型如果不经过两年模仿，上来就说超越，那叫吹牛。

作为这场热潮的积极参与者，360大语言模型产品一个月前问世，周鸿祎当时戏称“自己的孩子”，抱出来给大家看看。

【资料图】

OpenAI的产品出道即巅峰，但能客观认识彼此差距，周鸿祎的发言可谓人间清醒，毕竟是圈里见过大场面的老人了。

大模型遍地开花，不仅百度、腾讯、阿里、华为、京东等科技巨头均有布局，一众科创企业也纷纷官宣自己的大模型产品。

无论是先来者，还是后到者，大模型让一度沉寂的中国互联网圈嗨起来了。新产品层出不穷，ChatGPT风口上的诸神混战才刚刚开始。

大模型之前，AI的商业化还饱受质疑。有人试探，有人观望，有人潜心于此，有人浅尝辄止。

大模型之后，互联网公司们亲自下场，没人能笃定谁是中国的OpenAI，能做出来成功的大模型产品。不过，可以笃定的是，这个技术对中国很重要。

大模型缔造了某种共识，它是工业级的，是应用型的，具备落地的现实场景，给各行各业都能带来工业革命级的推动。

市场上过度狂热还出现了一种尴尬的局面，有的企业明知道还没完全准备好，却不得不积极地在推进模型发布，似乎稍微晚一点就会错过全世界。

“所有产品都值得用大模型重做一遍”，这是入局者对大模型前景的普遍信仰。但大模型的成功不会一蹴而就，别忘了OpenAI一战成名前那默默无闻的七年。

百花齐放，不再稀缺是好事儿，把好事儿做好前提是清醒的自我认知。以自身业务基础及大公司本身的算力储备与资金实力，去官宣一个大模型不难，市场门槛也不高。

现如今大厂选手大模型动态层出不穷，本质还是过去几年技术积累，及未来可持续的研发投入、参数规模、人才储备及算力升级。

国内外大模型的商业路径差异明显，ChatGPT、Midjourney、Notion AI或者Stable diffusion等等，都以C端用户为基本盘。反观国内，大模型的主要应用场景都在B端，B端更窄，因此更容易进行商业化。

两种路径孰优孰劣，现在下结论还为时尚早。相比海外，场景拓宽、用户拓宽会助力大模型成长，也一定会加强训练互相越来越了解，未来可能实现弯道超车、后来居上。

兴奋归兴奋，重要归重要，冷水要泼在前头。在此之前，王小川给出的追赶时间表是三年，这个时间未必精准，但这个过程不可避免。大模型依然是一场艰苦的“创业者”之战，革命尚未成功，量变到质变才考验真功夫。

北京商报评论员陶凤

标签：

推荐文章