大模型不是吹出来的

2023-05-09 06:11:10     来源 : 北京商报

5月7日晚,在俞敏洪直播间内,三六零创始人周鸿祎谈及对当下火热大模型与ChatGPT的看法。他表示,国内大模型如果不经过两年模仿,上来就说超越,那叫吹牛。

作为这场热潮的积极参与者,360大语言模型产品一个月前问世,周鸿祎当时戏称“自己的孩子”,抱出来给大家看看。


【资料图】

OpenAI的产品出道即巅峰,但能客观认识彼此差距,周鸿祎的发言可谓人间清醒,毕竟是圈里见过大场面的老人了。

大模型遍地开花,不仅百度、腾讯、阿里、华为、京东等科技巨头均有布局,一众科创企业也纷纷官宣自己的大模型产品。

无论是先来者,还是后到者,大模型让一度沉寂的中国互联网圈嗨起来了。新产品层出不穷,ChatGPT风口上的诸神混战才刚刚开始。

大模型之前,AI的商业化还饱受质疑。有人试探,有人观望,有人潜心于此,有人浅尝辄止。

大模型之后,互联网公司们亲自下场,没人能笃定谁是中国的OpenAI,能做出来成功的大模型产品。不过,可以笃定的是,这个技术对中国很重要。

大模型缔造了某种共识,它是工业级的,是应用型的,具备落地的现实场景,给各行各业都能带来工业革命级的推动。

市场上过度狂热还出现了一种尴尬的局面,有的企业明知道还没完全准备好,却不得不积极地在推进模型发布,似乎稍微晚一点就会错过全世界。

“所有产品都值得用大模型重做一遍”,这是入局者对大模型前景的普遍信仰。但大模型的成功不会一蹴而就,别忘了OpenAI一战成名前那默默无闻的七年。

百花齐放,不再稀缺是好事儿,把好事儿做好前提是清醒的自我认知。以自身业务基础及大公司本身的算力储备与资金实力,去官宣一个大模型不难,市场门槛也不高。

现如今大厂选手大模型动态层出不穷,本质还是过去几年技术积累,及未来可持续的研发投入、参数规模、人才储备及算力升级。

国内外大模型的商业路径差异明显,ChatGPT、Midjourney、Notion AI或者Stable diffusion等等,都以C端用户为基本盘。反观国内,大模型的主要应用场景都在B端,B端更窄,因此更容易进行商业化。

两种路径孰优孰劣,现在下结论还为时尚早。相比海外,场景拓宽、用户拓宽会助力大模型成长,也一定会加强训练互相越来越了解,未来可能实现弯道超车、后来居上。

兴奋归兴奋,重要归重要,冷水要泼在前头。在此之前,王小川给出的追赶时间表是三年,这个时间未必精准,但这个过程不可避免。大模型依然是一场艰苦的“创业者”之战,革命尚未成功,量变到质变才考验真功夫。

北京商报评论员 陶凤

标签:

推荐文章

X 关闭

最新资讯

X 关闭