当前位置: 首页 > 资讯 > > 内容页

世界热点评!云从科技欲募资 36 亿投大模型:“强者恒强”游戏里如何与巨头竞争?

发布时间:2023-04-16 16:16:35 来源:ZAKER财经

ChatGPT 的火热,让国内不少互联网、AI 企业纷纷加码大模型。比如云从科技(SH688327,股价 41.95 元,市值 310.71 亿元)近期就拟募集 36 亿元投向 " 大模型 "。

曾经的 AI,是 CV(计算机视觉)的天下。就国内而言,最受瞩目的 AI 公司当属 "CV 四小龙 " 商汤科技(HK00020,股价 2.93 港元,市值 980.64 亿港元)、旷视科技、云从科技和依图科技。ChatGPT 的横空出世,令 AI 产业的焦点迅速从视觉转为语言,从 CV 转为 NLP(自然语言处理)。


【资料图】

在语言大模型时代,CV 四小龙之一的云从科技又将何去何从?特别是大模型追求 " 强者恒强 ",可能将是少数巨头的游戏。在算力 " 军备竞赛 " 中,云从科技能否跟上巨头的脚步?

值得注意的是,云从科技已被列入实体清单。这意味着公司采购海外厂商生产的高端 AI 芯片存在限制,比如目前最火热的 AI 芯片当属英伟达 A100 和 H100。对此,《每日经济新闻》记者 4 月 13 日致电云从科技。其工作人员表示,(上述芯片)此前有一点库存,公司也在与国内厂商合作。

少数玩家的游戏

互联网、移动互联网的兴盛,使得各行各业崛起了一大批细分领域的巨头。AI 的兴起,同样在各细分领域百花齐放。比如 CV(计算机视觉)领域的 " 四小龙 ";语音领域的科大讯飞(SZ002230,股价 59.18 元,市值 1374.80 亿元)、思必驰。

而大模型时代,游戏规则骤然改变。算力的 " 军备竞赛 ",导致大模型成本高企,可能仅有少数巨头能够负担。

据国盛证券计算机团队测算,以英伟达 A100 芯片、DGX A100 服务器、现阶段每日 2500 万访问量等假设为基础,估算得出:在初始算力投入上,为满足 ChatGPT 当前千万级用户的咨询量,投入成本约为 8 亿美元,对应约 4000 台服务器;在单日运行电费上,参考美国平均 0.08 美元 /kwh 工业电价,每日电费约为 5 万美元,成本相对高昂。

此次云从科技欲募集资金 36.35 亿元,用于云从 " 行业精灵 " 大模型研发项目。其中,场地购置及装修费 5.54 亿元,研发设备购置费 20.94 亿元,人力资源成本 7.60 亿元,其他费用 2.27 元。

投资明细。 图片来源:云从科技定增预案截图

算力投入应属于研发设备购置费。照此计算,云从科技欲投入不超过 20.94 亿元用于算力投入。

截至 2022 年三季度末,云从科技货币资金 12.47 亿元。2022 年第三季度,上市公司营收 6479.03 万元,同比下降 80.07%;归母净利润 -2.64 亿元。2022 年前三季度,上市公司营收 4.55 亿元,同比下降 41.53%;归母净利润 -5.89 亿元,经营性现金流净额 -5.29 亿元。

从云从科技财务数据看,初始投入之后的训练费用、运行电费对其也是较沉重的负担。据国盛证券计算机团队,基于参数数量和 token 数量估算,GPT-3 训练一次的成本约为 140 万美元;对于一些更大的 LLM 模型(如拥有 2800 亿参数的 Gopher 和拥有 5400 亿参数的 PaLM),采用同样的计算公式,可得出,训练成本介于 200 万美元至 1200 万美元之间。

据天风计算机团队,参考 GPT-3 的发展历程,OpenAI 从 45TB 的文件中过滤出 570GB 的数据集,仅训练费用就高达 1200 万美金,随后 OpenAI 经过约 3 年时间不断探索,中途有 InstructGPT、davinci 不同版本的尝试,最终在 2023 年发布了 GPT-4,打造一个有竞争力的大模型需要数据、算法等资源的持续投入。

强者恒强

那么,云从科技是否可以与巨头进行差异化竞争,做一个 " 小而美 " 的垂直行业领军者?

在信达证券看来,参数量超级庞大的模型在任何垂直领域都具备优势,垂直细分的小模型难有生产空间。因此,信达证券认为在大模型格局未完全形成之前,参数量的无上限堆砌是各家企业发力的焦点,故算力的 " 军备竞赛 " 无可避免。

据天风计算机团队统计,百度 Ernie 大模型参数量约为 2600 亿,京东言犀、商汤商量 SenseChat 参数量为千亿级别,腾讯混元 AI 大模型参数量为万亿级别。华为盘古 α 参数量为 2000 亿。

据云从科技公告,2020 年,OpenAI 发布的 NLP 大模型 GPT-3,实现了千亿级数据参数,大模型也成为了超大规模预训练模型的代名词。2022 年,ChatGPT 的出现更进一步确定了大模型作为人工智能主流技术路线的趋势。

可以看出,各大巨头的参数级别为千亿级乃至万亿级。

图片来源:天风计算机团队公众号 " 牛骨挖掘机 "

为何各家都在比拼参数量?信达证券认为,从论文研究来看,参数量的提升有助于构建语言预测模型的精确度,同时提高泛化能力。泛化能力的提升意味着一个参数量超级庞大的大模型,其在垂直细分领域的预测能力可超过针对垂直领域开发的中等参数量模型。

这意味着,做大模型似乎只有成为巨头,才能避免被边缘化。

天风计算机团队也认为,拥有一个大模型并不难,但是持续打造一个有竞争力的大模型难度很大。虽然国内有众多厂商推出了大模型,但从终局的角度看,大模型终将收敛并稀缺。参考 OpenAI 在海外的发展历程,大模型需要连同生态一起进化,形成强者恒强的格局。

芯片何来?

中航证券研究所认为,在 ScalingLaw 的框架下,只要追加数据与算力,大模型的能力就能持续增强。对 OpenAI 而言,目前大模型的最大限制是数据和算力的总量。

或许,大模型之间的竞争,已经转为对数据与算力资源的争夺。

对于云从科技而言,由于公司被纳入美国 " 实体清单 ",购买模型训练用的高端芯片面临限制。即使资金充足,能否成功获取庞大算力所需芯片呢?

云从科技定增预案显示,2020 年 5 月至今,美国商务部宣布将包括公司在内的多家中国公司及机构列入 " 实体清单 ",该行为不会对公司日常对外销售、客户拓展等产生重大不利影响,但可能对公司研发和项目交付过程中采购境外厂商的芯片、服务器等器件产生一定限制,尽管公司已制定国产器件替代的产品方案,但由于方案落地需要一定验证时间、客户对使用替代器件的产品认可具有不确定性等因素,可能会对公司的生产经营产生一定影响。

简而言之,对销售影响不大,影响主要是采购境外厂商芯片、服务器。

对于芯片问题,《每日经济新闻》记者 4 月 13 日致电云从科技,其工作人员表示:" 首先有一部分库存,然后我们和国产芯片供应商之前也完成深度适配。"

该工作人员也表示,具体芯片问题公司在 2 月份投资者活动记录表有回复。记者查询后了解到,云从科技芯片的采购分两类。第一类:公司过去向英伟达采购部分芯片用以训练侧方面,公司具有一定量的库存储备且国产化的训练芯片水平也已经在快速提升中。第二类:过去两年中,公司在国产化硬件适配方面稳扎稳打,已与华为、寒武纪(SH688256,股价 195 元,市值 782 亿元)、曙光等提供芯片和服务器的厂商完成了深度适配。

值得一提的是,云从科技一度研发过 AI 芯片,如承担工信部 " 基于自研 SoC 芯片的高准确度人脸识别产业化应用 " 等国家级重大项目建设任务。

而根据云从科技招股书,其表示公司所处的人工智能行业尚处于发展初期,未来发展趋势存在较大不确定性,相关技术及各应用场景的定制化解决方案迭代速度快,技术的产品化和市场化亦具有一定的不确定性。2020 年,由于芯片设计成果未达预期,且 EDA 软件和生产流片遭遇限制,公司终止了 " 人工智能 SOC 芯片研制及结合高准确度人脸识别技术的产业化应用 " 项目。

也就是说,云从科技终止了自研人工智能 SOC 芯片。

每日经济新闻

推荐阅读