国产算力=国产设备+国产材料+国产芯片+国产模型
久违的更新:国产算力闭环已迎来收获
哈喽,好久不见。很多天没有拍视频,因为终于给自己度过了一个像模像样的法定节假——劳动日,法定法定劳动节假日。
因为大家知道,真正的好学生,从来不会在开学的时候才想起来抄作业。就像我们的视频一样,我们已经用今年开年以来的这四个月的时间,持续地去给大家强调了整个国产算力的闭环生态:我们要用国产设备制造国产芯片,服务于国产的大模型,向全世界输出我们的廉价token。那么这中间包括着自主可控、先进制程、昇腾链、算力租赁等等等等,整个国产算力的闭环。
那么经过了这几个月的布局耕耘、底部提示与持续跟踪,我们终于在4月底的年报、一季报业绩披露期,集体迎来了收获。不光有我们在市场错杀时强调的算力租赁业绩报表,还有我们强调的、市场忽略的一个重要的半导体材料——半导体靶材业绩集体超预期;还有先进制程扩产的前道设备,以及后道封装和测试。而且这前道设备里面的光刻机,在我们提示了老美寄出史上最严芯片法案之后,先是演绎了克的逻辑,最近还新多出了光的逻辑;还有我们每次讲到先进制程的视频,都给大家提示的光刻胶,也用新高的业绩,证明了国产替代的进度和景气度。
所以正是因为我们早早地就把作业写完,甚至把答案都给你直接抄了,那么我想我给自己放个十天的小长假,不过分吧。而且我也不想让这一份很有成就感的事业,变成一个班味儿很浓的工作。那些天天催我更新视频的同学,不是假粉丝,就是新韭菜。因为铁粉丝和老粉丝都知道,胡总的视频就像这不断新低的白酒一样,越沉越香——我这不是贬低白酒啊,但是确实也是印证了我们说的,不要简单地用图去看什么高位和低位,而是要思考低位之下有没有更低位,高位之上有没有更高位。那么我们的视频里面讲到的逻辑变化,和后期的预期差与催化,这就是高位之上可能还有更高位的逻辑跟踪。
给新粉丝的提醒:前瞻性、长效性,重在低吸复盘
所以我也不知道假期间为什么一条视频都没发,却涨了几万粉丝。那么我也想对这几万新粉丝讲,我们的视频绝对不是来让你做短线参考的,而是有前瞻性和长效性,让你来去持续跟踪产业趋势的。所以不要对着我们视频去追涨杀跌。追涨,它不是一个很有技术含量的事,因为有可能只是你怕踏空而已;但是低吸才是真水平。在别人都恐慌的时候,你还敢去关注,说明你才是真的看懂了长逻辑和后期的价值与空间。
所以希望你多去复盘我们今年以来强调了整个国产算力的生态闭环,也希望你对我们接下来新的视频中,要有一个好的心态去应对,好的方法去消化,而不是什么涨了你就是华尔街之狼,跌了就是”我是大学生”。
豆包开启商业化:付费化背后的算力供不应求
那么言归正传。首先讲大家假期关注度比较高的豆包开启商业化之路,收钱了:标准版68、加强版200、专业版500。但是用风格的话,这是个好事,因为免费版它还是继续存在的。但是想搞PPT、想搞数据分析、想搞影视制作,对不起,得加钱。为什么呢?因为复杂的任务消耗更多的算力和推理,时间成本更大。现在豆包的日均token使用量,已经突破了120万亿,过去三个月翻了整整一倍,而且比豆包刚发布时增长了1000倍。
所以就像我的视频一样,目前还能白嫖的时候,不要太吝啬你的点点赞、关注、收藏、转发。要不是看到假期间突然多了几万粉丝,可能今天我都不拍视频,继续躺。
那么豆包这次的付费化尝试,是行业内具有标杆意义的。因为目前咱们中国的商业模式、生态环境,AI应用普遍面临着叫好不叫座的这个变现困境。那么豆包通过分层订阅探索高价值的付费场景,是对C端用户付费意愿的一次重要测试。此外,豆包付费来覆盖越来越高的算力和推理成本,这也是重要动因之一。所以这个现象,进一步验证了当前算力的供不应求。
那么短中期能解燃眉之急的算力租赁,中长期靠国产卡和H200引入而放量的AIDC,这些算力的稀缺性价值都进一步地凸显了。所以这就是今天盘面上算力租赁和AIDC继续领涨算力板块的原因。
全球算力紧缺涨价:从北美租赁价到黄牛报价
其实假期间美股还有一条重要的信息,就在5月4日的时候,北美的H100和B200的算力租赁服务价格,较4月30日,分别大涨了22%和6%,也带动了美股的数据中心和算力租赁板块大幅走高。这背后是北美几大云厂明确上调AI资本开支的指引,所以全球算力紧缺涨价逻辑进一步实锤。
包括我假期看到的黄牛群也能够验证:4月中旬的时候,一台B300的服务器现货报价还是545万元;到了4月30日,黄牛的报价已经来到了643万元;再到了五一假期快结束的时候,已经有自媒体的新闻标题称,B300的服务器价格突破了700万元。所以仅缺涨价、满产满销,这对散户和市场来说都是最容易触碰神经、造成话题、形成传播的题材催化剂。
所以算力租赁、存储,还有现在的CPU,都成为了能够中美共振、映射海外逻辑的北美算力最强方向。而且在这里面,GPU相关的算力租赁还叠加了一层管制的属性,它变相地收紧了供给,再加上需求越来越大,所以它的景气度是要额外更高的。说白了,不像存储和CPU那样涨价你就买得到,否则算力租赁业务谁都能做了。那么这就是咱们视频里面强调的拿卡能力,强者恒强。
在这里还要给大家额外提醒一个预期差:虽然服务器的价格是越来越高,将来算力租赁新签的服务价格也会水涨船高,但是头部的算力租赁玩家,其实他们的拿货价、也就是出厂价是没变的。因为他们自己就是英伟达全球云服务合作伙伴,能拿到最便宜的二手货源,所以他们的净利率要比那些去抢三手货源、700万一台B300服务器的二三线厂商要高得很多很多,因为没有中间商赚差价。
token分成模式:算力租赁的下一步
所以豆包在达到3.45亿月活用户之后开始收费,把付费运营和转化作为重心工作,一方面有利于AI应用付费习惯的形成,来降低算力投入的压力;另一方面也有利于与上游算力服务商形成token服务的商业模式。那么这就有咱们前面算力租赁里面讲到的一个重大信息差,就是token分成模式,二季度已经开始在逐渐落地了。这一块其实从老美的收购一致AI转型token工厂也可以看出,token工厂将是算力租赁的下一步。
首先大家要了解token工厂是什么。其实就是利润分配的模式升级。算力租赁厂商是按月向客户收取固定的服务器租金,而token分成模式并不是按卡计费,而是按照大模型实际产生的token调用量进行收益分成。那么在这个分配模式中,服务器的折旧和电力消耗,这属于刚性的固定成本,也意味着由token调用带来的超额分成收益,几乎全部都转化为了纯利润,这就为算力租赁服务环节打开了极高的利润弹性。
那么token工厂是什么呢?是算力生产与服务的新形态。token工厂是从系统工程角度出发,通过平台级调度、算力软硬件融合与模型推理优化,极致提升吞吐量与降低单token成本的数据中心体系。就像英伟达所提出的token工厂经济学一样,未来的计算设施将转型为专门生产token的工厂。那么token工厂的核心、新商业竞争指标,将从单纯的算力规模,让位于每瓦的token吞吐量以及能效比。
三者辨析:算力租赁、token分成、token工厂
那么讲到这里,再帮大家做一个更具体的拆分:算力租赁、token分成、token工厂之间到底有什么关联性。尽管token工厂和算力租赁均立足于AI基础设施的上游,但是两者在商业基因和管理重心以及核心壁垒上是存在本质差异的。
首先,token工厂是传统算力租赁的商业升级。传统算力租赁是重资产的资源生意,核心在于资本开支转化效率、算力上架率,那么客户购买的是底层硬件资源的物理控制权;而token工厂则是价值附加生意,在硬件基础上叠加了庞大的系统工程与调度优化,向客户输出的是经过加工的、标准化的智能内容——token。
而且,传统算力租赁厂商护城河主要建立于强大的拿卡能力、重资金周转能力,以及机器交付组网上限的运营能力;但在下一步的token时代,也就是说,拿卡或者是生产卡已经不再存在瓶颈的时候,那么token工厂的竞争焦点已经转移到了算力资源利用率的极致优化以及模型推理框架的适配上面。
token分成往往是token工厂这种新型体系落地后自然形成的商业模式变现路径。算力企业通过将算力租赁升级为token工厂、构建起平台级的调度能力之后,方能满足大模型厂商极高的合作门槛,从而切入高附加值的token分成模式之中。这就是三者的区别和联系。
机构调研:token工厂的收入分成与估值重塑
那么在之前算力租赁的视频中,细心的同学已经观察到了token工厂的出现。那么有了这家公司转型token工厂的先例,我们来了解一下机构与公司交流之中了解到的token工厂具体的收入分成水平,以及未来的估值重塑逻辑。
公司讲到,未来最核心的发展方向是算,但非简单的AIDC和算力租赁,而是采用token工厂的商业模式,将各类以闭源为主的模型部署在自身的算力中心,与模型公司基于API调用的token进行分成,预计公司将获得token收入七成。根据公司测算,token工厂模式盈利能力将远高于算力租赁,正常情况下,两年有余的周期就可以完全收回成本。
token工厂是算力服务的下一站。token工厂与算力租赁相比,从技术上而言更加需要平台和软件能力,从商业模式上与token的消耗量更加线性相关,相较于算力租赁模式有着更高的技术含量和盈利空间,未来将成为云厂商和部分算力服务厂商布局和转型的方向。而且公司今年将在乌兰察布云谷落地四个万卡集群,很快将启动二期项目建设,二期AIDC的电力容量将达到一期的十倍,并且通过多种方式具备300亿左右的资金规模,来支持算力业务的发展。
所以根据机构的交流,在token工厂这种深度的联合运营之中,对于算力是作为token推理成本的重头戏。也就是说,你现在大模型能力再好,没有token,你也没有收入。那么现在大模型厂商愿意将token销售收入的60%到80%作为收益分给算力服务商,自身仅保留余下来的份额。
但是大家也别光眼馋着那70%的分成收益,因为这一分成模式具备极高的壁垒要求:算力方不光要拥有庞大的集群规模,还需要出色的电力成本控制以及深度的系统级优化实力。以前传统的算力卡,单卡固定月租金处于2.5万到3万元区间,收益稳定,但是存在刚性的上限,可以说是5年内的一锤子买卖;但是在token分成模式下,除了不可少的保底租金之外,一旦日均AI调用量跨越了约定的阈值,那么算力方即可获得直接与应用变现挂钩的token分成。优秀的软件优化,甚至能让token服务带来的收入达到传统裸算力租赁的5~10倍之多。
落实到财务指标上,不仅能让收入大幅增加,还能带动毛利率和净利率,较以往单纯的算力租赁模式实现一倍以上的增长。所以头部的算力租赁运营厂商,净利率通过token分成的方式,有望从此前的10%到15%,强势逼近30%甚至以上。
精耕细作:token工厂如何大幅提升毛利
那么讲到这里,肯定有同学疑问:token工厂是通过什么样的精耕细作、软件优化来达到这么大幅度的毛利提升的?
大家记不记得,以前我们讲到传统的算力租赁,跟单一大客户一签就是万卡集群、5年合同,租出去只有一些运维工作,剩下的就不管了。但是token工厂是通过算力细切割,你用多少就收多少。这样带来的是什么?更便宜的价格、更强的竞争力、更高的使用率。然后白天用的用户、晚上用的用户是不一样的,是不是使用效率进一步提升了?然后你用三小时,他用五小时,没准你们俩之间时间不重合,是不是又提升了?你用复杂任务,他用简单任务,那我给你分配不同的大模型,这是不是经济成本又降低下来了?
所以综合来看,就是这种精耕细作,通过不增加成本的方式,大幅增加了毛利。而且现在的测算基础是每日有效使用时长约八小时,那么假设将来有效时长提到12个小时,那么算力使用效率又能提升50%。
那么至于价格呢?有人肯定也能从逻辑里面发现,这是将来从拿卡渠道、从缺卡转向到不需要拿卡渠道、不缺卡时的运营模式。那么将来不缺卡的时候,算力租赁的价格会不会下降呢?那么公司也解答了机构的这个疑惑:当前token工厂的收费标准为市场主流大模型的对外报价的七折左右。刚开始很简单理解嘛,招商引资嘛,互惠合作嘛,所以本身就是很具备市场性价比的价格。那么将来如果token价格下跌,但是有效时长提升,那么就可以抵冲价格的下降,仍然可以保持较高的收益水平,整体的持续性要比算力租赁传统模式短中期内的高盈利要更有持续性。
毕竟等全球的先进制程都扩产出来之后,也许27年年底、28年不再紧缺,那么那时候就开始拼谁能够精耕细作了。但是现在中美两国的厂商已经有提前试水、领先布局的公司,开始切入这个模式了。
token工厂的中长期叙事与估值空间
所以虽然短期内仍然需要大量的设备开支,仍然需要互惠合作,所以token工厂这个新的概念,炒的不是短期的业绩,炒的是算力租赁的一个新的分支,而且具备中长期的叙事空间,是下一代商业模式演进的方向。那么早接入的公司,早积攒这一方面精耕细作的经验,将来面对更庞大的算力规模,就能发挥出更高的效益空间。
所以市场对token工厂的议价权和长期现金流,要比传统的算力租赁显著改善。那么股价的波动减小了,弹性的利润的空间变大了,那么整体的估值也有望水涨船高了,打开了传统算力租赁行业模式的天花板和市值空间。虽然我们机构调研是以这家公司为例,但是大家要注意到我们交流中提到的信息差,就是这是算力租赁和部分云厂商下一步布局和转型的方向。所以大概率在接下来二三季度的涨价和进一步紧俏之中,大家可以看到越来越多token分成的落地和token工厂的出现。
泼一盆冷水:硬件高毛利无法线性外推
讲到最后呢,还要给大家泼一小盆冷水。因为大家看到了,自从我们4月11号那条视频之后,全市场对算力租赁板块的关注度,以及算力租赁龙头们的表现丝毫不减,就像去年11月24日我们提示商业航天之后那一波的机会的表现。那么很多就容易去线性外推乐观预期,认为算力租赁会无止境地去涨价下去,觉得无论多贵的价格都可以被下游传导。
但是我们在上一条视频里面也给大家说到了,大厂的专家已经测算过700万一台已经是盈亏平衡线了,再往上走的话,5年内你是收不回来成本。但是5年后还会不会缺算力?国产算力能不能顶上?那么接下来假如可能发生大厂出手联手控价、限价采购,或者说竞争对手之间出现相互举报,导致非合规渠道进一步收紧,或者说接下来的会晤放开H200,以及从八九月开始到明年,国产算力卡的先进制程产能要从翻一倍到翻两倍,那么这些情况出现的时候,你可能没有办法去提前预防风险,这是大家要思考的问题。
所以说,硬件的高溢价本质上是来自于算力的稀缺。技术的演进有一个残酷的规范:凡是足够贵、足够重复、足够刚需的东西,最后都会被整个产业链一点点优化掉。那么AI现在为什么要吃这么多的GPU、内存、CPU?因为很多模型还在早期,训练粗糙、推理昂贵、显存浪费、调度效率不高,而企业为了抢时间,只能买最贵的芯片和最高端的算力。那么一旦成本太高,整个行业就会自动进入降本模式:模型压缩、量化、剪枝、稀疏计算、新架构、编译器优化、推理加速、自研ASIC、边缘部署。本质上这些新技术都在做同一件事,也就是让同样的任务消耗更少的算力。
如今一个AI任务需要顶级的GPU集群,那么几年后可能只需要中端的芯片,有可能我们纯国产芯片都够了,那么再往后可能在本地设备上就能够跑。图像处理、视频编码、语音识别、搜索推荐基本上都已经走过这条老路。摩尔定律的经典速度虽然放慢了,但是单位计算的成本长期下降的趋势还在,推动力量从制程扩展到了架构优化、先进封装、专用芯片、并行计算和软件算法。
真正的护城河:从卖硬件到平台、生态与标准
所以今天我们关于token工厂的一线调研交流里面也强调了精耕细作。那么往后看,AI仍然会长期需要算力。比如谷歌的CEO在一季报的电话会议上说,我们最近的算力是受限的,如果能够满足需求,谷歌云的收入还可以更高,而且谷歌预计在未来24个月内消化50%的积压订单,这也意味着需求的能见度至少延伸到了2028年。所以虽然算力仍然是一个持续至少3年的结构性缺口,但是硬件的高毛利,没有办法像最近短期疯狂涨价的算力租赁、内存、CPU一样线性地外推,而且不少公司的涨幅里已经包含着很多未来的乐观预期了。
以前都说英伟达很强,有扩大生态网络、软件栈、开发者粘性,这些都是真护城河。可是把时间拉长,看到10年、15年,我们去看算法的效率提升、云厂商的自研芯片、推理成本的下降、开源生态的成熟、客户议价能力的上升,这些都会慢慢压缩硬件溢价。比如我今天放在小屏幕上的外媒报道的DeepSeek,估值逼近450亿美元,大基金领投谈判。这大基金以前是投什么?投中芯、投长存、投各种设备材料、投硬件;但是现在为什么开始来投软件、投模型?就是为了打通整个生态闭环,创造咱们中国设备、中国芯、中国模型的产业生态。
所以硬件赚钱是靠稀缺,但是软件优化会不断稀释这种稀缺。那么真正长期有复利的公司,不能只卖昂贵的芯片,还要变成平台、生态和标准。