← 返回归档

Token经济=算力租赁+国产算力+AIDC

04-15· 8855 播放· 7 弹幕· 14:23 在 B 站观看 ↗
看多 上证指数算力租赁昇腾大模型AIDC

AI 分析摘要

自动生成

agent智能体爆发驱动token消耗指数级增长,算力供需极度紧张;算力租赁吃海外高端算力短期价格弹性,AIDC吃国产算力放量中长期量弹性;昇腾950系列下半年放量是国产算力关键催化,马太效应下龙头才是正确标的。

大盘观点:AI算力主线确定性强,短期算力租赁领跑,中长期关注AIDC与昇腾链

提及标的

智谱AI 看多

一季度累计提价83%,提价后API调用量反增400%,需求严重供不应求

950系列算力密度与集群网络技术优势显著,国产算力中占绝对地位

全球唯3日均token超100亿,AIDC需求最旺,率先大规模招标第三方

腾讯0700.HK 看多

已开始大规模招标第三方AIDC,包圆存量资源抢占算力

转向大规模招标第三方AIDC,与腾讯同步进入抢占AIDC关键阶段

催化事件

  • 昇腾950系列5月大批量出货,下半年大规模放量(2026-05)
  • H200正式引入国内,提升AIDC需求能见度(2026年下半年)
  • 国产算力芯片下半年整体起量,带动超节点及芯片分销商业绩(2026年下半年)
  • 腾讯/阿里全面转向第三方AIDC招标,AIDC资源争夺加剧

关键数据

中国日均token调用量达140万亿(2026年3月)较2024年初1000亿增长超1000倍中国模型周度token调用量13万亿,连续5周超美国,占全球36%智谱AI一季度累计提价83%,提价后API调用量增长400%编程6-7小时消耗约4000万token,折合400-500元人民币7×24小时工作成本约800-1500美元/月,近万元中国程序员1100万,平均年薪20万,对应约2万亿盘子AI替代20%-30%程序员对应年化5000-7000亿收入昇腾950五月月产能达4万张今年中国约500万张AI芯片,需8-10万GW算力消耗现存AIDC指标头部算力租赁公司市值纷纷达3000亿以上

图文版

Token经济=算力租赁+国产算力+AIDC

不要对不了解的东西随便喊高喊低

今天算力租赁的头部公司基本上都创出了新高。希望借我们上周五的那条视频来告诉大家,不要对你不了解的东西随便喊高,而是要去找原因:高位为什么是高位,低位为什么是低位,高位以后有哪些催化和变化,会不会让它产生更高位?低位有哪些你不知道的坑?或者是说,这么多机构专家、专业投资者都没发现的机会,偏偏就让你发现了,那么这个坑会不会带来以后的更低位?

所以上一个视频里面,我看到很多评论:“老师,我这个算不算算力租赁?""老师,AIDC是不是没戏了?""老师,现在算力已经有泡沫了。“那么对这些小可爱呢,我想跟你们分享几个生动形象的数据和例子。

算力紧张的根源:Agent爆发与Token消耗

首先,我们前面的视频里面已经给大家讲了很多算力紧张的原因,源于agent智能体的爆发。多任务执行对比以前的单纯文本任务,对token的消耗是十倍百倍。那么随着token调用量的爆发,2026年的3月,中国的日均token调用量已经突破了140万亿,较2024年初的1000亿已经增长了超过1000倍,标志着AI大模型从低频对话迈向了高频执行任务阶段。

那么这是全球agent需求的爆发。更何况,这会儿大模型只是做到了帮助人类、甚至是替代人类工作的一个地步。我们接下来高科技的几个产业——无人机、无人驾驶、甚至还有无人操控的机器人,他们所需要消耗的算力还有多少?我想这个问题能够回答大家当下对算力的需求,甚至是那些泡沫的担忧。

中国大模型的全球市场地位与定价权重建

那么其次,中国大模型的全球市场地位。2026年3月,中国模型的周度token调用量已经来到了13万亿,连续第五周超过美国,占全球总调用量的36%,成为了全球AI应用最活跃的市场之一。那么这对应的就是,中国市场里的AI投资不再是以前的炒概念、映射美股的走势,而是真正有了自己独立的逻辑与行情,而且还成为了领头羊。

那么这背后呢,就是我们中国大模型定价权的重建。2024年,我们的行业那时候还是以价换市场,甚至是免费;那么到了如今的2026年,已经通过模型的性能——比如说代码编写能力、agent能力——来逐步地拉开差距,并且转向了价值定价。这怎么体现呢?智谱2026年的一季度累计提价了83%,而且在提价之后,API的调用量人增长了400%,需求严重的供不应求。

所以我们国内的大模型正在向海外快速看齐。像头部的智谱这样的大模型完成长链路的任务,单次持续工作时间已经能超过八小时,能达到交付工程级的效果,甚至达到了生产力级别,也就是从工具来到了创造。

Token消耗指数级跃升与机构估值测算

那么agent的爆发,尤其用到了大量的编程复杂任务,使得我们的token消耗指数级地越深。这里面包含着多轮的自我修正、上下文的膨胀、工具的调用频率。比如说整理邮件这样一个简单动作,都能触发5~10次的API调用。而且实测Coding类的套餐编程6~7小时,大概要消耗4000万token,这对应的就是400~500元的人民币。那么7×24小时的工作成本大概在800~1500美金,基本快要破万了。

那么大家肯定好奇,这凭空多出来的每月上万的token消耗是以谁为代价呢?那就是这些程序员们。那么我们机构现在面对AI大模型这样从未出现过的商业模式,正在以吞噬一切的一个姿态,在工作中、生活中迅速膨胀的时候,那么它的估值怎么估?我们也是打有很多问号。资本市场上一个月涨了三倍多,纷纷来到了3000亿市值以上,那么他们的市场、中间机构是怎么去测算的呢?

这是一个很悲催但很有趣的一个测算。国内一共1100万程序员,他们每年差不多要拿平均20万的薪资,这对应的是2万亿左右的盘子;还有同样要使用我们国产大模型的东南亚,还有300到400万程序员,他们年薪大概是12万左右,这大概对应的是三到4000亿左右的盘子。那么加起来2万4000亿左右的盘子,假如AI大模型要替代他们20%到30%的人员和收入,那么对应的就是年化5000亿到7000亿的程序员的年薪,转化成为了AI大模型公司的收入。然后再按照终局的一个格局,大概三家大模型厂商和三家头部互联网厂商的大模型来瓜分这五到7000亿的盘子,平均下来每家到时候有年化千亿的收入。这是一个终局思维。

但是刚开始机构这么算的时候,我也觉得有点扯,但是实际调研下来,我发现比我想象的进度要快很多。而且不光失业的是程序员,还有各行各业的人。那么他们现在在拿什么对冲呢?那么就是投资AI。就像当年18年我们去调研猪场的时候,那时候的散养户发现自己的同行在用无人机给自己的猪投毒的时候,他这时候去报复同行、继续卷没什么用了,他转手去买了养猪的股票。

买算力的两条路:算力租赁与AIDC

有了爆发且可持续、可预见的一个景气度趋势之后,那么这些互联网厂商和大模型厂商就都出现了一个反馈:非常缺算力,非常缺卡,算力需求供不应求。那怎么办?买算力、买卡。那么买算力分为两种:算力租赁和AIDC。

算力租赁,大家就可以理解为对应的是海外的高端算力,因为他们有所谓的拿卡渠道能力,而且这种能力只要有超额的利润存在就会一直存在,倒下去一个超威,还会冒出来99个超威。别说这些算力租赁厂商拿不拿得到最新的英伟达最高端的算力卡了,我都能拿到。我之前去调研的时候,还偷偷混入了人家黄牛群里,现在单个黄牛手里面就能攥着几百台B300的服务器。

而且超威出事了以后呢,其实卡的供给并没有改变,反而卡的价格还有所上涨。而且非合规渠道的卡转两手,那就不再有什么合规的问题,就相当于你买的港版iPhone,黄牛拿来的时候是有问题,到你手里面其实没什么问题,等你再卖给二手玩家的时候,那就更没什么问题,最大的风险是第一手货源承担的。所以他们也会要一些更超额的溢价。

那么这个溢价,算力租赁厂商接不接受呢?欣然接受。因为他们能通过算力租赁涨价的方式传导给这些大厂,大厂再通过token涨价的方式传导给终端用户,终端用户比起来涨价的那几个点,更关心自己的工作保不保得住。所以整个逻辑它是通畅的,是一个正循环。

那么算力租赁能吃到算力行业短期价的弹性。那么AIDC,由于他手里面是没有卡的,而且有待建AIDC需求的这些互联网大厂本身合规要求高,他也不能直接买这些非合规的卡放在他们的AIDC里面。所以他们在当前合规的H200还迟迟因为定位问题没办法正式引入的时候,只能靠国产算力来填AIDC的数据中心机房。所以AIDC吃的主要是一个接下来国产算力放量的量的弹性,它是一个更偏中长期的逻辑。但短期的这些算力租赁涨价涨的大头,主要是这些海外最高端的算力。

所以算力租赁,就是当前海外算力进不来、国产算力量不够的情况下,能解算力需求爆发但又供给严重不足的燃眉之急的最优解。听完这里,大家就能彻底搞清楚算力租赁和AIDC的区别了。

算力租赁的马太效应:强者恒强,弱者消失

当然,算力租赁里大家还要注意一个非常非常重要的逻辑,那就是上期视频我们的标题叫做”强者恒强,弱者消失”,它是具有非常明显的马太效应。具体逻辑大家回看完整的视频。但我要提醒的是,不要光蹭着一个算力租赁的概念,看着股价所谓的低位,就觉得它对标龙头有很大的补涨空间。并不是,反而是因为龙头吃掉了这些所谓的概念股的市场空间。

因为这些所谓的低位算力概念,过去因为没有拿卡能力,没有及时完成交付,其实已经在陆续地退出市场了。反而剩下的这些龙头公司要接更大的单,需要更强的资金能力,要有更多的收入和利润。蛋糕是在变大的,玩家却是在变少的。

那么经过我们调研了解,虽然算力租赁的这些下游客户,也就是这些互联网大厂、大模型厂,考虑低调行事以及合规原因,基本上不让这些算力公司再公告他们的大订单了——因为谁也怕用了海外的这些高端算力,被老美再次盯上来彻查算力卡的来源是怎么过来的——但是大家能够观察龙头公司不断提升的授信和担保,以及观察他们逐季度释放和加速的业绩,就能够了解到这个行业的景气度和确定性。上周那个被外围消息二次错杀的公司,就是一个非常好的例子。

AIDC的逻辑:从黑暗四年到起死回生

那么相比于依托着海外高端算力的短期涨价、业绩爆发的算力租赁来说,AIDC的表现就暗淡了很多。但是AIDC仍然有一个中长期的基本面趋势,而且AIDC的资源同样也很紧张。那么接下来我就给大家讲讲AIDC的逻辑,其实中间还有很多故事,跟算力租赁是环环相扣的。

大家可以回想一下2020年的云计算时代,当时云计算的巨头阿里、腾讯开始大搞AIDC建设。由于当时卡好买、功耗还不高、能耗环评的指标也比较好拿,所以大厂都是自建AIDC,降低了对第三方代建的需求,就更别提对算力租赁的需求了。再加上当时AI的需求又没有爆发,所以20年到23年一直是AIDC和算力租赁绑定双杀的黑暗4年。

直到2024年开始,字节跳动站出来,他的AIDC需求开始迅猛地爆发,带动了行业起死回生、触底反弹。而在24年、25年的时候,阿里和腾讯还没有那种居安思危的感觉,就是觉得自己之前已经大量地自建了AIDC,有大量的云服务,所以就不需要去继续大搞建设了。

巨头抢AIDC资源:腾讯、阿里被迫跟字节卷

但是到了今年,尤其是AI的智能体明显爆发之后,腾讯、阿里已经非常着急了,所以他们也开始杀出重围,有一个非常大的转变,就是他们明确未来不再进行大规模的自建,而是开始大规模的招标,第三方的AIDC已经开始抢资源,甚至是那种常年卖不出去的AIDC也被腾讯包圆了,阿里最近也在抢。而且巨头们都在非常急迫地让AIDC赶工交付,因为现在算力约等于收入啊。因为现在大模型光有能力不行,还得要有算力才能转化为收入,所以早交付一天都是早一天创收。

毕竟tokens都是建立在AI云的基础之上,你要有云就得有基础设施,有基础设施不行,你还得有卡,所以AIDC是给卡提供一个住宿环境的。而字节的火山云是发展得最晚的,也是之前规模最小的,再加上字节手里的AIDC指标也是最少的,所以基本上都是第三方代建或者是租赁。所以字节云一直以来都是非常焦虑的,从23年开始就在行业里面疯狂地找AIDC,经过24年、25年的超前建设,基本上很好的AIDC资源都被字节给包圆了。

现在腾讯、阿里也反应过来了,再不搞的话,整个行业的AIDC都是字节的了。所以现在腾讯、阿里没有办法高枕无忧了,必须得跟着字节卷起来了。因为字节现在token消耗非常快,全球唯三token消耗日均超100亿的只有字节、OpenAI和谷歌。所以他们也就进入到了抢占AIDC资源的一个关键阶段。

AIDC的非线性需求与资源稀缺性

因为他们都意识到了,随着agent智能体的爆发,算力不再像是以前文本推理大模型那样的线性增长,而是非线性增长。那么应对非线性增长,再加上AIDC它又是长达一年的交付周期,你必须得提前规划,所以现在AIDC的规划都是大幅的上调。

但是AIDC的资源又是相对有限的。AIDC的需求和AI芯片是完全挂钩的,总需求量约等于芯片的总功耗乘以二。如果说今年中国有500万张AI芯片,那么大概就需要八到十万GW的AIDC,那么基本上就能把现存的AIDC指标消耗殆尽。因为现在人工智能数据中心,也就是AIDC,比传统数据中心、也就是IDC的算力更高了,能耗也更大了,同时伴随着算力需求,体量也更大了。

那么这种超大规模的集群,首先它建立的周边要有丰富的绿电资源,而且最好那个地方气候条件比较好,能使得它的PUE值降到最低,全年不用开空调,这种对他的电费节省是最大的;而且还要满足政策要求,在东数西算的核心节点去拿能耗环评的指标。所以他的资源在去年审批踩了刹车之后,这个存量的资源是越来越稀缺的。只不过吃不到像算力租赁那样、一个月能够涨价三四十%的那种短期价的弹性,但是长期量的弹性也是比较确定的。

咱们A股的这些上市公司,AIDC是给大厂代建的。那么现在大厂能拿到的卡主要是以国产卡为主,也就是说随着国产卡的放量,芯片越多,那么AIDC的供需紧张、涨价的节点也就会越来越往前移。所以今年我们1月7日、8日连续给大家强调,AIDC等反转就是源自于这个逻辑。

至于后面反转的持续性和高度,那就要取决于H200的放开和国产卡的放量。那么H200正式引进国内,预计要到下半年,同时下半年也是国产算力放量的开始。所以AIDC经过了1月、2月的反转逻辑之后,在下半年还要等待这两个关键事件的落地,带来更高的需求能见度,才会支撑它的进一步放量。H200我们在前期也给大家做过了专门的视频。

国产卡盯紧昇腾:节奏、优势与产业链

国产卡,我们今年也强调了盯紧昇腾,我们也在节后全网最早地给大家提示了昇腾链的预期差。那么根据我们最近的调研了解,上半年是国产算力卡出货的相对低谷,下半年将逐渐起量,所以上半年出现了明显的算力缺口。其中昇腾的出货节奏整体是快于其他国产厂商的,预计4月份开始小规模出货,5月份的月产能可达到4万张卡。

同时,昇腾950系列在国内市场具有挤压性的优势。首先算力密度高于友商;其次,华为在系统级的能力上优势明显,尤其在光互联、高速连接、集群网络技术构建上取得了突破,而且这也是华为向来擅长的通信网络长板之一,这是竞争对手目前无法达到的。所以对于互联网大厂而言,若在国内采购,会优先倾向于算力密度更高、整机性能更好、集群连接更优的华为方案。而且下半年华为还会释放一部分先进制程的产能,其中对华为的产品是优先提供先进制程的保障。所以无论是需求还是供给,华为都在国产算力中占着绝对性的优势。

那么接下来,昇腾链在二季度会随着950PR芯片,从4月的小批量到5月的大批量,再到下半年的大规模出货,会逐渐地体现订单与业绩。而且下半年随着国产算力芯片的放量,也会带动超节点以及芯片分销商的收入和业绩。那么关于昇腾链以及更上游的先进制程扩产和后道测试通胀,我们还会在后期的视频给大家更完整、更详细的更新和介绍。

结语:警惕AI克隆诈骗

所以今天的视频,就是给大家把”token经济=国产算力+算力租赁+AIDC”这个大逻辑各环节之间的联系给大家梳理清楚,大家也好根据接下来的产业节奏去厘清市场的投资脉络。

同时大家最近也看到了,自从我们上周五发出了算力租赁的那个视频之后,全网出现了各个版本的模仿,甚至是一字不落的抄袭。更搞笑的是,已经有人用AI技术克隆模仿我的声音和视频,可能正在进行一些非法的活动。在此大家记住,我们不会以任何形式去私底下主动联系大家,大家要警惕上当受骗。同时也希望大家有这样最基本的分辨能力——如果你连真浮总和假浮总都分辨不清,那你更没法在市场上分辨哪些是机会、哪些是坑。