科技

图片由AI工具生成文丨李海伦编辑丨徐青阳这是一种“长期战略价值”和“短期现实矛盾”的极端情绪释放。过去一周多,A股商业航天板块上演了一场“过山车”。前期集体拉升、龙头市值快速重估,随后的1月13日又突然出现集体跳水,十余只个股跌停,短线情绪从兴奋转向观望。这种短线的暴涨暴跌,充分体现了资本市场对商业航天的复杂心理——既有政策利好、技术突破带来的想象,也有对未来不确定性的担忧。在这样的大背景下,也影响着筹备IPO的商业航天公司们。2026年1月初,当蓝箭航天出现在中证协公布的首批现场检查名单上时,舆论的焦点迅速聚焦在蓝箭的亏损数字上:从2022年起到2025年上半年(约三年半)累计亏损近35亿元,而2025年上半年营收仅3643万元。这组财务数据引发了大众一个直观的疑问:这正常吗?一家连续亏损的公司,凭什么能走到IPO这一步? 在科创板设立之前(传统核准制时代),A股主板、创业板等板块的上市审核确实对公司财务状况有严格的盈利要求,其中包括但不限于“连续盈利”或“累计净利润指标”等条件,这导致了很多亏损公司无法通过审核进入资本市场。但随着2019年科创板推出的五套差异化上市标准,为高研发、长周期的硬科技企业打开了一扇新门。2025年12月26日,监管层更进一步,专门针对商业火箭企业发布《上海证券交易所发行上市审核规则适用指引第9号——商业火箭企业适用科创板第五套上市标准》从业务范围、技术属性、行业地位等七个维度,细化了适用第五套标准的具体要求,给商业火箭公司发了一张可进入资本市场的“身份证”。当盈利不再是唯一标尺,对于投资者和观察者而言,理解商业火箭企业的IPO更多的关键,在于理解几个核心问题:商业航天的亏损究竟特殊在哪里?这个行业的盈利拐点何时到来?二级市场的机会又在哪里?商业航天只有完成“入轨 → 复用 → 批量 → 降本”的闭环,利润结构才会发生根本性变化。这是SpaceX经过21年才盈利的过程,而一大批商业航天公司正在经历这个阶段性的闭环。 01 当亏损是常态当舆论聚焦蓝箭航天累计的巨额亏损时,一个容易被忽略的事实是:蓝箭航天并非个案,而是整个商业火箭行业的常态。目前,多家正在推进科创板上市辅导的商业火箭公司,包括星河动力、中科宇航、天兵科技、星际荣耀等, 它们大多尚未实现稳定盈利,仍处于“技术验证”的关键阶段。中科协航天科普专家颜翔表示:“商业火箭企业普遍亏损并非偶然,而是行业必经路径,因为这是一门高技术门槛、重研发投入的产业,前期必须经历大量实验与测试,成本巨大且无法绕开,因此早期收入必然难以覆盖支出”。颜翔认为,这种结构主要体现在四方面: 一是源自军工与科研体系,不具备互联网式低成本试错路径,必须先把能力做出来再谈商业模式;二是市场仍处萌芽期,客户集中在政府、军方和科研机构,发射需求有限、收入规模偏小;三是行业处于规模预期阶段,未来如星座建设与卫星互联网放量后,需求才会真正扩大,现在的亏损更多是在“押注未来”;四是行业正向液体火箭与可复用技术迭代,这些路线本身投入更高,大量融资被用于试验与技术积累。 更关键的是,火箭行业的“产品验证逻辑”极为特殊:只有成功入轨,才能证明产品可用;而要做到成功入轨,必须先经历大量的投入和失败。这形成了一个残酷的悖论:不烧钱就没有产品,没有产品就无法证明技术,无法证明技术就拿不到订单。 这个悖论的另一面,也解释了为何这些企业“动辄烧掉数十亿,却只赚回几千万”。 以蓝箭航天为例,从披露的公开招股书来看,其营收主要来自火箭发射服务和技术开发服务两块,这两块目前规模都很小、波动较大,远不足以覆盖巨额研发和运营成本,这也解释了它“烧钱多、收入少”的核心矛盾。 此外,一位航天从业者表示:“商业火箭的客户决策周期极长。一个卫星发射项目,从意向到签约,往往需要1-2年;从签约到实际发射,又需要数月甚至一年的准备期”。收入确认滞后于研发投入,这是行业特性决定的。因此,在这种财务结构下,“亏损”更像是研发期间的生产成本,而不是商业失败的结果。02 亏损上市的底层逻辑在这样的行业背景下,企业想熬过关键阶段,单靠自己撑不住,所以必须借助资本市场来继续往前走。一位券商分析师说:“对于火箭企业而言,真正意义的商业拐点并不发生在‘第一枚火箭入轨’的那一刻,而是发生在大规模生产能力形成、重复使用技术成熟、发射频次足够稳定的阶段。这个过程需要是几十亿元甚至上百亿元的持续投入”。 在这个量级下,传统VC资金和政府项目制投入已经无法满足需求,而银行贷款又无法支持“高研发+低收入”的资产结构。资本市场因此成为商业航天的关键燃料:它可以提供更低的成本、更长的周期,以及更可持续的资金来源。对企业而言,上市不是终点,而是跨过产业化阶段的台阶。在这个意义上,“亏损上市”并不是异常,而是全球深科技行业的普遍路径。 从竞争角度看,商业航天是一个“时间换空间”的赛道。谁越早完成技术验证和产能扩张,就越可能在未来星座部署、低轨通信、太空基建等市场中占据位置。以 SpaceX 为例,Falcon 9 率先实现一级回收与多次复用,在有限时间内完成技术验证和高频发射,迅速拉开成本差距,抢先占据了全球商业发射市场空间。 在制度层面,中国的资本市场正主动为这类企业打开窗口。科创板第五套上市标准明确允许“未盈利但具有核心技术、属于重点领域的科技企业”上市,这意味着明确接纳深科技行业的“亏损属性”。换言之,制度本身已经回答了“亏损能不能上市”的问题。商业航天领域早期投资机构元航资本创始合伙人陈东说:“此次开放未盈利商业火箭公司上市,本质上是国家战略意志、产业发展规律和资本市场功能的一次交汇对接,核心是利用资本市场服务国家重大战略,催化关键产业的发展”。 陈东认为,现阶段仍属商业航天发展的早期和研发的重投入期,商业火箭企业上市能够极大拓展其融资渠道,是支撑其挺过投入期,迈向回报期的关键一步。03 上市之后的变化 上市对一家火箭企业最直接的影响,首先发生在钱的流向上。 一位商业航天从业者指出,商业火箭公司的上市是一次从“实验室逻辑”到“工厂逻辑”的迁移。 一方面,资金流向会发生变化。上市前的资金主要用于“证明火箭能飞”,上市后的资金将用于如何“让火箭能批量飞”,“让火箭能便宜地飞”,这意味着供应链、产能、可复用能力和标准化服务体系会成为投入重点。元航资本创始合伙人陈东强调,商业火箭企业上市后首要任务不是继续做“科研展示”,而是尽快提供可交付、可靠的商业运力。陈东说:“如果上市之后还停留在科研型、演示型阶段性的成果里,而无法形成稳定的商业发射能力,二级市场不会买账。”在他看来,上市既是商业火箭企业发展的加速器,也意味着更严格的商业化要求与兑现周期。 另一方面,客户结构会发生变化。企业与客户之间的信任基础也会随之提升。比如火箭企业的早期客户主要是政府、军方或科研机构,合作模式往往是项目制、试验性质的一次性采购。在这个背景下,客户也会产生很多顾虑:这家公司能不能活到下一次发射?技术路线会不会中途调整?团队会不会因为资金链断裂而解散?上市提供了一种可信度背书。财务透明、监管约束、持续融资能力等,这些都会降低客户的决策风险。更重要的是,上市意味着企业不再是“活一天算一天”,而是进入了资本市场的可持续运行轨道。 从长远来看,商业航天一旦完成“入轨 → 复用 → 批量 → 降本”的阶段性闭环,利润结构将会发生根本变化。这也正是SpaceX经历的路径:亏损累计十余年,近五年随着星链与高频发射实现现金流转,直到2023年第一季度首次被披露实现盈利。 更深远的影响发生在产业层面。 有商业航天从业者说,过去很长一段时间,中国商业航天更像是几家企业各自“单打独斗”。为了能够把火箭造出来,每家公司都会自己搞发动机、做结构件、建测试台架,几乎什么都要自己来。这种全能型打法在验证技术时是必要的,但到了“量产”阶段就会变成负担:成本高、效率低,也带不动一条完整的产业链。一旦企业上市,带来了更稳定的资金来源,也让企业能够提前制定采购计划和产能规划。当头部企业开始给出明确的批量需求时,上下游供应链才有理由投资设备、扩建产线、做专业分工,产业链也就从“跟着做研发”,逐渐转向“做专业制造”。这才是商业航天走向规模化的关键一步。 04 变现拐点何时到来当然,上市不是终点, 是一场从未被验证的转型的起点。 SpaceX用了近21年才首次盈利,这21年里经历了无数次失败、质疑和濒临破产。中国的商业航天企业能否缩短和穿越这个周期,仍是一个开放性的问题。过去几年,商业航天的关注点几乎全部落在“能不能发射成功”这一问题上。入轨、回收、垂直降落等技术节点构成了行业的兴奋点。但对于一家商业公司而言,“能飞起来”只是入场券,距离“能赚钱”还隔着一条长长的路。这其中,需要穿过几个关键的拐点。 第一个拐点:重复使用运载火箭何时真正落地 对于中国商业航天企业而言,这个拐点正在逼近。2025年12月,蓝箭航天的朱雀三号遥一运载火箭二级进入预定轨道,一级进行了返回回收场的试验,成为中国首枚发射且入轨成功的重复使用运载火箭。 不过,业内人士普遍认为,技术验证不等于商业化落地。“可重复使用技术的真正价值,体现在能否实现高频次、低成本、高可靠性的常态化运行”,一位商业航天科普专家说,“这需要火箭不仅能回收,还能快速翻新再飞;不仅能回收,还能实现90%以上的回收成功率;不仅一级可回收,二级、整流罩也能回收复用。这需要数十次甚至上百次的发射迭代”。第二个拐点:商业卫星市场爆发 如果说重复使用运载火箭决定了商业航天能不能“降本”,那么商业卫星市场则决定了火箭产业能不能“放大”。这背后有一个简单的逻辑:没有卫星,就没有发射需求;没有需求,就没有规模效应。目前,火箭发射的客户来源主要分为两类:第一类是国家队与科研机构,包括执行重大航天工程和科学探测任务;第二类则是商业卫星公司,例如从事遥感、物联网、通信等业务的企业。从理论上讲,商业航天的火箭主市场来自第二类客户。无论是遥感卫星、低轨通信卫星、还是物联网卫星,都必须通过火箭入轨完成组网、补网和更新换代。目前来看,商业卫星市场仍处于早期阶段,并没有形成足够大的“发射频次需求”。 不过,卫星应用本身的商业场景在未来会很快发生结构性变化, 走向“行业级大规模部署”。根据国际电信联盟(ITU)官网最新披露的信息显示:2025年12月25日至31日期间,我国正式向ITU提交了新增约20.3万颗卫星的频率与轨道资源申请,覆盖14个卫星星座体系,并涉及中低轨道资源。这是我国迄今为止规模最大的一次国际频轨集中申报行动,也意味着未来低轨卫星组网与商业部署的空间正在被提前规划。 届时,谁的火箭便宜、可靠、发射频率高,谁就能吃到这块蛋糕。第三个拐点:规模化生产,成本实现大幅下降 现在商业火箭企业大多是“手工作坊”模式。每枚火箭都像定制品,生产周期长、成本高。如果哪家公司率先实现流水线生产,像造汽车一样造火箭,成本就会断崖式下降。 举个例子,一家商业火箭公司目前一年发射几次,每次都要动员大量人力物力。但如果年发射量达到20次、50次,很多环节就可以标准化、自动化,火箭零部件批量采购价格能降30%,地面测试流程压缩一半时间,发射团队的人力成本被摊薄。这时候,单次发射成本会迅速下降,毛利率从负数变成正数。总的来说,对于即将登陆二级市场的商业火箭企业们来说,上市只是万里长征的第一步,后面还有更难的关卡。 这是一场时间与资本的赛跑,也是一场技术与市场的博弈。推荐阅读商业火箭上市新规落地:散户能“刷火箭”了,谁最受益?“国家队”出手,可回收运载火箭长征12号甲首飞首富又要“上天”,梦想价值10.6万亿  ...
本文来自微信公众号: 六镇 ,作者:跑哥的自留地所以就想着把我看到的北京生活,尽量原原本本说一下。很多人一提北京,第一反应就是物价贵、生活成本高。这话不能说错,但问题在于,北京并不是一个单一的价格体系,我把这座城市称为“拼接城市”。你在北京怎么活,花多少钱,差别非常大。先说第一个问题,北京收入到底多少。说实话,我也说不清楚一个“整体水平”。因为我能看到的,也只是我身边那一小圈人。这些年待得越久,反而对这个城市的收入情况越迷糊,只能说几个我知道的,大家自己感受一下。商场里的导购、小妹,一般四五千;跑外卖的,普遍八千往上,这段时间天冷,回老家的多,留下来的据说一个月过万并不难;本科毕业去外包公司,一般一万多,这也是北京这边上班族最常见的收入水平;985毕业进大厂,年包二十万起步比较常见,三十万也不少,极少数能直接干到70万以上。前些年要高一些,这两年稍微有点下降。再往后,就完全没法概括了。毕业干个十来年,差距会被拉得非常大。有的人一年能挣几百个,有的人一年也就十几个,哪怕起点差不多,走到后面,也完全不是一回事。一般在码农这个行业,工作十多年之后,普遍集中在30-50这个数。你说真有那么高吗?主要是京城就跟个“ETF指数”似的,是个不断筛选程序,如果成家立业收入上不去,就走了,所以剩下的人普遍收入较高。此外它对“新人”和“老人”要求不一样,咱们一会儿展开说。这也是为什么在北京,你很难用一个数字,去概括“大家过得怎么样”。公开统计口径也有个数字,大概就是平均一万多一个月。接下来咱们聊关键问题,北京是不是很费钱?说实话,是的。尤其是那种不是北京土著,而是通过高考或者工作来到北京,两口子在这边成家、生孩子、扎下来的,又没有家里托举,花钱的地方会特别多。叠加这些人普遍都是“卷王”出身,自带焦虑、攀比、不安全感、鸡娃buff,大部分活的都挺累。买车买房得花钱,买了之后还得不断花钱。北京不少小区的物业费本身就不低,房子要是稍微好一点,绿化、人车分流、地下车库干干净净,那这些费用往往比普通社区高出不少,有的甚至能翻一倍。这些支出跟其他城市比,确实偏贵。但真要说起来,它们还不是最要命的。最容易让人觉得“钱不够花”的,其实是孩子。孩子的花销,是一个很难控制的东西。哪怕你自己没什么攀比心,孩子回来跟你说,同学假期去日本了、去海南了,还给自己带了礼物,你心里多多少少都会动一下。你不一定马上跟,但会觉得是不是也该带孩子出去看看。节假日出行基本只能在高峰期,机票、酒店都贵,人还多,一趟下来玩的不咋好,钱也不少花。再加上课外班,在北京,一节课三四百很常见,一个月八节就是两三千。当然这只是下限,没有上限。那些所谓的名师、奥赛课,一节课几千块也不稀奇。吃饭方面,如果不去景区,价格其实还行。普通餐馆人均一百出头,两百算不错了。日常吃饭加周末偶尔下馆子,一个月三五千基本跑不了。北京穿衣方面整体风格偏“土”,大多数成年人对穿着没那么讲究,这点比上海要省一些。但很多家长不太愿意在孩子身上凑合,孩子的衣服往往会贵一点。还有一个绕不开的大头,就是房贷,这是刚性支出。对很多普通家庭来说,一个月一万左右并不少见,一年下来就是十来万。这么算下来,其实你还没干什么特别“中产”的事,一年二三十万就已经花出去了,二三十万税前得接近四五十万。稍微放开一点,花销很容易到四五十万。如果住在条件比较好的小区,孩子上私立,还是二胎,一年再出几次国,花到几十万甚至上百万,在北京也不算什么新鲜事。一线本来公司就多,而且多少都有点能耐才能活下去,这些公司里稍微级别高点的收入普遍不错。叠加山河四省和东北那边很多土豪的孩子也在北京上私立,所以会显得有钱的特别多。当然,网上经常刷到的那种万柳书院式的生活,已经完全是另一个世界了,每次出现那种“豪门少爷”,评论区就会狂刷“误闯天家”。我作为一个混了很多年的不大不小的V,这种倒也接触过不少,但他们占比太小了,就不展开了。这里顺便说一下很多人容易被影视剧误导的东西,比如高尔夫球。电视剧里好像是个中产就打高尔夫,北京确实也有不少高尔夫球场,但现实里,真正经常去玩的人非常少。或者说,偶尔体验一下有,长期玩的人极少。一年赚几十万的那种中产,基本不会碰这东西,毕竟这东西一年咋都得四五万,拿出收入的10%去玩这玩意,多少有点离谱。现实中玩这个的,多半是做生意的,把它当成社交工具。对大多数在北京上班、拿工资的家庭来说,高尔夫并不在生活选项里,也确实玩不起,实在不划算。说这些,其实是想讲一个事实:很多人想象中的“中产生活”,在北京也不多,或者说,不属于绝大多数人。电视里那种豪车豪宅,高尔夫球场,孩子上全外语的私立,一年百万花销是打不住的。而且人在北京,很容易活在自己的同温层里。你看到的,往往都是比你强的那一批。北京这个城市的一个特点是,上限高得离谱。盯着一个高得离谱的天花板去生活,时间久了,大多数人心里都会不太舒服。这时候就有人会说,不对啊,官方公布的人均消费也就五万左右,三口之家十五万,怎么到你这就二三十万了?原因其实也不复杂。很多人是没房贷的,尤其是土著家庭,房贷一去,支出立刻少一大块。另外,北京本地人是那种见过世面的,安全感也足,整体心态比较松,对孩子补课没那么执着,也能省下不少钱。如果说有条线把这个城市生活的人划分成两拨,那这条线绝对是“生孩子”,孩子一出生,消费立马暴涨。这就牵扯出了北京的另一面,那些不在北京养孩子的人,又完全不一样了。这就牵扯出了另一个问题,就是这个城市内部的物价差距,非常大。同样一串糖葫芦,二环内有的地方卖十四块,到了回龙观、天通苑五六块就能买到。凉水河这边,亦庄路边一碗兰州牛肉面三十多,过了河到马驹桥,只要十二块。差距就是这么明显。也就是说,同样在北京生活,一个白领一天花七八十吃饭、喝咖啡,体验可能也就一般;同样的城市,一个外卖员一天花二三十,也能把饭吃明白。我之前在今日头条说过,外卖员在北京一天吃二三十,评论区不少人不信,后来一看IP,基本都不是北京的。北京本地的,反而都在解释,说北京吃的并不算贵。这个城市很奇怪,它并不是大家想象的那样,按照“环”来区分,而是“片”,一片一片的,有些区域商底超级少,物价很贵。但走不了多远,另一个片可能就是平价区。码农们把这个现象叫“通胀区”和“平价区”,在通胀区赚钱,在平价区生活。哪怕在二环内,也有不少平价的吃饭地方,只是游客一般找不到。你要求不高,二三十块也能吃饱,不会觉得特别艰苦。我还见过路边十块钱的盒饭,三素一荤,无限续饭,旁边站着一圈外卖员和干活的老哥。更别说北京周边还有不少村,物价甚至比河北一些地方还低。很多人觉得北京贵,很大一部分原因,是他们是来旅游的。景点附近的物价,本来就离谱。写字楼里的白领点外卖,二三十一份起步也很常见。一杯咖啡,便宜的七块,贵的二十多。还是那句话,北京给不同的人,分配了不同的生存空间。你一晚上吃喝花几十万没问题,你一天二三十,也能把日子过下去。这也是为什么不少北京本地人收入并不高,但看起来并不拧巴。房子是自己的,心态放松,电子产品、衣服在网上买,全国一个价。自己去菜市场买菜,生活成本跟小城市差不了太多。房子当然还是贵,这个没法洗。哪怕网上说跌了很多年,真去看,价格还是能把人吓一跳,三四百万想弄个适合三口之家的房子非常费劲,要知道,你背两百万的贷款,大概每月就得还一万左右。北京出了名的通勤时间长,其实就是时间换空间。北京那些热门上班区,国贸,西二旗等等,如果住在附近,一套一百平左右的两居室,一万多很正常。两人合租,也得五六千一个人。对大多数普通家庭来说,扛不住,只能往远处住。所以北京的通勤才会这么夸张。很多人一天通勤两三个小时,在这边也不算少见。城市太大了,大到一个小时以内的通勤,大家都觉得还行。在北京待久了,就像我开头说的,会发现它更像是好几块拼在一起的城市。有很光鲜的一面,也有非常普通的小市民生活。很多北京本地家庭,一个月收入五六千,也能在二环里过日子,这些内容在短视频平台上都能看到。说了这么多,最后还是回到那个问题:年轻人要不要去北京。我的答案一直很简单,除非你有更好的追求,比如要去为人民服务,否则都应该去看看。对普通人来说,卖的无非是时间和精力,那就去更值钱的地方卖。一线城市为什么成本高,本身就说明这里收入高,不然这些钱给谁了。你说安家之后压力大,那就先别安家。北京很多大厂里,年入大几十万的,有不少都是一个人在北京赚钱,等干不动了再回老家和家人会合,他们眼里,北京是通胀区,老家就是平价区。跑滴滴、送外卖的,绝大多数也不在这边安家,就是看中这里收入高,赚一波就走。至于买房,买不起就不买。年轻的时候攒点钱,去外面的世界转转,买点自己喜欢的东西,这些东西基本上全国一个价,不会因为你回了老家就便宜。干不动了再撤,我身边这样的人是多数。北京人排不排外,我也不好评价。我在这边十几年,跟北京本地人的生活几乎没有交集。我们这些外地人,身边基本也都是外地人,彼此在各自的轨道上。最后说一句。大城市不会给你承诺,它只是给你一个舞台。你把时间、精力、野心放上去,它会给你称一称,然后把你配得的那一份还给你。过程不会轻松,但回报通常也不算差。北京不是天堂,但它确实是少数几个,普通人还能靠自己往上走、重新定义自己的地方。这也是为什么很多人到了该回去的时候,反而迟疑了。但是共识的问题是,这里不是给人幸福的地方,以至于有句话,说“人人都该去北京,等哪天离开的时候,去拿都觉得很幸福”。全文完,喜欢就三连吧。

115万片晶圆,决定2026年的“芯片战”,苹果、联发科、OpenAI火线入局

编者按:以定力致远,以重构图新。大象新闻、大象财富联合腾讯新闻、中国商业科技新闻网推出2025年终策划《定力与重构》,回望2025、展望2026,让洞察照见本质,向变革寻求确定。文丨吴梓豪编辑丨苏扬“未来六个季度数据中心收入5000亿美元。”黄仁勋在GTC25上说。2026年1月6日开幕的CES 2026,老黄又宣称90%的ASIC项目会失败,这实际上是对此前谷歌TPU为代表的ASIC芯片(专用集成电路)的口头“讨伐”,一场针对ASIC的全面围猎已经悄悄开始。很多人会关心,GPU、ASIC竞争的终局如何?答案是取决于半导体战争的终极弹药库——台积电CoWoS先进封装产能。这意味着,只要对台积电CoWoS产能预订、分配情况,进行颗粒度拆解,就能精确测算出2026年AI算力芯片的出货格局。可以说,2026年“芯片战”,系于台积电115万片CoWoS晶圆产能。GPGPU与ASIC阵营对垒,图片由AI生成01 战争的起源我们先对GPU和ASIC的战争背景做一些铺垫(有行业基础可跳过本部分)。人工智能对算力的需求扩张是共识,但必须明确:更先进的计算架构、工艺制程和先进封装,是三个关键路径。关于架构,谈到最多的是GPGPU(通用图形处理器),英伟达在这条路上,借助CUDA生态的20年铺垫,成为通用并行计算的绝对王者。硬件层面,英伟达的核心武器有两个:HBM内存极高的带宽、GPGPU大规模流处理器阵列。从H200、GB200到2026年1月推出的“Vera Rubin”,都是这条路径的产物,性能提升直接与显存带宽、NVLink互连规模挂钩。GPGPU之外,以谷歌TPU为代表的ASIC芯片,探索出了另一条更精准、定制化的架构——云端推理侧的负载日益固化,为特定算法(如Transformer)定制的ASIC芯片,能够展现出碾压级的能效比,即每瓦性能和总拥有成本(TCO)优势。谷歌的TPU、亚马逊的Trainium都是这条路径的先锋。博通、Marvell、Al chip等设计公司,正是通过为这些云巨头定制ASIC芯片,撕开了AI芯片万亿市场的一道口子。相比架构竞争,工艺制程这条路径显得更好理解,从7nm、5nm、3nm到2025年底量产的2nm,每一次制程跃进都意味着晶体管密度和能效的提升。不过,工艺制程是一条高门槛的路径:进化速度越来越慢,成本越来越贵,2nm晶圆代工价格高达3万美元,入场费已非所有玩家都能承受。此外,工艺制程的微缩还将面临“功耗墙”和“存储墙”。架构、制程之外,第三个关键路径是先进封装,以CoWoS(Chip on Wafer on Substrate)为代表的先进封装是台积电为高性能计算打造的“皇冠上的明珠”。CoWoS封装概念图,来源:台积电CoWoS的精髓在于异构集成,将多个小芯片,例如计算芯粒(GPU/ASIC核心)、高带宽内存(HBM)、I/O芯粒等,通过中介层进行超高密度、超高带宽互连,集成在一个封装内。表1:CoWoS中介层面积变化趋势这种方式可以突破单芯片光罩(掩模板)尺寸限制,中介层面积当前可达2800mm²,直接好处就是晶体管更多,HBM显存更高。另外,由于CoWoS采用了硅中介层,上面的微凸块(μBump)间距极小,芯粒间通信带宽激增,延迟和功耗大幅降低。正因如此,无论是追求极致性能的英伟达GPU,还是追求最佳总拥有成本的云巨头ASIC,但凡涉足顶级AI算力,都离不开CoWoS。所以,在2026年这个时间点上,当制程进入2nm深水区,成本高企,架构路线出现根本性分叉时,CoWoS先进封装的产能分配,就成了决定算力版图的最关键变量,没有之一。02 产能图谱:台积电CoWoS的供给格局表2:台积电CoWoS产能爬坡情况从我们掌握的情况来看,过去三年,台积电CoWoS产能一路从单月12K晶圆,逐步爬升至2025年底的80K/月,2026年年底的预估目标是120K/月左右。取一个全年有效平均值:96K/月,即2026年台积电CoWoS总有效产能约为:96K/月 × 12个月 = 1150000片晶圆,这是AI芯片战的总弹药基数。产能分配原则这1150000万片晶圆如何分配,背后是一场基于技术、商业、地缘的复杂棋局。按照优先级,英伟达作为CoWoS最早期、最大胆的共同定义者和投资者,其架构(如NVLink)与台积电CoWoS工艺深度耦合,毫无意外可以拿到最多。按客户层级,由于 苹果、英伟达、AMD是台积电前三大VVIP级客户,其巨额预付款和长期协议锁定了基础产能。不过,苹果要到2028年才有自研AI芯片。另外,博通、Marvell因承接谷歌、AWS、Meta等云巨头天量ASIC订单,已跻身顶级VIP客户行列。另外,对台积电来说,除了ASIC以外,AMD、英特尔乃至中国客户,都是制衡英伟达、分散客户风险的重要力量,也会分得一部分产能。产能分配明细总体来看,产品需求最旺、单价最高、技术最领先的英伟达有望拿到其中近60%的产能;AMD的预定量在90K左右,占比接近8%,相比2025年有64%的增量,增幅几乎与英伟达一致。当然单一客户CoWoS订单激增,也包含了中介层放大的因素,但对于业绩的贡献必然是正面的。不过也要强调,更复杂、集成度更高的封装(如集成更多HBM、更大中介层)初期良率较低,实际有效产出需打折。表3:CoWoS产能整体预订和分配情况整个ASIC阵营,大致可以划分为博通、世芯(AI Chip)、Marvell和联发科几家,其中博通是领头羊。博通2026年预定量大幅增至200K,同比增122%,主要受谷歌TPU外供拉动,但博通主要负责TPU v6p以及v7p,偏向推理的v7e由联发科负责,会在2026年下半年推出。未来TPU v8还是会遵循v7的模式,由博通与联发科两家下单CoWoS。博通的200K预定量,按客户预订情况大致拆分如下:第一大客户谷歌TPU预计分得200K当中60~65%第二大客户Meta的MTIA大约占博通预订量的20%左右第三大客户OpenAI将于年底推出内部代号Titan芯片,台积电N3制程,预计占今年博通预订量的5-10%,2027年将达到20%+2028年,苹果的AI ASIC芯片Baltra也将面世,目前由博通负责高速互联,SerDes IP以及后端布线,预计2026年上半年进入流片阶段。表4:ASIC阵营的CoWoS产能预订和分配情况相比之下,由于AWS下一代Trainium 3转单世芯(Al chip),Marvell显得比较失意,主要客户还是AWS的Trainium 2,好在新客户微软采用N3E制程的Maia 200加入,才避免了下滑,CoWoS预定量与2025年持平。世芯由于拿到了AWS Trainium 3订单,CoWoS预订量上升到60k,同比增加200%,大部分预定产能为N3制程的Trainium...

MI455X芯片+72卡机架,2027年冲2nm,苏姿丰:4年算力涨1000倍

文丨苏扬编辑丨徐青阳黄仁勋在CES2026上的演讲过去不到3个小时,人称“苏妈”的AMD CEO苏姿丰就带着AMD的AI全家桶登台亮相。为了给自己产品铺垫,苏姿丰开场大谈推理需求的暴涨,强调算力接下来将进入Yotta Flops时代(1Yotta Flops=1,000,000 ExaFLOPS,即每秒可执行10的24次方次浮点运算)。针对这一变化趋势,AMD的解决方案是最新的MI455X GPU,并且基于72颗MI455X GPU和18颗Venice CPU,打造了一台开放式72卡服务器“Helios”。苏姿丰展示MI455X GPU苏姿丰强调称,MI455X系列相较于MI355X拥有10倍的性能提升,其公布的路线图显示,2027年将推出基于2nm工艺,搭载HBM4e内存的MI500系列。“未来四年,要实现AI性能1000倍的提升,”苏姿丰说。01 苏妈的“算力核弹”AMD GPU路线图这张路线图清晰地展示了AMD INSTINCT系列GPU路线图。最强大的是2027年要上市的MI500,届时将会导入2nm工艺,采用HBM4e内存,AI性能又是一次巨大飞跃。如果MI455X的性能是MI355的10倍,对照官方折线图,粗略量化一下,MI500的提升可能是MI455X的30倍。不过,抛开PPT上的故事,明年下半年的重点产品还是MI455X和“Helios”机架。不过这里比较有意思,在说MI455X的时候,官方晒的是一张MI450的参数对比图。按照苏妈的说法,2026年上市的MI450,相当于MI300X+MI350,堪称阶梯式的创新和性能跨越。升级的核心思路和英伟达的逻辑一样,借助HBM内存,实现显存、带宽和算力三个维度扩展,打破AI推理的“内存墙”限制。这种升级的好处体现在三个方面:首先是更强的扩展能力(Scale-up),更大的显存意味着能装下更巨型的模型;其次是更高的生成效率,通过极高的带宽解决了“出字速度”慢的问题,提升了每秒Token的输出量;最后是极高的QPS(每秒查询率),让服务器在单位时间内能同时响应更多用户的提问。MI450在主流的FP8精度下提供了20PF的算力,性能表现接近初代的4倍。不仅如此,FP4精度下能达到40PF的极高性能。机架方面,根据官方资料,Helios总共18个计算托盘,一个计算托盘采用1颗Venice CPU+4颗MI455X GPU。部分细节虽未详细说,但从现场的配置来看,其中Venice CPU采用2nm工艺,总计4600个核心,MI455X GPU则采用了3nm工艺,总计18000个计算核心,搭配总计31TB HBM4显存和43TB/s的总带宽,提供2.9Exaflops的FP8算力。AMD也强调,Helios是一个通往Yotta级计算扩展的开放式机架平台。02 AI PC的故事端侧AI不是附加值,而是必需品展示完机架级“算力核弹”之后,苏姿丰将叙事重心拉回到个人设备,并给AI PC下了一个明确判断:AI PC并不是云端AI的替代品,而是下一代个人计算的基础设施。AMD在本次发布中正式推出Ryzen AI 400系列处理器。该系列采用Zen 5 CPU架构与RDNA 3.5...

万亿IPO神话即将在2026上演,但“小独角兽们”已经崩盘

文|晓静编辑|徐青阳刚刚过去的2025年,资本市场上演了一场前所未有的“科技冰火秀”。一边,是刚刚敲钟上市的科技新贵们,股价如断线风筝般坠落。曾经炙手可热的明星公司,市值在几个月内蒸发数十亿美元,其中不乏跌幅超过50%的惨烈案例。市场的“寒意”迅速蔓延,让一大批计划上市的明星公司心生畏惧,不得不将IPO计划一再推迟。而另一边,资本的“热望”却熊熊燃烧。一个全新的“万亿美元俱乐部”正在资本市场大门外集结。从埃隆·马斯克引领的航天帝国SpaceX,到山姆·奥特曼麾下的OpenAI,再到蓄势待发的Anthropic等巨头,它们正以动辄数千亿、上万亿的估值,筹备着科技史上规模空前的超级IPO。冷与热,破灭与狂欢,撤退与进击。这场冰与火的淬炼,是市场回归理性的开始,还是资本走向极端分化的序曲?2026年的钟声已经敲响,这场“冰火两重天”背后的逻辑是否还会持续,资本未来的流向是否已经改变?01 2025年科技IPO回顾:破发与暴跌的寒冷2025年,尽管全年科技公司上市数量出现复苏迹象(约23起,较2024年显著增加),但整体表现惨淡:超过三分之二的公司股价已跌破发行价,中位数跌幅达9%,大幅跑输同期上涨近18%的标普500指数。但是,短暂狂热过后,科技股跌回冰冷现实。在众多明星初创公司中,Circle(稳定币发行商) 成为极少数的幸存者:受益于政策利好,上市首日暴涨后虽有回落,但目前仍稳守涨幅,是唯一站稳脚跟的赢家。相比之下,其他独角兽的表现则不尽如人意。Figma 在上市初期曾引发热议,但因AI竞争加剧及增长放缓,股价已从高点大幅坠落。而以 Klarna(分期支付)、StubHub(票务平台) 和 Navan(商旅软件) 为代表的企业,上市后市值集体蒸发数十亿美元,暴露出二级市场对“亏损换增长”模式的排斥。表现最差的是加密货币交易所 Gemini。受财报亏损和监管压力的双重打击,其股价较发行价已惨遭“腰斩”,暴跌达58%。图:2025年进行IPO的科技公司股价表现另外一方面,资金正以前所未有的耐心博弈“稀缺性”。 尽管中小市值科技股因流动性不足与信任周期延长而举步维艰,但 SpaceX、OpenAI 和 Anthropic 等超级巨头的入场,有望凭一己之力重燃市场热情。这种极端的两极分化表明,二级市场的审美已发生扭转:投资者不再为“增长故事”买单,而是不计代价地挤进极少数“必须拥有(Must-have)”的头部赛道。相比之下,平均市值约83亿美元的中小型上市科技公司面临更高估值门槛、流动性不足和信任建立周期延长等问题,难以吸引指数基金与零售投资者的持续关注。这种局面的背后折射出严重的“信任断层”。一方面,公司创始人和风投机构不甘心调低估值上市;另一方面,公众投资者在AI泡沫的阴影下,对企业的盈利前景和内部套现变得极其敏感。加之银行归咎于环境动荡带来的定价难题,多方博弈陷入僵局,最终导致了谁也没能从中获益的尴尬局面。这种寒意正迅速传导至计划2026年上市的公司。如企业差旅软件Perk(原TravelPerk)等公司已将IPO计划推迟至2027年,若2026年市场情绪未明显改善,或许将出现大批“排队等待却不敢敲钟”的潜在上市企业。从历史视角看,2025年的复苏仍远未达到繁荣水平。Accel Analysis和Qatalyst的数据显示,软件与AI领域IPO数量在2019-2021年达到高峰期,分别为13起、19起和46起。随后经历了2022-2023年的崩溃时期,分别为零起和1起,到2024-2025年进入复苏阶段(4起和8起)。图:从2010年到2025年,每年软件与AI领域IPO数量不过,2025年软件与AI领域IPO数量仅为2021年峰值的二分之一左右,低于2010-2018年年均9-10起的“正常”基准。这表明,科技IPO市场距离真正常态回归仍有较长距离。图:2025年软件与AI领域8起IPO回报情况失败案例剖析:高估值与市场现实的碰撞Navan的经历十分典型。这家企业差旅管理平台在2025年10月上市,估值轨迹犹如一条抛物线:从2022年G轮融资时 92亿美元的巅峰,缩减至IPO定价时的 62亿美元(25美元/股);上市首日收盘再度破发,股价跌至20美元,市值仅剩 47亿美元。讽刺的是,Navan 并非空壳公司。它拥有 6.13亿美元 的年滚动收入(增长32%)以及超 1万家 企业客户,其业务规模坚实且具备真实造血能力。然而,市场定价逻辑已发生巨变:同样的企业在2021年能轻松获得 15-25 倍的市销率(P/S),但在2025年的环境下,即便仅给...

2026年的机器人零售,像卖手机一样

文|郭晓静编辑|徐青阳2025年12月31日,宇树全球首家线下品牌体验店在北京双井京东MALL开业。一个小女孩,在商场里抱了抱店里摆放的人形机器人,转头对妈妈说:“它好凉。”2025年年初还在春节晚会上扭“赛博秧歌”的宇树机器人,在2025年的最后一天,已经站在店里,让小女孩能够感受到冰凉的金属触感。店面装修是极简科技风,灰白色调,整齐摆着四只宇树Go2机器狗和一台G1人形机器人。机器狗售价1-2万,店员说现场付款就能带走。一台高端手机的价格,可以买一只机器狗;一个类似手机旗舰店的门店,就能把机器人直接买回家。这家店试图用“卖手机”的方式,撬开消费级机器人市场的大门。但是,现实真的能如其所愿吗?图:线下店展示的宇树G1人形机器人01 “赛博秧歌”带来的“一机难求”2025年1月28日蛇年春晚,创意舞蹈《秧BOT》成为焦点。舞台上,16台宇树H1人形机器人身着东北大花袄,整齐划一地扭起大秧歌,甚至完成了精准的“转手绢”和“接手绢”动作。这一幕让普通人对人形机器人的认知发生了改变,从实验室里的机械架子,到拥有高灵活度、甚至能承载传统文化的“新物种”。春晚表演结束后的2025年2月,宇树在京东平台首发了多款机器人产品。其中,消费级的Unitree G1人形机器人售价9.9万元起,高端科研型号Unitree H1售价65万元。尽管客单价极高,但首批货源上线即售罄,一度出现交付排期延长至三个月以上的情况。在2025年这一整年里,积极购买宇树机器人的用户主要分为三类:第一类是各大高校及AI实验室,他们将宇树的开放平台作为验证具身智能算法的载体。第二类是头部科技博主和内容创作者,他们通过拆解、测评及展示机器人的复杂动作(如做饭、翻滚)获得关注和流量。第三类是“租赁套利者”,在供给最紧俏的时候,一台G1人形机器人在展会或庆典上的日租金可达1.5万至2.5万元,甚至一周就可收回成本。在技术成熟度更高的四足机器人领域,根据行业协会及公开数据粗略统计,宇树机器狗Go2系列在2025年实现了约3万台的年出货量,被广泛用于电力巡检、户外跟随以及青少年的编程教育中。人形机器人销售火爆,四足机器人进入生产场景,但这一切还是和普通人的距离太远。机器人在舞台上,人们站在舞台下面看。02 一家长得像手机旗舰店的“机器人店”早在几年前,宇树的四足机器人(机器狗)便已入驻京东线上渠道,但当时更多被视为硬核科技玩家的“高端玩具”。2025年8月,京东发布“智能机器人产业加速计划”,宣布投入百亿资源助力机器人品牌,宇树成为这个计划的主要合作对象。双方的合作从单纯的线上销售,演变为全渠道的品牌共建。这种转变有点类似手机行业的演进。早期智能手机通过线上发烧友圈层传播,但真正实现全民普及,依靠的是遍布城市的线下旗舰店网络。宇树此次落户京东MALL,也面临着从“实验室仪器”到“消费级终端”的认知跨越。图:开幕典礼上刚刚跳完舞的宇树机器人根据公开数据,2024年,宇树营收突破10亿元人民币,并占据全球四足机器人六成以上的市场份额。进入2025年,随着量产级人形机器人G1(售价9.9万元起)和更具性价比的R1(售价3.99万元起)发布,宇树的零售节奏明显加快。目前,宇树在京东出售的型号包括万元级的Go2系列(机器狗)、十万级的G1量产版人形机器人,以及面向高端科研的H1/H2系列。但消费级的实现也需要强大的供应链支持。虽然宇树已经是少数具备高频出货能力的机器人公司之一,但核心型号G1在2025年大部分时间里仍处于“缺货”状态。由于人形机器人涉及数千个精密零部件,它的产能爬坡难度远超手机,导致预售订单的交付周期通常在1到3个月之间。京东机器人业务具身智能负责人在现场对媒体表示:“四足机器人可以直接从店里带走。”但被问到人形机器人什么时候能够“现场带走”,得到的回答是:“敬请期待”。不过,有了一家线下店,至少有了更放心的、可期待的物理场景。03 像卖手机一样卖机器人从手机市场的渠道经验来看,线下是硬件销售的重要渠道。根据IDC、Counterpoint等机构在2024-2025年间的报告,中国手机市场线上销售占比约25%,线下占比约75%。这个“二八比例”构成了支撑市场运行的基础结构。即使在移动互联网如此发达的今天,全球手机市场的线下渠道销售占比都超越线上。从手机的经验来看,如果想让普通消费者真正心动,实实在在的线下体验必不可少。一台售价近十万甚至数十万的机器人,但决策链路需要实机演示、开箱指导和长期售后。这些靠纯线上模式显然难以承载。根据京东官方介绍,宇树机器人已全面接入京东自营模式。这意味着,买一台机器人,将和购买其它自营产品享受同样的模式。产品从京东自营仓库发货,由京东快递负责上门配送,配送时效是“211限时达”,上午11点前下单,当天即可送到。未来如果线下店开得够多,消费者在线上被“种草”后,系统会推荐附近的京东MALL进行实机体验;在线下体验满意的客户,既可现场下单带走,也可选择线上配送。售后服务也将由京东提供。但是,与宇树合作之后的具体销售数据、线下店开店的成本双方如何承担,京东机器人业务具身智能负责人在现场表示不方便回答。机器人线下店未来是否会像手机销售一样,线下占的比例更大?京东机器人业务具身智能负责人坦言,“这是两种完全不同的产品。机器人产业火了这么久才开首店,说明技术发展和决策复杂度更高。线上线下不是替代关系,而是融合关系。机器人需要线下体验来消除‘被割韭菜’的顾虑,线上可以提供便捷的购买路径。”图:线下店售价19999的宇树Go2四足机器人04 线下店,消费级机器人的成人礼?除了机器人线下店,京东线上也推出了租赁业务。消费者通过京东APP搜索“租赁”即可直接下单体验。目前租赁以宇树科技的产品为主,包括日租金几十元的四足机器狗到日租金约一千多元的人形机器人。除了京东的租赁服务外,2025年12月22日,全国首个开放式机器人租赁平台“擎天租”也正式发布,覆盖50个核心城市。在该平台上,基础型人形机器人的租金约为3000元/天,而具备跳舞等复杂表演能力的机型则需5000元/天。与此同时,更大规模的线下业态也在涌现。2025年8月,北京亦庄落成了约4000平方米的Robot Mall(机器人超市),采用更像汽车“4S店”的模式,包含整机销售、售后服务、零配件供应,店里有优必选、宇树等超过50个品牌的百余种机型。这些业态,让机器人开始完成了“实验室”到“烟火气”的跨越。机器人线下店的启幕,可以看作是具身智能在商业模式上的一个“成人礼”。但是,消费级机器人真的想活成智能手机般的“刚需模样”,还有很长的路要走。推荐阅读具身智能狂奔一年:机器人依然不会干活,但不妨碍机器人公司上市 估值超越宇树、智元!这家把机器人送去“开店”的公司,刚刚融了3亿美金 Manus倒向Meta的N个关键解读  ...

全球最“贵”的大模型独角兽,向“广告”低头

文|晓静编辑|徐青阳OpenAI在ChatGPT中推行广告的计划,经历了一个短暂的“暂停”后,似乎再次被提上了日程。据知情人士透露,这家凭借ChatGPT迅速崛起的AI公司,关于在聊天机器人中投放广告的计划,已从构想进入实质设计阶段。尽管OpenAI高层对此闭口不谈,但全世界的广告人都在关注,OpenAI到底要怎么从谷歌和Meta手里抢走万亿美元的广告生意。OpenAI在ChatGPT 中推行广告计划的过程,是一场在“产品体验”与“商业变现”之间的激烈博弈。2025年12月初,广告计划曾经历过一次戏剧性的急刹车。当时,随着谷歌发布了性能强劲的 Gemini 3,OpenAI 首席执行官萨姆·奥特曼迅速在内部启动了“红色警报”(Code Red),要求团队暂时搁置所有非核心的商业化项目。这次暂停的初衷是为了集中全公司的技术力量应对外部竞争,优先提升 ChatGPT 的推理速度、稳定性和个性化体验,以挽回因早期测试“应用推荐(广告)”功能而引发的用户口碑危机。然而,短短不到一个月的时间,现实的财务压力便推动了广告计划的重新回归。OpenAI 曾承诺要建立一个比谷歌更纯净、更智能的信息获取方式,但当订阅收入的增长触及天花板,而推理成本却随着模型复杂度的提升而水涨船高时,它不得不活成了自己曾经“讨厌的样子”。图:奥特曼在公司内部发布“红色警报”,要求优先改进ChatGPT01 为何广告从“最后手段”成为必然选择?尽管 OpenAI 的年化收入(ARR)已冲破百亿美元大关,但OpenAI 目前的收入结构更像是一场基于资本输血的“规模博弈”,还没有形成健康的商业闭环。营收增长虽然迅猛,但在巨额算力成本和研发开支面前,这种增长更像是在为维持技术领先地位而支付的巨额“入场费”。本质上,OpenAI 并没能证明它具备传统 SaaS 软件的高毛利特征,反而展现出一种资本密集型公用事业的沉重感。ChatGPT 订阅收入占据了营收的六成,自2022年面世以来,ChatGPT的周活跃用户数已迅速增长至近9亿,根据OpenAI测算,预计到2030年用户数量有望达到26亿。然而,截至2025年10月,仅有约5%的周活跃用户付费用户,每月贡献20美元或200美元的订阅服务付费,绝大多数用户并未贡献直接收入。同时这种高度依赖单一C端产品的结构具有天然的脆弱性,在缺乏强生态黏性的情况下,订阅模式面临着极高的流失风险。随着 Google、Anthropic 等竞品在模型性能上不断抹平差距,甚至苹果等巨头开始入场瓜分流量,OpenAI 仅凭“模型领先”维持的品牌溢价正被迅速稀释。对于普通用户而言,每月 20 美元的订阅费在体验边际递减的背景下,正逐渐从“必需品”沦为“试用品”,这种基于流量红利的增长模式在未来极易遭遇瓶颈。在企业级市场(B 端),OpenAI 的处境更为艰难。虽然 Enterprise...

测测你的AI知识量丨蒸馏、GEO、氛围编程,2025年度“AI黑话”,你知道几个?

《麻省理工科技评论》评出“年度AI热词”,透过这些关键词,了解2025年AI如何深刻地改变我们的世界。1 / 氛围编程由安德烈·卡帕西提出的“氛围编程”,不再强调语法与实现,而是目标、体验与直觉:人用自然语言描述“想要什么”,AI负责把它变成代码,并在对话中不断迭代。2 / 推理模型自OpenAI 推出 o1、o3系列后,DeepSeek等迅速跟进,多步拆解、链式思考被系统性引入主流模型。它们在数学和编程竞赛中逼近甚至超越顶尖人类水平,也再次引发一个老问题:AI 究竟是在“推理”,还是在更复杂地“拟合”?3 / 世界模型语言模型擅长说话,却未必理解世界。为弥补这一缺口,研究重心转向世界模型:让AI学习因果、物理与时间演化规律。无论是谷歌DeepMind的Genie 3,李飞飞团队的Marble等等,本质都是让AI在模拟世界中学会“什么会发生、为什么会发生”。4 / 超大规模数据中心算力需求爆炸,催生了专为 AI 而建的超级数据中心。以OpenAI与美国政府推动的“星门”计划为代表,数千亿美元的投入正在改写能源与基础设施版图。但高能耗、有限就业与社区成本,也让算力竞赛首次成为公共议题。5 / 泡沫资本正以前所未有的密度涌入AI。估值高、盈利未明,泡沫质疑从未消失。但与互联网早期不同的是,头部AI公司已有可观收入,并背靠科技巨头,这让泡沫的形态更复杂。6 / 智能体智能体成为最热门、也最模糊的标签。真正能长期自主规划、执行并纠错的系统仍然稀缺,但这并不妨碍几乎所有产品,都在向“智能体”靠拢。7 / 蒸馏DeepSeekR1的成功,让“蒸馏”走到台前:小模型通过学习大模型行为,用更低成本逼近顶级性能。它提醒行业,算力并非唯一答案,算法同样重要。8 / AI垃圾廉价生成内容泛滥,“AI垃圾”成为时代隐喻。这个词的流行,反映的不是技术失败,而是人们对注意力被稀释、真实感被侵蚀的集体焦虑。9 /...

拆解招股书,看懂中国大模型独角兽的两种“活法”

:文|郭晓静编辑|徐青阳ChatGPT爆火三年后,中国大模型公司智谱AI与Minimax相继公开招股书,全球市场首次有机会在透明的财务框架下,深入解读大模型独角兽的真实商业实力。“全球大模型第一股”的争夺在两家中国公司间展开,但招股书揭示的商业细节,远比这个称号本身更值得关注。这两份数百页的文本,清晰呈现了三个关键维度:公司的真实营收质量、算力成本对利润的挤压程度,以及现金储备能够支撑的生存周期。更重要的是,招股书中的“异动数据”显示,两家公司在商业闭环上走着截然不同的路径——如同平行宇宙般的两条道路。而这两条路径,正代表着当下中国大模型公司在市场环境中,最有可能实现突围的方向。01 两个异动数据,两种中国大模型的生存现状下表整理了两家大模型独角兽的核心数据,其中最引人注目的是毛利率差异:智谱AI为56.3%,而Minimax仅为12.2%。按常理,业务相似的公司,毛利率会因成本控制能力有所差异,但不至于相差如此悬殊。这种巨大差距背后,实际上可以看出两家公司截然不同的商业本质。毛利率公式:毛利率 = (收入 - 营业成本) / 收入从招股书可见,智谱AI的营业成本主要包括:人工成本(服务及部署人员工资,占比约54.4%)、计算服务费(22.1%)、保修拨备及外包技术费。关键在于,智谱AI将大量模型训练支出计入研发开支而非营业成本,这让它的毛利表现更像传统软件公司。相比之下,Minimax的营业成本主要是算力成本(第三方云计算服务费)以及AI原生产品的分发和获客费用。虽然模型研发也消耗大量算力,但C端业务需要实时、高频地为数千万月活用户提供服务,推理成本更多直接计入营业成本。智谱AI:B端的确定性与天花板智谱选择“更重”的B端路线符合中国大模型市场的现实情况。招股书显示,2024年中国大语言模型市场规模53亿元,机构客户贡献47亿元(88.6%),预计未来五年复合增长率63.5%,机构客户仍是核心驱动力。个人用户付费意愿和动力不足。图:智谱 AI 招股说明书中关于行业竞争格局的描述智谱在B端确实展现出强劲竞争力,客户数从2022年的48家增至2024年的123家,年化客单价从114万元增长至215万元。然而,收入结构暴露出隐忧。2024财年,85%收入来自本地化部署,仅15%来自云端API。本地化部署意味着高度定制化,重交付、周期长;而更轻量的云端MaaS业务占比持续下滑,毛利率更从76.1%跌至3.4%。更值得警惕的是客户集中度:最大客户收入超过总收入10%,前五大客户接近50%。这意味着失去任何一个大客户都可能造成营收剧烈波动。图:智谱 AI大客户集中度偏高一位接近智谱的产业专家指出:“我看好公有云上的MaaS平台,边际成本持续降低,价值可规模化复制。但不看好私有化MaaS,历史上私有化中间件除非做到全球第一(如Oracle数据库),腰部产品靠项目制赚的都是波动的‘辛苦钱’。”如何在渗透完头部机构后突破增长天花板,如何让云端MaaS成为第二增长极,是智谱面临的核心挑战,也是未来的想象空间所在。Minimax:出海的必然选择Minimax的招股书中,另一组异动数据值得关注,从最初的80%境内收入,到2025年的73%海外收入,实现了收入地区的根本性转变。同时,“开放平台”(对应智谱的云端业务)收入占比从早期的78.1%降至2025年前九个月的28.9%。这组数据显示,Minimax走的是一条坚定的C端路线,讲了一个更“互联网”的故事。AI原生应用(包括Talkie和海螺AI)已成收入主流,占比在71%左右。然而,智谱在招股书中所述的中国个人用户付费占比极低是客观事实。这是中国大模型公司面临的共同困境:本土市场缺乏付费订阅习惯,科技大厂免费产品围追堵截。对Minimax而言,出海和全球化是当下撕开TOC增长裂口的唯一路径。图:Minimax 星野02 刻在大模型基因中的全球化增长路线红杉中国合伙人郑庆生在最近的一个商业播客中谈到,这一代AI原生产品,天生就是全球化的。大模型训练于全球数据,AI原生产品从基因上就具备跨越地域的能力。从这个角度看,“出海”不仅是Minimax的选择,也是所有中国AI原生公司的必经之路。智谱虽然选择了B端路线,但同样在布局海外。招股书显示,其本地化部署已在东南亚市场产生收入(2025年上半年东南亚收入占比11.1%),并积极参与当地“国家级基座平台”建设。这体现了一条通过B端赋能而非直接获客的出海路径。相比Minimax激进的全球化转型(73%海外收入),智谱的出海仍处于初期探索阶段。但两家公司的共同点在于:都在规避对单一市场的依赖,都在探索大模型时代赋予的全球化可能性。智谱AI和Minimax的商业化路线,本质上都是在现实市场条件下,基于自身特征探索出的最优解,一个深耕B端寻求确定性,一个押注C端出海寻找C端增长的爆发力。两条看似平行的道路,都是在中国大模型市场尚未成熟的当下,找到可持续的增长路径。但是,“可持续增长”的前提是生存。招股书中的“风险因素”(Risk Factors)部分是上市公司必须披露的核心板块。从中可以看出公司在未来发展中即将面对的核心挑战。03 招股书中的“风险因素”从行业共性看,两家公司都表达了对大模型研发领域极高生存门槛的担忧。由于AI技术迭代极快,两家公司在招股书中均流露出对“技术过时”的深层焦虑,今天的领先可能被明天的算法突破瞬间归零。此外,对昂贵算力资源的高度依赖,以及研发开支远超营收的巨额亏损,也是全行业在迈向通用人工智能(AGI)道路上必须跨越的财务鸿沟。大模型仍然是一场关于长期投入的战争。智谱和Minimax都以每年10-20亿人民币的规模投入研发,其中超过70%是算力成本。更棘手的是,随着用户数量增长,每个用户消耗的推理算力成本也在增加,这与互联网时代用户规模摊薄边际成本的逻辑完全相反。但是,两家公司都在招股书中对现金储备给出了较为明确的预期。智谱AI:截至2024年12月31日,现金及现金等价物约24.57亿人民币,较2023年底的13.3亿显著增长。结合截至2025年10月底的可动用银行融资和短期投资,整体财务状况相对稳健。从烧钱速度看,智谱AI在2024年全年经营活动净消耗22.45亿人民币,月均约1.87亿;进入2025年上半年烧钱速度加快,前6个月经营性现金流出13.27亿人民币,月均消耗升至约2.21亿。招股书明确声明:“截至2025年10月31日,其现金及现金等价物能够维持上市后的财务可行性。经测算,若按2025年上半年流出速度计算,2024年末现金余额在不计入新融资的情况下可支撑约11个月。但由于公司在2025年持续获得股权融资,现金生命线已大幅延长。”Minimax:截至2025年9月,持有现金结余(含现金、等价物及理财)约10.46亿美元。按目前每月约2,790万美元的消耗速度计算,即便不计入IPO募资,现有储备仍可支撑约37.5个月。若计入IPO资金,生存期和抗风险能力将进一步增强。两家公司的IPO更像是战略性的“抢跑”而非救急。   在差异化风险上,两家公司的担忧截然不同。智谱的风险披露聚焦“供应链安全与地缘政治”,在复杂国际环境下如何持续推进AGI自主研发,以及作为独立开发商如何应对商业化初期的激烈竞争。Minimax的风险提示中,坦承自己作为“未商业化公司”面临较高倒闭风险,并详细披露了与迪士尼、Netflix等国际影视巨头之间尚未了结的版权侵权诉讼。在证明商业模式可行性之前,公司也必须先在跨国法律纠纷和高昂运营成本的夹击中存活下来。04 估值悖论:如何定价?就在几天前,这轮生成式AI热潮的引爆者OpenAI被爆正在筹备新一轮融资,估值或高达8300亿美元,这是智谱/Minimax(约40亿美元)估值的200倍。据媒体公开消息,OpenAI 2025年上半年营收43亿美元,Sam Altman估算年底年化收入将超200亿美元,是智谱/Minimax营收规模的70倍左右。以OpenAI这个标杆粗略对比,智谱/Minimax的估值似乎并不高。而以OpenAI的增长速度来看,智谱/Minimax的想象空间同样巨大。图:Minimax招股书对 AI 未来增长的描述但换个参照系,结论截然相反。截至2025年12月23日16时(港股收盘), 香港上市的软件公司金山软件市值约395.76亿元,2024年营收约103.18亿元。阿里巴巴总市值 2.81 万亿,2024 年营收...

2025“胖五”收官发射成功,中国深空探测为何离不开它?

文丨李海伦编辑丨徐青阳2025年12月20日20时30分,长征五号运载火箭在海南文昌航天发射场按计划实施发射,成功将通信技术试验卫星二十三号发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。长征五号是我国现役运力最强的火箭,长征五号系列持续承担着重量级、复杂度高的航天发射任务,为我国重大航天工程的实施提供了关键运载支撑。长征五号运载火箭本次发射采用长征五号运载火箭基础型实施,作为两级半构型火箭,长征五号基础型主要用于执行高能轨道发射任务,服务于通信、技术验证及深空探测等重大航天工程。长征五号运载火箭根据任务需求形成了基础型(标准型)和B型两种主要构型,二者在总体技术基础上保持高度一致,但在结构设计和任务定位上有所区分,共同构成我国重型运载火箭体系的核心力量。长征五号基本型是该系列的标准型号,采用两级半构型,由一级芯级、二级以及四个助推器组成,主要面向地球同步转移轨道、高能量近地轨道以及深空探测任务。基本型能够满足大型通信卫星、探测器以及复杂深空航天器的发射需求。火星探测工程、月球探测后续任务等高能量任务,均依赖这一构型完成入轨和转移。其设计重点在于高比冲、长时间稳定工作和复杂轨道任务适应能力。长征五号B型则是在基本型技术基础上发展而来的近地轨道重型发射型号,采用一级半构型,去掉了基本型中的芯二级,进一步强化近地轨道运载能力。B型的近地轨道运载能力达到25吨级,主要用于发射空间站舱段等超大型、超重航天器,是我国空间站工程的主力火箭型号。其总体设计更强调结构承载能力、一次性大质量入轨能力以及与大型载荷的系统匹配。总的来说,长征五号基础型和B型在发动机、推进剂体系、助推器设计等核心技术上保持统一,通过不同构型覆盖了从高轨、深空到近地轨道重型发射的完整任务谱系。这种"同平台、多构型"的发展模式,有效提升了我国重型运载火箭体系的任务适应性和工程效率,也为我国后续重大航天工程提供了稳定可靠的运载基础。关于长征五号系列长征五号运载火箭(代号CZ-5)是我国21世纪10年代研制的大型低温液体捆绑式运载火箭,其研制成功标志着中国运载火箭实现升级换代,是由航天大国迈向航天强国的关键一步。长征五号运载火箭于2006年正式立项研制,是我国面向新一轮航天工程需求启动的重型运载火箭型号。研制过程中,工程团队围绕大型低温液体发动机、捆绑式结构设计、复杂飞行控制等关键技术展开系统攻关,历时十年完成型号研制并进入工程应用阶段。2016年11月3日,长征五号运载火箭在海南文昌航天发射场实施首次飞行任务并取得成功,标志着我国重型运载火箭正式迈入工程化应用阶段。根据公开资料显示,长征五号火箭打破了我国沿用40多年的3.35米直径箭体结构限制,芯级直径达5米,最高可达约63.2米,比20层楼还要高,具备将25吨级航天器送入近地轨道的能力,为空间站等大型工程提供了基础条件。在动力系统方面,长征五号的四个助推器为全箭提供了90%以上的起飞推力,是火箭升空阶段的主要动力来源。每个助推器直径3.35米,推进剂装载量达800余吨,能够在短时间内输出强大的推力,确保火箭顺利离开发射台并进入既定飞行轨道。中国长征五号火箭的芯一级采用液氢液氧推进剂,是中国首型用于运载火箭主级的大推力氢氧发动机。该推进剂体系具有无毒、低污染的特点,在满足高推力和高比冲需求的同时,兼顾环境友好性和运行安全性。这一技术路线不仅符合大型运载火箭的发展趋势,也体现了我国在航天工程中对绿色、可持续理念的重视。重大应用与工程成就长征五号运载火箭的成功应用,为我国航天工程实施打开了新的能力空间。在载人航天领域,长征五号B运载火箭作为空间站建造阶段的主力发射型号,先后将“天和”核心舱、“问天”实验舱和“梦天”实验舱送入预定轨道,支撑完成了中国空间站在轨组装和建造任务,显著提升了我国近地轨道大型空间设施的建设能力。在深空探测领域,2020年7月,长征五号遥四火箭成功发射“天问一号”火星探测器,一次任务完成环火、着陆和巡视三项目标,使中国成为世界上第二个实现火星表面巡视探测的国家。该任务充分验证了长征五号在高能轨道和深空发射任务中的运载能力和可靠性。在探月工程方面,长征五号将继续作为后续月球探测和科研站建设任务的重要运载平台。未来实施的嫦娥号系列的探测任务,将在月球采样返回、极区探测和长期科研设施建设等方面,对重型运载能力提出更高要求,长征五号将在其中发挥关键作用。此外,长征五号还成功执行了多次重型通信和技术试验卫星发射任务,包括“实践二十号”等新一代大型高通量通信卫星,验证了其向地球同步转移轨道发射重型、高价值载荷的工程能力,为我国空间信息基础设施建设提供了重要支撑。回顾2025年,长征五号系列火箭屡创佳绩:8月13日:长征五号B运载火箭/远征二号上面级,成功发射卫星互联网低轨08组卫星,送入预定轨道。10月23日:长征五号遥九运载火箭在中国文昌航天发射场点火起飞,随后将通信技术试验卫星二十号送入预定轨道,发射任务取得圆满成功。12月20日:本次发射任务的顺利成功,再次证明了长征五号的高可靠性和强大能力。这一年,长征五号不仅完成了既定的发射任务,更在技术创新、流程优化、成本控制等方面取得了显著进步。这次2025年的收官任务,承接着一年以来的技术积累与工程准备,更为2026年的新征程积蓄了充足动能。推荐阅读柴天佑院士、何小鹏、清华教授齐聚Hi Tech Day,共议2026年AI走向马斯克一句“愚蠢至极”,又得罪了整个硅谷美光沉迷制造“电子黄金”,不在乎AI泡沫 ...

美光沉迷制造“电子黄金”,不在乎AI泡沫

坐在存储火箭上的美光CEO,图片由AI生成文丨苏扬编辑丨徐青阳“电子黄金”大潮之下,存储大厂美光的业绩又爆表了。当地时间12月17日盘后,美光交出创纪录成绩单,2026财年第一财季多项业绩指标超预期,营收136.4亿美元,同比增长57%,净利润为54.82亿美元,环比增长58%,同比增长135%。美光核心业绩数据在这一轮的存储涨价潮之下,叠加AI的增量需求,营收和利润大涨基本都是可预期的,同样也是DRAM这类传统产品,直接将美光的毛利率送上了56.8%的水平,环比涨了11个点,可以说是当之无愧的行业顶流。与此同时,美光将第二财季指引大幅上调,预计营收187亿美元,(±4亿),远远超出伦交所分析师平均预期的143亿美元,毛利率也将来到68%的历史高位。营收、毛利持续暴涨,本质上释放的一个信号是:“电子黄金”涨价潮仍会持续,赛博玩家们估计不太愿意接受这个现实;而另一个信号则是,不管是谁说“AI泡沫”,在美光的世界里,没有泡沫二字。01 美光不相信泡沫美光第一财季业绩增长核心在于AI驱动的高带宽内存需求爆发,叠加全行业产能扩张滞后导致的持续紧缺。营收136.4亿美元,已经连续三个季度创新高(云存储:53亿美元、核心数据中心业务:24亿美元、移动和客户端:43亿美元、汽车和嵌入式业务:17亿美元)。净利润为54.82亿美元,环比增长58%,同比增长135%。毛利率56.8%,环比增长11%。营业利润率达47%。调整后每股收益为4.78美元,同比暴涨167%。这份爆表的业绩,与硅谷“AI泡沫论”格格不入。那么装上“数据中心”、“消费存储”两个发动机的美光,有没有不确定性呢?业内分析认为,内存行业已从强周期产品转向高价值战略资产,但供应瓶颈和潜在的消费需求弹性是其长期增长的不确定因素。实际上消费需求对美光的影响未来将会随着产能结构调整逐步减小,一方面本身AI需求还在,业绩会上美光已经对外披露:2026年的HBM产能都已经被抢完,未来1-2年仍将是供不应求的卖方市场,现阶段只能满足关键客户50%-66%的需求。另一方面,HBM的良率也在按预期目标爬升,以优化利润水平。“我们预计我们的HBM4会有比我们的HBM3E更快的良率提升。”所以,在存储形势一片大好的背景下,美光也对将2026财年的资本支出预期由此前的180亿美元上调至200亿美元,计划在美国、新加坡、日本等地大幅扩产。02 从“电子原油”到“电子黄金”美光科技此轮强劲增长并非简单的行业周期复苏,而是AI技术革命所引发的结构性产业变迁。在这场变革中,内存,特别是高带宽内存(HBM),已从过去如同“电子原油”般的大宗标准化商品,质变为决定AI系统性能上限的“战略资产”。美光对此给出了极为乐观的市场图景:预计HBM潜在市场规模将以约40%的年复合增长率,从2025年的350亿美元飙升至2028年的1000亿美元,且这一里程碑比该公司先前预期足足提前了两年。仅HBM一个细分市场,其规模将在三年后超过2024年整个DRAM市场的体量。从实际情况来看,过去DRAM是现货标准品,现在HBM则已经趋向于期货产品,类似高端晶圆代工的“产能预售”特性,这也推动着产品销售商业模式发生了质变。美光首席执行官桑杰·梅赫罗特拉在财报会议中反复强调,增长的“第一性原理”在于AI。他指出,全球顶尖科技公司正竞相迈向通用人工智能(AGI),由此开启了“一场非凡的多年期数据中心建设竞赛”。这种由客户长期资本开支承诺所驱动的需求,具备前所未有的强度和可持续性。据透露,美光已将2025年服务器整机数量的增长预测从10%大幅上调至“约15-20%”的高位区间,并预计这一强势需求将贯穿2026全年。更关键的是,AI模型的复杂化和多模态趋势,使得每一台服务器所需搭载的内存容量和性能呈几何级数增长,这正是美光“量价齐升”的根本动力。03 新、旧业务资源重配AI需求暴增,美光果断的进行了产品结构优化,其标志性动作之一,是停止直接向消费者零售市场销售内存产品,比如宣布退出英睿达业务。公开资料显示,英睿达成立于1996年,目前已成立约29年。它是美光旗下仅有的消费者品牌,也是首家直接向消费者销售内存的公司。换句话说,市场潜力在哪里,美光就往哪里去,至于赛博玩家在哪里,似乎不重要了。将宝贵的产能和研发力量从低利润、高波动性的消费板块,转向了高价值、高增长的数据中心板块,在财报中也有正向反馈——云与数据中心相关业务的营收占比已超过55%,且其利润率水平(云内存毛利率达66%)远高于传统业务。尽管美光上调资本支出,扩大产能,但只要HBM增加,还是会挤占传统的DRAM产品,其“产能置换比”高达3:1,即每增加一单位HBM产出,就要牺牲三单位传统DRAM的产品。其次是晶圆厂扩建,一方面需要数百亿元的支出,另一方面也需要时间周期来完成,大致的扩产计划如下,最快2027年中期开出产能。美国爱达荷州的工厂将提前至2027年中投产;纽约州的首个巨型工厂计划于2026年初破土动工,瞄准2030年后的供应;在日本,广岛工厂正升级以支持最先进的制程节点;在新加坡,一座专用的HBM先进封装工厂将于2027年开始贡献关键产出;印度的组装测试设施也已启动试生产。这也是为什么CEO梅赫罗特拉说在中期内,公司仅能满足关键客户大约 “二分之一到三分之二” 需求的原因,因为新产能短期内开不出来,也因此梅赫罗特拉高喊“好日子还在后头”(The best is yet to come)。04 战略藐视竞争对手能把美光拖下水的,首先不会是“AI泡沫”。在美光眼里,也不会是竞争对手。电话会议中,当被问及竞争对手(暗指三星、SK海力士)在HBM领域的追赶时,梅赫罗特拉强调,美光的HBM4不仅拥有业界顶尖的超过11Gb/s的传输速率,更保持了 “较竞争对手低30%功耗” 的传统优势。分析师的提问揭示了AI需求的溢出效应正变得日益广泛。例如,企业级固态硬盘(SSD)的需求激增,不仅源于数据训练,更因为 AI推理工作负载(特别是视频内容的实时生成与处理) 产生了海量的数据存储与高速访问需求,间接引申出NAND的需求。对此,美光证实,其正在与客户谈判的多年期供货协议中,数据中心SSD是核心组成部分之一,且这类协议的结构“与以往任何合同都不同”,包含了更具体的承诺和更强的约束力。站在美光自身视角,内存价格的全面高涨,可能会在2026年对部分消费电子市场(如智能手机和PC)的“单位需求”产生抑制作用,部分客户可能会因此调整其产品配置组合。用更直白的话来说,美光认为自己抛弃了赛博玩家,OEM客户采取相同的操作,甚至因为涨价的缘故,“阉割”配置。而对于产能的扩张节奏,美光表示仍将保持“纪律性”——我们投资很克制,资金也充足。美光CFO表示,当前资本支出强度(约占营收25-30%)低于公司的长期目标(35%),主要制约因素是洁净室空间的准备周期,而非资金。总体来看AI将数据转化为智能的过程中,高性能内存已成为不可或缺的“电子黄金”。美光业绩“狂飙”的持续时间,将取决于三个关键变量:AI需求的持久力、产能扩张的速度,以及高价格对非AI需求的抑制程度。目前看来,至少在2026-2027年,前两者的力量依然强劲,美光仍将处于“卖方市场”的有利位置,所以接下来的四至六个季度,美光不会相信“泡沫”。特约编译金鹿对本文亦有贡献推荐阅读 MiniMax、智谱通过港交所聆讯  “雷军的AI秘密武器”罗福莉首秀  马斯克又“得罪”整个硅谷  ...

OpenAI用GPT-5.2“反击”谷歌,刀子够快吗?

Sam与Pichai扳手腕,图片由AI生成文丨苏扬编辑丨徐青阳一个月前,谷歌的Gemini 3超越所有竞争对手成为“世界最佳”,一个月后,OpenAI成立10周年这一天(美国时间12月11日),正式推出新一代AI模型GPT-5.2。在这一关键的产品发布前,奥特曼为了应对主要对手的产品、挖角攻势,在内部拉响最高级别的“红色警报”。所以,GPT-5.2的亮相,不仅关乎两家科技巨头的市场地位,更可能重新定义全球人工智能产业的竞争格局。提前“内测”两周的HyperWrite联合创始人兼CEO马特·舒默评论说:能力强,尤其是推理能力强,但速度慢,且场景太单一,只能通过ChatGPT使用。“这是世界上最好的模型,它可以用1个小时来处理难题,而且还能出色完成任务。我已离不开它。”硅谷AI专家艾莉·米勒也是“内测用户”,她将GPT-5.2定义为“专业研究员”:对深度思考和复杂问题解决“严肃”、“专业”,但内容结构化,对追求快速、简洁和拟人化交流的用户不太友好。“复杂的工作,脑暴,专业分析,我可能会用GPT-5.2。”AI开发者Dp Singh也认同上述判断,强调AI首次能在日常专业任务(如制作演示文稿、电子表格、分析图表)中达到专家级产出水平,而不仅是演示场景。GPT-5.2表现出来的与人类研究员平齐的专业能力,也引发了学界专家的关注。宾夕法尼亚大学沃顿商学院教授、人工智能专家伊桑·莫利克说:“我从未如此确信过,即便今天人工智能发展不再继续,未来10年社会、经济仍然将面临巨大的变革,因为人类会想方设法利用模型的能力。当然,AI的进步也不可能就此结束。”01 OpenAI无法“遥遥领先”OpenAI对GPT-5.2的定位很明确,是“迄今为止最适合现实世界专业用途的模型”。而证明其“能力”的指标,就是基准测试、跑分。上面是OpenAI在X上晒出来的一张基准测试图(官方新闻稿甚至都没这张图)。可以看到,在其自主研发的GDPval基准测试中,GPT-5.2在70.9%的明确任务上达到或超越了顶尖人类专家的水平,较其8月发布的GPT-5(38.8%)实现大幅跃升,也领先于Anthropic的Claude Opus 4.5(59.6%)和谷歌的Gemini 3 Pro(53.5%)。但是话说回来,GDPval是OpenAI自己的基准测试,做不好才有问题。更重要的是,基准测试这东西,在业界数量太多了,OpenAI这次引用了其中8项不同类型的,谷歌在Gemini 3的引用了可能有20项基准测试,这里就有一个操作空间了——我的哪些基准测试数据好就放哪个,其他就不放。但如果我们把上面的表格转换成折线图,可以很清晰的看到,在多个基准测试中,OpenAI新发布的GPT-5.2各家最前沿的模型差别都不明显。可以说,AI竞赛已从OpenAI一家独大,演变为多方巨头“短兵相接”的混战。《纽约时报》也提及了这种看法,并且援引行业专家观点指出,“OpenAI所谓的AI基础模型与其他公司模型之间的技术差距实际上已经不复存在。”如果说,基准测试不够直观,可以看看具体的案例,下图左是OpenAI官方提供的“海浪模拟器”网页,右边是相同提示词在Gemini中生成的页面,总的来说,各有优势。前面提到过,因为竞争对手的步步紧逼,奥特曼在公司内部拉响“红色警报”。从GPT 5.2和同行之间的差距来看,短期内估计没办法在产品和模型层面消除“红色警报。”针对这个问题,被奥特曼一手挖过来的应用业务首席执行官菲吉·西莫说,“红色警报是向公司发出的一个信号,表明我们需要将资源集中在一个特定领域,这是一种确定优先级的方式。”大意就是红色警报不是决战生死,只是让大家看到管理层表决心、定方向。实际上GPT-5.2在数月之前就已经研发,只是选择在这么一个时间点发布。问题是,如果要决企业生死,除了这个不怎么能拉开差距的GPT-5.2,奥特曼的手中,还有没有比它更快的刀?当然,比起在内部拉警报,奥特曼在外部的表现还是挺放松。他在接受CNBC采访时表现出谨慎乐观:“Gemini 3对我们的业务指标产生的影响,可能比我们担心的要小。”他预计OpenAI将在2026年1月“以非常强势的地位”解除“红色警报”状态。02 十年一梦,还是十年十梦OpenAI刚刚迎来成立10周年,官网也发了一条视频,介绍这家公司从哪里来、到哪里去。10年前,马斯克还在OpenAI项目组中活动的时候,黄仁勋送给OpenAI的世界上首台DGX-1服务器,各路大佬都在上面留下来签名,背景墙有一句格言“关键的问题不在于我们‘知道什么’,而在于我们如何‘运用所知’……我相信,我们每个人的责任都是——在行动时,要把自己当成全世界的命运都维系在自己肩上一样。”十年来,OpenAI给世界送来了ChatGPT、Sora等震撼的产品,奥特曼在世界各地巡游布道,与各种硅谷巨头捆绑压铸算力,但是随着时间的推移,OpenAI从一开始的大幅度领先,到慢慢被对手追平甚至超越?现在的OpenAI,处在一个茫然的十字路口。成立初期,OpenAI声称其目标是“以最可能造福全人类的方式推进数字智能,不受产生财务回报需求的限制”。斯塔福德郡大学的AI伦理学家凯瑟琳·弗利克也强调,这一创立理念已发生巨变。因为在OpenAI复杂的架构背后,存在着一个利益错综复杂互相绑定的营利性公司。“现在我们有一个营利性公司,它已经完全卸下了对社会效益的任何责任,基本上接受了那种不惜一切代价增长的信条。”弗利克表示,原因在于OpenAI身处生成式AI革命的最前沿,而这里“有钱可赚”。红色警报声中,OpenAI的第一要务是做产品体验,商业化优先级排在后面,因为这已经涉及到生死存亡,也关乎奥特曼更远大的理想——10年后可能会到达的超级智能,但这种愿景并非是OpenAI绝对的共识。03 商业化与治理的矛盾技术竞赛的背后,是OpenAI面临的巨大商业化与盈利压力。奥特曼表示,OpenAI的目标是在2025年底实现相当于每年200亿美元收入的月度营收,但他承认距离整体盈利“仍有很长一段路要走”。更引人注目的是,OpenAI承诺在未来几年投入高达1.4万亿美元用于计算基础设施建设,以支撑其AI雄心。市场调研公司Sensor Tower的最新数据显示,2025年11月,ChatGPT全球月活用户总数为8.1亿,8-11月增速仅为6%,远低于2024年同期40%以上水平。此外,其全球的份额,四个月内也从38%降至35%。目前,ChatGPT是OpenAI的营收生命线。每周超过8亿的活跃用户中,约6%每月支付20美元使用高级服务。OpenAI正试图从免费用户中挖掘更多价值,探索的方向包括在ChatGPT中引入广告,以及开发交易分成模式(例如用户通过聊天机器人购物,OpenAI从中抽成)。西莫还证实,OpenAI计划在推出“成人模式”(可能允许成人内容)前,先引入用户年龄预测功能以保护青少年,“成人模式”预计明年第一季度上线。与此同时,OpenAI正积极进军企业软件市场,将自身定位为同时服务消费者与企业两大客户群体的公司。GPT-5.2在编码、法律、金融等专业领域的性能提升,正是为了吸引高价值的企业客户。然而,在这一市场,OpenAI将直接面对谷歌、微软等巨头的激烈竞争,后者能够将AI工具与成熟的办公软件生态(如Google Workspace、Microsoft 365)深度捆绑。营利性能帮助OpenAI获得源源不断的资金,以继续它帮助人类的远大理想,但这个过程中也会衍生出一系列的安全、伦理方面的问题。就在GPT-5.2发布之前,OpenAI遭遇一项新的诉讼,指控ChatGPT与一名心理困扰用户的互动间接导致了康涅狄格州的一起谋杀-自杀惨剧。需要注意,这已经不是第一起类似的诉讼。OpenAI回应称事件“令人心碎”,并承诺持续改进系统对心理困扰迹象的识别和应对能力,引导用户寻求现实帮助。此外,《纽约时报》起诉OpenAI及其合作伙伴微软侵犯版权的案件仍在进行中,凸显了AI训练数据合法性这一根本性行业难题。04 与谷歌“争霸”这场OpenAI与谷歌之间的较量,早已超越单纯的技术参数比拼,演变为一场涵盖技术迭代、生态构建、商业模式、安全治理和资本耐力的全方位战争。在技术层面,基准测试的“榜首”争夺日趋白热化。OpenAI研究副总裁艾丹·克拉克虽未透露GPT-5.2的具体训练突破,但承认在预训练等基础环节持续改进,回应了业界对“预训练潜力是否耗尽”的质疑。在生态层面,OpenAI推出自有浏览器,意在挑战谷歌的Chrome,试图构建从底层模型到上层应用的完整生态闭环。而谷歌则凭借其庞大的现有产品矩阵,试图通过整合创造协同优势。AI模型评估平台LMArena公司Wei-Lin Chiang指出:“通用模型的用户增长已触及阶段性瓶颈,下一个增长极必然来自垂直领域。”他还强调,当前竞争的核心已非单纯用户扩张,而在于谁能率先在医疗、金融等关键行业建立起可靠、高效的解决方案,真正实现技术能力向产业价值的转化。最后在战略文化层面,OpenAI从非营利研究机构向高估值商业实体的快速转型,以及其对盈利的迫切追求,正在重塑其内部文化。一些早期员工曾引以为傲的、与谷歌等广告驱动模式的区别,正在现实压力下变得模糊。“这是一场将在多条战线上展开的竞赛。”追踪最新AI技术性能的公司Vals AI首席执行官拉扬·克里希南的论断精准概括了当前AI霸主之争的复杂性。总体来看,GPT-5.2的发布是OpenAI在专业领域一次有力的技术宣示,但它远非终局——没能和对手拉开差距,甚至OpenAI自己都说要到2026年1月份才能消除警报声。更重要的是,即便短期内“红色警报”可以暂时解除,但整个AI行业最高强度的竞争警报,已然长鸣。特约编译无忌对本文亦有贡献推荐阅读 一文读懂GPT-5.2 : 直指“经济价值”  扎克伯克“挥刀斩元老”  我们正目睹一场人工智能泡沬吗? ...

我和辛顿一起发明了复杂神经网络,但它现在需要升级|Hao好聊 X AI先驱谢诺夫斯基

文|博阳编辑|徐青阳1984年的一天,物理学家特伦斯·谢诺夫斯基和心理学家杰弗里·辛顿坐在实验室里,盯着黑板上的方程发呆。那是AI的第二个寒冬,神经网络陷入僵局。人们都知道多层网络更强大,但没人知道怎么训练它。 “如果我们把神经网络想象成一团气体呢?”谢诺夫斯基突然说。这个疯狂的想法最终变成了玻尔兹曼机,这是一个用统计物理学重新定义"学习"的数学模型。它证明了只要找到合适的能量函数,神经网络就能像气体从高温降到低温一样,自发地调整到最优状态。 这成为现代深度学习的理论基石之一。但两人后续的志趣却互相有所偏离。辛顿发现了更实用的反向传播算法,带领深度学习走出寒冬,最终迎来ChatGPT主导的AI时代。而谢诺夫斯基选择了回到神经科学实验室,用几十年时间解剖大脑的每一个回路,试图回答那个最初的问题:大脑究竟是如何工作的?40年后,辛顿因玻尔兹曼机获得2024年诺贝尔物理学奖。他在颁奖典礼上自嘲:“我和特里原本以为我们会因为解释大脑而获奖,结果我们错了。但这对物理学奖来说也够格了。”而83岁的谢诺夫斯基,依然在实验室里追问那个问题。也许没有人比他更适合回答今天AI缺失的那些碎片。他见证了神经网络从“异端”到“改变世界”的全过程;他既懂物理学的简洁优雅,也懂生物学的复杂混沌;他和辛顿一起打开了AI的大门,又眼看着这扇门后的世界变得越来越陌生。在他看来,现在ChatGPT能通过哈佛医学院的考试,却连“睡觉”都不会。是的,睡觉。人类大脑在睡眠时会激活海马体整理记忆,会通过做梦演练各种可能性。ChatGPT一旦停止输入就彻底沉默,它没有海马体,没有基底神经节,甚至没有“自主生成的思想”。而Transformer虽然强大,但只模拟了大脑皮层的一小部分功能,缺失了绝大多数关键结构。它是一个智能碎片,能思考,但不会行动;能对话,但不会生存。 在这次对话中,我们从历史、当下聊到未来,从这位AI先驱那里听到了关于智能本质的另一种答案:Transformer可能不是通往AGI的唯一路径。这是一场关于物理学、神经科学与AI的深度对话,也是一次对"智能"本质的重新审视。在这个AI狂飙突进的时代,谢诺夫斯基提醒我们:技术的进步可以很快,但对智能的真正理解,可能需要几代人的耐心。| 本节目也有音频 |你可以通过小宇宙平台收听,欢迎关注我们。以下是《Hao好聊》与谢诺夫斯基的对话,经中国商业科技新闻网精编: 01AI历史的起点,是把神经网络想象成一团气体郝博阳: 计算神经科学是现代AI的基石。在那个年代,您和辛顿是如何利用物理学思维,突破当时传统AI的局限,找到解释大脑核心逻辑的钥匙的?谢诺夫斯基: 当我们开始职业生涯时,神经网络实际上还不是一个非常成熟的领域。有一些先驱者,比如日本的斯里尼·甘姆里(Srini Amari),美国的杰克·科万(Jack Cowan),欧洲的克里斯托弗·冯德马尔斯堡(Christoph von der Malsburg)。所以只有少数几个人,我们对如何理解大脑有着相似的直觉。至少我和杰弗里的方法是——大脑极其复杂,从神经元组合在一起的复杂性以及它们如何通过突触相互通信的角度来看,其复杂度几乎是无限的。但我们想要提取一般原理。 这些原理与数字计算机非常不同。数字计算机有一个与处理单元分离的内存,然后有一系列指令按顺序执行。这就是冯·诺依曼架构。但大脑完全不同。它是大规模并行的,有很多处理单元(神经元)高度互连。当时的AI缺少一个部分,就是对于大脑而言很重要的学习能力。当我们来到这个世界时,我们必须学习我们将要说的语言、文化以及世界如何运作。很早我们就会做这个事情,而且会在一生中持续做下去。所以我们意识到,AI需要一个学习算法。 当时存在一个僵局,因为对于单层网络(称为感知器)有一个很好的学习算法,我们想将其推广到多层网络。这就是玻尔兹曼机的用武之地。我们将神经网络想象成一团气体。在物理学中,气体分子通过随机运动最终会达到一个能量最低的热平衡状态。我们想,如果把‘学习’定义为‘寻找能量最低状态’的过程是否有效?于是我们发现了一个简单的局部规则。让网络在“看到数据时”达到一个平衡,再让它在“没看数据(自由运行)时”达到另一个平衡。通过比较这两个状态下神经元活动的差异(相减),就能算出权重的调整方向。这就是玻尔兹曼学习算法。我们证明了这个原理。当然,当时的网络按今天的标准来说非常小,但这是核心。霍普菲尔德网络、玻尔兹曼机以及其他许多网络在那时正在起飞。所以那是一个非常激动人心的时期。02AI的核心规律不是计算,而是学习郝博阳: 您是否认为每一个大脑活动最终都可以简化为计算,比如玻尔兹曼机这种结构,它能否代表大脑的所有基本活动? 谢诺夫斯基: 计算是一个在物理学中找不到的概念。因为不需要。在物理学中,有一个方程叫做哈密顿量,比如氢原子的方程。你分析这个方程,并将其与实验进行比较。但哈密顿量不会改变,你也不可能改变实际的物理学。据我们所知,它在整个宇宙中都是相同的。所以对我来说,这是一个新的概念。 但大脑能通过“学习”来修改自己的公式。 我们把物理学的能量方程引入AI,但允许AI通过经验来修改这个方程,这在当时是一个全新的概念——既不是纯粹的物理,也不是传统的计算。正是因为我们把物理学直觉引入了大脑研究,才打破了僵局。看看现在的NeurIPS 会议有多火爆,这就证明了当年我们把“物理学”和“计算”结合起来这条路,彻底走通了。03 与辛顿的“分歧”与“共鸣”郝博阳: 您和辛顿共同开发了玻尔兹曼机,但后来他走向了更偏向工程的“反向传播”算法,而您坚守在生物学领域。这种分歧背后的原因是什么?谢诺夫斯基: 这实际上是我们合作的核心——我们有互补的背景。 杰弗里的背景是计算机科学和心理学,他对这两个学科有非常深入的理解。我的背景是物理学和神经科学。所以我们融合在一起,这就是玻尔兹曼机的来源。我们都确信玻尔兹曼机学习算法就是大脑的工作方式。原因是它是局部的。学习必须是局部的。(这是因为在大脑中,一个神经元或突触只能感知到它直接连接的邻居,它无法像计算机那样拥有全局视角。)现在用于所有这些大型语言模型的“反向传播算法”不是局部的。(它要求把最后的误差信号精确地传回前面的每一层,而大脑中并没有这种专门用来传递误差的反向线路)所以显然这不是大脑学习的方式。辛顿沿着那条线继续前进。他与戴夫·鲁梅尔哈特(Dave Rumelhart)同时开发了反向传播学习算法,这在学习所需时间和网络规模方面效率要高得多。它可以很好地扩展。你说得对,我专注于神经科学,我想了解大脑是如何工作的。但这些年来我们一直保持联系,我们是非常好的朋友。我们来回交流,当有新发现时——比如辛顿在工程上发现了一种叫做 dropout(随机丢弃)的东西,如果你在学习过程中随机丢弃、关闭一些单元,你可以获得更高效的学习,防止网络死记硬背。这时我们发现工程和生物学惊人地殊途同归了。事实证明,大脑中的突触,特别是皮层中的突触是概率性的。也就是说,有时你有输入但没有输出(这看起来像是一种生物故障,但实际上就是大自然的 dropout)也许这有助于我们理解为什么大脑是概率性的。此外,这在能量上非常高效,因为你不希望所有突触同时活跃。所以如果你只有一小部分可以激活(稀疏激活),你实际上可以学得更好,而且能耗更少。2024年诺贝尔奖授予了我的论文导师约翰·霍普菲尔德和杰弗里·辛顿。当杰弗里发表诺贝尔奖演讲时,他说:“特里和我原本确信我们会因为解释大脑如何工作而获得诺贝尔奖。结果我们在这方面错了。(因为玻尔兹曼机并没有成为最终解释大脑的完美模型,后来反而是不那么‘生物’的反向传播赢了)但这对于物理学诺贝尔奖来说已经足够好了。” 尽管如此,我们早期一起做的这项工作得到认可是很棒的。04 为什么从生物角度入手的AI研究得了物理学奖 郝博阳:这仍然很有趣,辛顿获得物理学诺贝尔奖,因为对我来说,玻尔兹曼机更像是试图解释大脑的生物学机制。谢诺夫斯基: 玻尔兹曼机受到生物学的启发,但它确实是物理学。分析和洞察都来自物理学——特别是统计力学,我们将神经网络的状态看作是一个物理系统的能量状态,学习就是寻找能量最小化的过程。所以这是完美的。但很多人质疑,这与物理学有什么关系?事实证明,物理学是现代AI的灵感来源。上世纪的现代AI完全由逻辑和规则主导(即符号主义AI,试图把所有知识写成代码规则),这一切现在都改变了。现在物理学家已经进入这个领域,不仅仅是约翰·霍普菲尔德,还有许多物理学家,比如海因茨·泽波林斯基(Haim Sompolinsky)、拉里·阿博特(Larry Abbott)。我们三个人几年前获得了大脑奖(Brain Prize),这是神经科学领域的最高荣誉。这是因为我们建立了这个领域——计算神经科学——它真的起飞了,并且真正帮助神经科学家理解大脑整合的方式。 实际上,我们早期工作中产生了一个非常重要的一般原理,那就是:在上个世纪,神经科学的焦点是单个神经元。我们现在有工具和技术。例如,大脑计划(Brain Initiative)是科学和工程中的一个重大挑战。在过去十年中,我们从一次一个神经元发展到现在的记录是同时一百万个神经元,神经科学家通常可以在数十个大脑区域记录数千个神经元。所以,现在我们有了全局图景,这确实给了我们与上个世纪不同的视角。这仍在进行中,但通过分析所有数据,我们开始理解大脑中的大规模活动模式。即智能不是源于某个超级神经元,而是涌现于成千上万个神经元的集体协作之中。我认为这真的是从我们早期所有工作中产生的。05ChatGPT是一个可以被完全“解剖”的大脑 郝博阳:与您当年构建玻尔兹曼机(早期神经网络模型)的时代相比,现在的大型语言模型(LLM)与人脑有什么本质不同?现在的研究似乎认为,Transformer架构本身的工作方式可能并不像人脑。谢诺夫斯基:现在,我们唯一能确定的是:它不是人类。它可能是大脑某种功能的简化版本,但它的底层机制绝对不是人类的大脑(它基于硅基芯片和反向传播,而非生物神经元和化学递质)。 但这正是令人兴奋的地方。虽然它可能不是人类,但我们拥有对它的完全访问权——这与大脑不同,大脑太复杂了,我们永远无法无损地获取每一个神经元的细节。但对于这个模型,我们知道它的每一个细节。ChatGPT本质上就是一个巨大的方程,一个单一的、虽然庞大但确定的数学方程,你可以把它完整地写在黑板上。你可以访问每一个输入数据、每一个神经元的激活模式,以及它们随时间变化的动态,所有这些都是可以被拆解分析的(这被称为“机械可解释性”)。所以现在的挑战是:动用数学、物理学和工程学的全部武器库,去搞清楚这个大方程究竟是如何运作,从而能够以这种(看似有智能的)方式回应我们。谁比数学家更懂方程呢?因此,世界上最顶尖的数学家现在都开始研究这个问题。所以我认为,我们获得对它深刻的数学理解,只是一个时间问题。其实在过去几年中,出现了一个全新的领域,叫做神经AI(Neuro-AI)。这是什么?这是两类人群的交集:像杰弗里这样致力于创造更好AI的人,和像我这样致力于理解大脑运作的人。这是历史上第一次,这两个群体可以真正地相互对话,因为我们开始使用相同的数学语言、相同的底层原理(如神经网络、优化函数)。现在,通过观察AI的表现,它确实可能反过来帮助我们理解大脑。我认为未来将是这种双向的启发和交流。所以我认为我们最终将能够完成两件事。首先,从数学上彻底理解这些大语言模型是如何工作的,并制造出更好的版本。这方面仍有巨大的改进空间。一旦我们以深刻的数学方式理解了这些“通用智能原理”,这将反过来帮助我们理解并解释人类自己的行为方式和思考方式。所有这些突破可能会在未来几十年内陆续发生。但基础研究可能需要更长的时间来沉淀,就像物理学的发展史一样。举个例子,量子力学诞生于20世纪初,但它花了几十年,许多许多个十年,才被转化为实用的技术,比如激光。你知道吗?最早的激光器,需要一个诺贝尔奖级别的物理学家才能把它造出来,而且它需要整整一个房间的光学设备。但在那种情况下,可能过了50年,甚至60、70年后,量子力学才真正变成了支撑现代通信网络、计算机芯片工作方式的基石。但这一切辉煌,都源自物理学早期的那些基础研究。06AI缺失的大脑拼图之一:基底神经节郝博阳:强化学习是实现(通用)机器学习的最佳路径吗?谢诺夫斯基:让我们退一步,先看看人类大脑是如何学习的。回想一下你的求学经历,你在学校里主要在做什么?在学习阅读,对吧?这需要极其漫长的时间,往往耗费数年之久。你花了多久才学会?郝博阳:大概需要20年甚至更久,才能真正读懂深奥的文章。谢诺夫斯基:没错,20年。这是巨大的时间和精力投入。像“视觉”这样的能力,你完全不需要刻意学习就能掌握(这是进化赋予的本能,写在基因里);而理解、阅读、写作,以及数学、算术,却需要几十年。你需要漫长的过程去学习乘除法、平方根、分数,再进阶到微积分等等。从进化角度看,大脑原本并不是为了处理这些任务(数学、阅读)而设计的,但它却具备学习这些的能力。我们是怎么做到的呢?事实证明,我们是调用了大脑的一个特定区域来完成这件事的,这个区域的设计初衷是为了帮你自动化地学习技能。举个例子,学骑自行车。第一次骑你会摔倒,你不知道如何保持平衡。但通过练习、练习、再练习(“试错”过程),最终这些动作变成了一种自动化的反应。你甚至意识不到你在做这些动作,意识层面根本无需介入。在大脑解剖学中,负责这部分功能的区域叫做基底神经节(Basal Ganglia),它位于大脑皮层下方。它的核心作用是学习一连串的动作以获得奖励(Reward)。在这里,“奖励”可以是成功骑稳了车、打赢了网球,或者是解出了一道数学题。这是一个与大脑皮层互补的学习系统。大脑皮层负责你有意识感知的“认知部分”(即知识和推理),而基底神经节负责基于奖励的“强化部分”(即行为和直觉)。你需要两者结合:既需要强化学习(Action/Reward),也需要认知学习(Knowledge/Reasoning)。反观现在的AI(主要是大语言模型):我们有了强大的“认知部分”(类似大脑皮层,通过海量数据预训练获得),但我们缺乏深度整合的“强化部分”。虽然现在AI也会用到强化学习,但这通常只发生在预训练结束后的微调阶段(即RLHF,人类反馈强化学习)。在AI领域,我们将这称为“对齐”(Alignment,即让AI的价值观符合人类利益)。现在的做法是把“对齐”放在最后一步(微调)来做,但这太晚了。强化学习应该贯穿于AI发展的整个过程,就像人类成长时,大脑的这两个部分是同步发育、相互交织的一样。在人类社会中,这种“对齐”是从小就开始的,这样人们才能在同一种文化下协作。这种协作需求真正推动了语言的发展。语言的进化是非常晚近的事情,大约发生在几十万年前。人类语言的存在初衷,就是为了帮助小群体进行社交协作。比如,通过语言沟通,大家才能一起合作捕猎巨大的猛犸象。这种协作还需要利用资源的能力。如果你在茫茫草原上,你必须知道哪些植物根茎可食用,哪些有毒。这些知识都是通过文化传承、通过一代代的试错得来的。所以,你需要“认知”来传递信息,也需要“强化”来筛选生存价值。这就是人类进化的方式。我认为,既然我们试图让大语言模型更接近人类的思维方式,那么AI的发展最终也会遵循这条(认知与强化深度融合的)路径。07AI缺失的大脑拼图之二:内在的生命力和反思郝博阳:理查德·萨顿(Richard Sutton,强化学习之父)最近提到,现代AI缺乏“元学习”(学会如何学习)和“持续学习”(终身学习而不遗忘)的能力。我们该如何将这两个关键特性融入到现在的模型中?谢诺夫斯基:我们要做的不仅仅是在现有模型上打个补丁、附加一些功能那么简单。我认为,我们需要对整个架构进行根本性的重组。我所说的架构,是指神经元的组织和运作方式。目前我们对大脑的理解中,有一些关键机制还没有被AI借鉴。我给你举一个例子:神经调质系统(Neuromodulator System)。什么是神经调质?在现有的大语言模型中,神经元之间只有简单的突触连接,它们通过加权求和来处理输入(这是一种静态的权重)。但生物大脑中的神经调质完全不同,当它建立连接时,它能改变神经元整合信息的方式。换句话说,它是在动态地“调制”输入信号(就像调节收音机的音量或频率,而不仅仅是传输信号)。大脑中有数十种神经调质。比如多巴胺(Dopamine),我们知道它对强化学习至关重要。现在的AI中已经有了它的对应物,叫做时间差分学习(Temporal Difference Learning,简称TD Learning)。我们知道生物大脑中的多巴胺神经元就在执行这个算法。它的核心逻辑是:只有当你获得的奖励比你预期的多或少时,学习才会发生。这就是“奖励预测误差”信号(Reward Prediction Error,即“惊讶”驱动学习)。除了多巴胺,还有专门用于处理“惊讶”的其他调质,以及用于社会整合的调质——比如催产素(Oxytocin)。它对于生命早期母亲与孩子之间建立情感纽带(Bonding)非常重要。这很有意思,杰弗里·辛顿(Geoffrey...

MiniMax闫俊杰:中国不乏AI人才,但我们需要去做难而正确的事

近日,MiniMax稀宇科技创始人兼CEO闫俊杰做客《罗永浩的十字路口》节目,接受了长达4小时的访谈。在节目中,闫俊杰和罗永浩聊了很多,从MiniMax为何押注全模态、公司的定位和价值体现,到AI时代的核心竞争力、人才差异等话题。通过观察者与AI从业者的双重视角,拆解了当前AI行业的发展趋势及其未来方向。1989年出生的闫俊杰,是中科院博士,曾做过百度AI研究院实习生、在实验中提前窥见AI的未来形态;后续进入商汤科技,带领700余人攻克面部识别算法,做到了行业第一。在做到商汤副总裁时选择AIGC技术迸发的节点辞职创业,成立了MiniMax。如今,公开数据显示,公司估值超过40亿美元。据全球权威测评榜单Artificial Analysis显示,MiniMax-M2以61总分位居全球大语言模型第五、开源第一,整体性能达到全球第一梯队水平。MiniMax-M2是一款10B激活参数(总参数量230B)的轻量级模型,通过高效的MoE(混合专家)架构实现低算力成本(仅为Claude4.5的8%),价格优势明显,上线一个多月tokens调用量已突破1万亿次。值得一提的是,MiniMax是一家从成立之初就押注全模态的AI独角兽,目前在语言模型、视频、音频赛道均做到全球领先(音频全球第一、视频第二),同时还孵化出Talkie、海螺视频等风靡海内外的AI原生应用,在大模型领域显得独树一帜。随着竞争的白热化,AI大模型已经从单纯的算力比拼转向更多维度、场景泛用性、硬件协同效率及部署成本均成为关键。面对行业变化,大批大模型初创企业转型或倒闭,而MiniMax则坚定全模态发展路线,这是闫俊杰和团队在公司创立之初就定下的基调。闫俊杰认为,真正的AGI(通用人工智能)一定是多模态输入和输出的,只是实现起来太难了,所以要先把每个模态先走通,在合适的时机进行整合。“我们现在基本走通了,未来几个月将探索多模态融合。我觉得我们在全球范围内是比较少见的公司,也是有机会能做成(AGI)这件事的。”闫俊杰显得信心十足。做“难而正确”的事,正是MiniMax这家公司的生存之道。本次访谈的核心观点如下:全模态发展并非“不聚焦”,而是实现AGI的必要途径。MiniMax现在已经具备基础条件,未来将探索全模态融合。大模型时代,真正的产品就是模型本身,正在改变创意和生产力。随着大模型的进化,未来的应用形态能够服务于所有人,实现MiniMax的愿景“Intellience with Everyone”。技术驱动是MiniMax的核心竞争力之一,在此基础上专注国际化和直接服务客户,率先实现商业化落地,因此在融资方面非常顺利。对于中国AI公司来说,一定不是“拿来主义”,需要做本土的创新。AI时代,最核心的竞争力是想象力。在未来AI竞争的关键节点,中国公司的挑战是如何发挥环境和人才优势,取得技术和话语权上的引领。以下为采访节选,中国商业科技新闻网在不改变原意的情况下进行精编整理:01 预见Scaling Law:驱动闫俊杰创业的关键时刻罗永浩:你说你本来是要做老师的,怎么后来又去创业了?闫俊杰:我本科是东南大学数学系,后来去中科院自动化所硕博连读。硕博连读时主要就是写论文、搞科研,当时就觉得这个专业不太好找工作,以后就是当老师什么的。转折点是2014年深度学习出来时,我当时在百度研究院实习,当时百度有国内最大的GPU集群,环境非常好。我当时可能用了他们三分之一的GPU来做实验,让我意识到AI真的可能会带来实际价值。罗永浩:所以其实你们提前看到了一些东西了,公众其实是GPT 3.5时才看到突破。闫俊杰:坦白说我觉得国内有点遗憾,其实当时Anthropic的CEO恰好在百度做语音,已经发现了Scaling Law(规模化法则或缩放定律)就是大模型里面最核心的原理,这件事是发生在中国公司的,(中国没做出来类似GPT 3.5的产品)很遗憾。罗永浩:后来你在读博士后时期就去商汤科技实习了是吧,又用很短的时间做到副总裁和CTO(首席技术官),怎么实现的?闫俊杰:我觉得主要是承担了重要职责,大概用了一年半把面部识别技术做到了行业第一。在这个过程中,让我意识到两件事,一是要做取舍,专注更加长期、能够引起质变的技术,而不是修补;其次就是再次意识到Scaling Law的重要性,因为以前每个模型只能做一件事、适配一个场景,但受限于资源和人手,就选择做一个相对全能的模型来应对所有情况,结果非常理想,这也成为驱动后来创业的原因之一。02 全模态发展是AGI必由之路,国际领先的潜力更加突出罗永浩:你们十月份发布了新一轮的模型,“吹吹牛”吧,我是指真实的成绩。闫俊杰:(笑)我们大概是在两年前的时候做到音频(模型)国际领先,一年前视频国际领先,但语言模型一直还没有做到国际领先。这次语言模型在国际上也比较受到认可,然后有很多开发者用它来做Agent、来写代码,这个事儿我觉得是一个非常大的一个进展。客观来看,我们几乎是中国唯一一家在语言模型 、视频、音频领域,都做到国际领先的公司。罗永浩:还包括音乐吧?现在也是第一梯队。闫俊杰:对,三强之一。但其实这是一个很难的事(做全模态),外界就很奇怪一个创业公司什么都做,是不是“不聚焦”?罗永浩:是有很多人这么问么,不聚焦?闫俊杰:对。其实我们一开始就想得比较清楚,真正的AGI一定是多模态输入和输出,只是实现起来非常困难。我们的想法就是把每个模态先走通,找合适的时机再进行整合。比如Open AI的Sora2 ,就是典型的多模态融合 ,获得了巨大的成功。我觉得目前我们基本上具备了基础,每个模态都已经有了数据、使用场景,我希望在接下来几个月把它们整合到下一代模型里。我觉得在全球范围内,我们应该是少数有机会能够做成这件事的公司。罗永浩:但是跟国外的这些竞争对手比对,花的钱还是少了不知道多少倍。闫俊杰:对,这其实和中国固有的优势有关。我觉得最核心的一个点是,美国真正能做大模型的其实只有四家公司——谷歌、OpenAI、Anthropic和xAI。这些公司估值可能是中国公司的100倍,但是技术就领先5%,投入可能在50至100倍之间。话说回来,为什么中国公司可以花他们五十分之一的钱就可以做出来,性能差距可能只有5%,甚至这个差距我认为在过去一年是在不断变小的,我觉得核心原因是因为中国人才是非常好的。03 中国土壤将孕育出本土顶级AI原生人才闫俊杰:现在中国有非常多优秀的年轻人,包括我们(公司)在内,还是能够有一种机制,将优秀的年轻人组合在一起,这是比较关键的。当然,我在想如果中国的年轻人出来几个技术天才,会成为中国AI领域的一个突破点,我觉得可能两三年内会出现。罗永浩:对,一定会出现这样的人。闫俊杰:并且这种人才一定在中国本土环境里成长的人,而不是美国回来的。罗永浩:你们大部分人才都是本土的么?没有海归么?闫俊杰:我们有海归,但是真正在公司起到关键作用的人才,基本上都是来自本土,是他们的第一份工作。罗永浩:这个事情还挺很神奇的。按我的理解,在AI领域我们是学习和追随者,但是并不依赖海归华人也能搞定,像梁文锋(DeepSeek)那边一个海归都没有,这些年是发生了什么变化么?闫俊杰:我觉得人工智能不是玄学,可以用第一性原理来拆解,所以把每个技术部分做好并且持续积累,比如算法设计、数据链路搭建、训练效率优化等,就会看到好的结果,这是第一点。其次是客观来看,中国算力相比美国差距较大,这种情况逼迫中国公司去创新,才能达到美国公司那样的效果。在大的原则上大家可能是一致的,但是中国技术在不同模块上都有创新,(与美国)又不完全一样。04 天价挖人VS.本土创新,中美AI路径不尽相同罗永浩:前一阵子Meta的扎克伯格高薪挖人,上亿美元年薪,大家就觉得这个薪水很高。但如果结合这些人在OpenAl的工作经验来看,性价比是很高的,但前提Meta依然要提供足够的资源和资金供他们研究。那么这种“烧钱”的做法是不是对于我们来说就没那么实用?闫俊杰:对,我觉得这是一个很好的视角。我认为烧钱肯定有用,但仅仅烧钱又是不够的。对于中国AI公司来说,一定不是“拿来主义”,需要做本土的创新。罗永浩:还有一个趋势是过去硅谷的公司可能30%是华人、30%印度人;但现在硅谷AI公司华人的比例远高于印度人,这是个什么原因?闫俊杰:其实在AI这个领域一直是这样的。大概是十几年前,那个时候的AI前身是计算机视觉,在这个领域里华人占比就很多。来到大模型时代,华人占比就更多了。一是因为华人比较聪明,数学和编程能力较强,另外还需要长时间的努力,同时具备三种特点的人确实很多是中国人。罗永浩:刚起步的时候,是凭什么吸引到第一波愿意追随你的人?是你发表过的论文和学术成就,还是高工资?闫俊杰:我觉得对他们来说,第一要素一定是他们是相信的,不是相信我,而是相信AGI本身。对于优秀的人才来说,首先钱肯定是要到位的,但比钱更重要的是热爱,钱只能排第二。客观来说,中国目前还没有伊利亚(Ilya Sutskever,OpenAI前首席科学家、联合创始人)那种最TOP级别的天才。中国有这样潜质的人,但暂时还没变成那样,那他能否在一个环境里变成那样,我觉得这件事对这些人才来说是更重要的。05 大模型时代真正的产品是模型本身罗永浩:按我的理解,没有像你们押注全模态的公司是因为资源不够,是这样么?闫俊杰:我觉得不完全是,可能更多是取决于大家背后的出发点是不一样的。罗永浩:那是否跟你们的变现能力有关系?像你们这种纯科研的公司,能把C端产品做得那么好的不多。闫俊杰:其实就是把技术能力做好,做到行业需要你,商业化能力自然水到渠成。这里面的一个本质逻辑是“AI大模型本身就是产品,而通过模型做出来的产品(或者说应用),实际上是一种渠道。”通过模型衍生出的应用形式,不管是面向B端还是C端市场都能实现其价值,便会受到市场的认可。比如视频模型,现在全球每天都产出上千万两级的视频,在创意领域就有很高的价值,这在半年以前还是无法实现的。罗永浩:这又涉及到一个问题,如果模型本身是产品,那么最强模型不就是通杀吗?如果是这样,那么整个行业是不是都会被颠覆,比如我们内部某个部门就都裁掉了?闫俊杰:其实过去几年我一直在想,首先我觉得每个职能都是有价值的。罗永浩:听着像安慰……闫俊杰:不是的。目前一个核心的原因是,还没有哪个模型是所有领域最好的,各自有不同的特点,比如说有的语言模型对话很流畅、有的写代码比较好等等。罗永浩:你不是说后面会融合,融合完了最强的就全通吃了么?闫俊杰:比如说还没有融合的时候,为什么那么多公司的模型都有人在用呢,而且大家的用户量都在增长。其实核心原因是一个经济行为,就像汽车一样,有很多品牌瓜分市场。不同公司的商业属性也不同,所以会有差异。所以说,其实大家都会有自己的生存空间,并且模型能力越强、商业价值越大,整个市场是越来越大的。06 AI不是互联网的延伸,而是新的生产力罗永浩:因为大模型的能力越来越强,都说很多职位会被取代,我觉得产品经理的未来可能一面是天堂、一面是地狱。你给我们产品经理把把脉,未来出路在哪?闫俊杰:我猜一定会出现一种新的形势。根据我的观察,一个明显变化是现在产品经理可以借助AI写代码直接拿出Demo而不是PRD(产品需求文档),工程师如果有好的想法也可以做出很有创意的产品。AI的出现很大程度上同时降低了做创意和生产力的门槛,本质上是将核心竞争力从技能转变成“想象力”,不再受限于谁只会写代码、做产品或是做算法的约束去掉了。罗永浩:所以你的意思是,将来一个很小的公司也能做成很大的事,创始人可能是产品经理出身、也可能是工程师出身?闫俊杰:对,AI作为工具大幅降低了做生产力的门槛,所以本质上核心竞争力就变成了“想象力”。从理论上来说,谁有最好的想象力、谁能坚持,然后产品出来对社会价值更大,那就会获得成功。我现在的理解是AI行业不应该是互联网的延续,从这个角度来说就不必在意移动互联网时代的分工。其实我们自己也有这种感觉,就是做出来成功的模型比我本人聪明,就会感觉有点害怕(笑)。07 AI Native 公司的人才观和组织创新罗永浩:DeepSeek爆火之后,你们从春节开始到现在也快一年了,这期间工作上有什么调整么?闫俊杰:有,其实是有一个非常大的调整,因为我们这种公司必须每年都有进步,不进步就可能挂掉了。DeepSeek让我们意识到算法和基础设施一定要是一体的,相当于一定是所有人要优化一个目标而不是分散的。这件事其实让我们的组织上发生了非常大的变化。罗永浩:这么大的调整?你们内部是用OKR(目标与关键成果法)吗?闫俊杰:对,这就是一个典型的例子,我们曾经试过OKR,但发现根本行不通。这也是为什么我说AI行业不是互联网行业的自然延伸,它是一个新的行业。罗永浩:KPI呢,更行不通吧。闫俊杰:行不通,所以我们没有组织工具。罗永辉:那如果公司到了几千人规模如何管理?闫俊杰:我认为AI Native公司(原生AI公司)的组织和大模型有相同之处,几种不同画像的人才对应“多模态”,能够在基于底层原则的情况下进行排列组合,产生更丰富、更多样化的东西。当然对于人才筛选肯定是有底层原则的,第一是足够聪明,能够有悟性,自我学习,主动发现;第二有热情,热情是没有办法被表演的;第三,这个领域没法个人英雄主义,需要很多人合作,需要很好的合作能力。在这个基础上,我觉得一个人在不同阶段承担的职责不应该再遵循互联网的定义,而是通过组织创新更灵活地用人,在不同阶段实现不同排列组合。如果我们没有做一些组织上的创新,那么很多模型是做不出来的。罗永浩:公司有没有遇到特别困难的时候,如何提升士气?闫俊杰:士气低迷的时候,通常需要用第一性原理拆解,让大家接受这件事是可行的。其次就是给大家发更多的钱,让努力获得反馈。我觉得背后的意义在于大家在一起有希望,即便是遇到挫折,也还是能够做更好的东西。08 三个原则,驱动MiniMax不断前进罗永浩:我觉得你们公司让外界看不明白的一点是,你们明显是一个技术型驱动公司,那么为什么做出了好几个成功的To C产品?闫俊杰:首先我们有非常好的产品经理,对技术理解很深、产品能力也很强。另外,公司成立之初定下三个原则:技术驱动、直接服务客户和国际化,到今天我们也是在坚持的。技术驱动对于我们来说其实是最难的。通过模型能力赋能业务或产品,和直接复制移动互联网已有的成功案例,这两种路线可能都是正确的、但无法共存,我们后来意识到只有技术驱动是更适合我们的。罗永浩:所以你们融资非常顺利,上一轮估值超40亿美元了吧。闫俊杰:这里面的两个逻辑第一个是技术的领先性,第二是技术领先后能够带来的收入跳变。从公司经营层面来看,我们一直在优化这两个目标,并且每次实现后,规模和量级都实现了很大的增长。因此,我们对股东、员工的严肃承诺几乎都实现了,后续融资自然更加顺利。罗永浩:最后一个问题。公司做到了现在这个阶段,你的终极愿景是什么?闫俊杰:我思考的更多是两个问题。一是AGI行业什么时候能够真正带来GDP上的变化;其次是目前行业还是美国公司引领,如果到了关键节点,中国公司能否实现超越。我觉得中国已经有这个环境了,但是中国的AI人才需要更加自信地成长起来,我希望在三年内看到变化吧。 ...

Recent articles