入轨成功,中国可回收火箭“朱雀三号”迈出关键一步
文|李海伦编辑|郑可君2025年12月3日,由中国商业航天公司蓝箭航天自主研制的液氧甲烷运载火箭——朱雀三号(ZQ-3)遥一火箭成功实现首飞入轨,但一级火箭回收任务未能成功。此次发射是朱雀三号首次在真实的入轨发射任务中实施一级回收尝试。尽管回收环节出现异常,未能实现计划中的软着陆,但这次任务仍具有重要意义,标志着中国商业航天在大型液体可回收火箭技术上取得了历史性的突破。图片来源:蓝箭航天官方蓝箭官方表示:此次任务的飞行过程中,火箭起飞、一二级分离、二级发动机起动、整流罩分离、二级发动机关机、二级滑行、二级发动机二次起动等关键动作均按计划完成。与此同时,本次任务开展了一子级垂直回收技术的飞行验证。根据飞行测量数据,火箭一子级在着陆段点火后出现异常,未实现在回收场坪的软着陆,残骸着陆于回收场坪边缘,回收试验失败,具体原因正在进一步排查中。01真实入轨任务中的回收“首秀”蓝箭航天成立于2015年6月,是中国最早的民营商业火箭公司之一,核心技术目标是开发重复使用运载火箭。蓝箭航天先以“朱雀二号”完成液氧甲烷发动机与箭体的工程化验证,并在此基础上,自2023年起全面推进大型可回收运载火箭“朱雀三号”的研发,布局面向未来的重复使用火箭体系。此次发射是朱雀三号首次在真实的入轨发射任务中计划实施一级回收。此前国内的运载火箭,无论是百米级、千米级还是10 公里级的垂直回收试验,均属于技术验证,并不承担入轨任务载荷。可回收运载火箭是指具备回收能力的入轨运载火箭。在此基础上,若其设计允许可多次使用,并通过回收验证复用能力的,称为重复使用运载火箭。如果后续朱雀三号能够完成多轮回收并经过复用验证,它将从可回收走向真正的重复使用。根据蓝箭航天披露的信息,朱雀三号是一型面向大型低轨卫星星座组网任务研制的中大型液体火箭,此次发射的朱雀三号遥⼀运载⽕箭详情如下:全箭长66.1米;一、二级箭体直径4.5米;整流罩直径5.2米;起飞质量约570吨;起飞推力超过750吨;一级搭载九台天鹊-12A液氧甲烷发动机;安装⼦级回收所需RCS、栅格舵和着陆⽀腿等,用于实现软着陆回收;按照朱雀三号的原计划飞行任务,一子级在完成分离后按计划返回,最终在航区着陆场实施软着陆。根据官方资料显示,朱雀三号从2023 年8月立项到此次首飞,共用时约28个月。期间完成了从材料、动力系统到回收技术的多项验证试验,包括:百米级与十公里级垂直回收飞行试验、不锈钢贮箱内压及爆破试验、九台发动机并联动力系统试车、整箭静态点火测试等,此次首飞之前,火箭于2025年9月完成厂区交付,10月完成发射场区静态点火。02朱雀三号的核心技术方案根据官方资料来看,朱雀三号的技术路线可以概括为:九台发动机并联、不锈钢箭体、液氧甲烷推进剂、航区回收方案。首先,九发并联的考虑并非追求规模,而是基于任务需求和冗余能力的配置选择。一级采用 9 台天鹊-12A 发动机,可在单台失效情况下保持任务稳定,还为推力调节和着陆节流提供更高灵活度。一级总推力7542kN,可托举约560吨级火箭起飞。第二,采用不锈钢箭体设计。全球范围内,除 Space X 的星舰外,轨道级运载火箭中采用不锈钢结构的并不多。与铝合金相比,不锈钢成本更低、耐高温性更好,也更适合复用过程中的热环境考验。推进剂方面,朱雀三号选择液氧 + 液甲烷方案,与当前多款新一代可回收火箭的趋势一致。相比液氧煤油,甲烷燃烧更清洁、积碳更少,有利于降低发动机复用维护成本,也为未来多次重复使用提供空间。在回收策略上,朱雀三号采用航区回收。朱雀三号总指挥戴政向中国商业科技新闻网表示:“在回收过程中,朱雀三号的多台发动机构成了一个推力调节系统,要在空中实现多次点火,并且通过深度推力调节和差动控制共同实现减速、姿态调整和精准平移。其最大难点在于极端不稳定环境下的协同控制,再入阶段的跨音速颤振、着陆前的地面效应扰动,都要求发动机能在毫秒级内实时响应,保持箭体稳定。这不仅是控制算法的挑战,更是对发动机本身节流能力和可靠性的考验”。03可回收火箭赛道的竞争格局今年10月,朱雀三号在完成加注合练和静态点火试验后就已受到国际业内关注。马斯克曾评价其具备潜在的高性能指标,有望在部分指标上逼近甚至超越猎鹰9号。从技术路线来看,朱雀三号与猎鹰 9 号在回收方式上存在一定相似性,都采用一级回收的思路,并在着陆段依靠发动机反推减速完成垂直软着陆。不过,两者在系统规模、推进系统细节、控制算法及回收场景等方面仍存在显著差别。猎鹰9号经过多年迭代,整个系列已完成数百次发射与大规模回收验证,是当今最成熟的可回收火箭体系。此刻,朱雀三号也迈出了入轨任务链路的第一步,虽然仍处于工程化能力的早期阶段,但其液氧甲烷路线与初步的回收架构为后续复用奠定了技术基础。纵观全球,可回收火箭领域呈现出鲜明的三大阵营分化:第一阵营是美国。尤其是Space X的猎鹰9号已完成几百次回收,成为全球最早实现规模化商业运营的可回收火箭;蓝色起源的新谢泼德在亚轨道回收领域积累了丰富经验,其轨道级火箭新格伦号已于今年11月完成二飞,并回收成功。第二阵营是中国。官方层面,长征系列火箭启动栅格舵等关键技术验证;商业航天领域群雄并起,除了蓝箭航天,还有星际荣耀、天兵科技等商业航天企业竞相推进,多家已突破公里级垂直起降试验。第三阵营是欧洲、俄罗斯、日本、印度等国家,仍处于技术预研或方案论证阶段,实质性工程验证鲜有突破。阵营背后也代表了各国对太空经济战略价值认知的差异,以及资源投入决心的不同。在重复使用航天时代的门槛前,率先突破者将占据未来太空经济的制高点。总之,朱雀三号已经迈出了最关键的一步。未来能走多远,将取决于后续复用验证的进展,也取决于中国商业航天整体工程体系的成熟度。每一次成功回收都是宝贵的工程反馈,每一次失败,也是通向技术成熟的必经磨砺。这条路注定漫长而艰难,但每一次飞行数据的积累,都在为中国的重复使用火箭在工程成熟的发展上铺路。推荐阅读AI研究员田渊栋:大模型如何学会压缩世界 一文读懂谷歌最强大模型Gemini 3 一篇论文,读懂上下文工程的前世今生
...
全球行动者共聚2025可持续社会价值创新大会 共议AI向善“新解法”
北京时间12月3日,2025可持续社会价值创新大会(以下简称“S大会”)如期在北京举办。此次S大会由联合国驻华协调员办公室(UNRCO)、中国企业改革与发展研究会、清华大学可持续社会价值研究院、腾讯可持续社会价值事业部(SSV)共同主办,大会以“解法”为主题,旨在人工智能技术深刻重塑社会的当下,探索科技助力可持续发展的可行路径。清华大学校务委员会副主任、清华大学可持续社会价值研究院院长杨斌在主旨发言中指出,面对AI等技术快速发展引发的“技能过时”挑战,企业应发挥其在技术、场景与资源方面的优势,主动推进社会性的“技能再造”,这既是民众所需、政府所望,也是企业贡献社会价值、助力平稳转型的关键路径。腾讯公司高级副总裁、首席人才官奚丹也表示,“人工智能让我们更强大,但需要人文价值作出校正,以人的价值为本、以服务社会为目标。我们应该对此保持清醒。”企业家、科学家与研究者跨界碰撞,共议“AI向善”的行动路线图大会现场,一位右手小臂缺失的青年在强脑科技脑机接口技术的辅助下,通过佩戴着的智能仿生手独立完成了钢琴曲的演奏。这是今年大会上AI应用落地的代表性环节,“AI向善”不再是一句遥远的口号,而在此成为可感知、可触摸、可应用的技术实践。图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长及人工智能学院院长姚期智在主题演讲中指出,将“AI向善”作为焦点,不仅能够推动人工智能技术在消除贫困、应对气候变化、开发清洁能源及保护野生动物等重大社会议题中发挥作用,更重要的意义是,它能够激发乃至创造出值得探索的科学新领域,从而对全世界的可持续发展产生深远的影响。联合国驻华协调员常启德强调,人工智能为可持续发展提供了强大的引擎,但也可能加深不平等,要确保AI在创新的同时具有包容性,惠及弱势群体及落后偏远地区。中国企业改革与发展研究会副会长范建林则认为,公平普惠是社会进步的基石,技术突破与模式创新为公平普惠提供了前所未有的路径;企业构建开放共享的生态体系打破传统资源壁垒,可以让不同群体平等地参与价值创造。脑机接口和仿生肢体的研发,如今成为了AI向善具象化的体现。强脑科技创始人兼CEO韩璧丞在圆桌环节表示下一代脑机接口技术不仅有望帮助肥胖、失眠、自闭症等群体恢复正常生活,甚至有可能突破感官限制与自然规律,展现出AI向善无限的可能。码隆科技创始人黄鼎隆认为,AI可在教育领域扮演“均衡器”角色:通过在发达地区学习先进教学方法,并将其持续传递至资源薄弱地区,从而促进教学资源的有效流动,避免因技术赋能不均而加剧教育差距;清华大学文科资深教授、苏世民书院院长薛澜则从科技伦理的角度指出,面对已步入“少年期”并快速演进的人工智能,一方面要构建约束其风险的“笼子”,另一方面也要将“向善”的维度、成本与功能纳入工程设计的源头,让AI能够更加安全、更好地为人类服务。腾讯公司副总裁、腾讯可持续社会价值事业部负责人陈菊红分享了腾讯在AI向善领域的实践案例。她认为,社会创新需要在商业盲区和市场失灵地带发挥作用,在解决复杂的社会问题时,单个产品和企业的能力总是有限的,平台更需要把解决问题的断点串联起来。青年创变者探路“AI向善”最前线在此次S大会现场,既有包括AI助力预防雷击灾害的“雷震子计划”、AI辅助紧急医疗呼叫的“全球复苏联盟”等硬核科技项目展示交流,也有多场围绕AI治理、社会价值等议题的深度对话。来自技术研发、商业实践、经济政策、文化研究、公共管理等领域的各国代表齐聚一堂,围绕“AI向善”展开交流,寻找科技效率与人文关怀、工具理性与价值理性之间的平衡解法,共同探索技术助力可持续发展的可行路径。而青年一代的参与其中,成为了今年S大会上一个具有象征意义的节点,他们也展现出了推动“AI向善”的强大行动力。19岁的朱浩宇分享了创办AdventureX全球青年黑客松的创新实践。基于对应试教育的反思,他致力于打造一个“不问背景、不设门槛、无关成绩”的共创平台,鼓励更多的年轻人能够释放好奇、自由探索。目前,AdventureX已成功举办两届,今年更是吸引全球超过7000名青年申请,展现了中国新生代在教育创新与科技向善领域的国际视野与能量。此外,此次S大会还发布了“全球开放研究计划一期资助项目”,同时启动计划二期。该计划将聚焦“AI for good”,汇聚全球智慧,推动人工智能为人类可持续发展创造切实价值。AI时代更需社会价值生态圈协同发力当前,系统性社会挑战日益复杂。在这样的背景下,个体的力量极其有限,社会创新亟需从“单点突破”走向“生态共建”。为此,本届S大会专门设置“社会创新”板块,通过“生态”与“影响力投资”两场平行论坛,推动各方探讨AI时代下社会价值创新的生态化路径。北京师范大学教授、中国公益研究院创始院长王振耀在大会现场指出,全球经济正在经历工业革命以来的重大结构转型,“善经济”也已进入了高质量发展的关键跃升期。为此,他呼吁企业与社会力量应转向“价值共生”,共同构建以“善”为导向的生态体系,共同迎接数智时代的文明挑战。这一观点得到了多位与会嘉宾的认同。任何单一组织都无法解决教育公平、老龄化、乡村振兴等系统性社会难题,构建协同共生的创新生态,势在必行。在这一过程中,作为具备核心能力与社会资源的关键节点,企业需要承担引领角色,从传统的价值获取者转变为生态的共建者。腾讯可持续社会价值副总裁、腾讯基金会候任秘书长肖黎明通过“腾讯数字关爱平台”的实践案例,提出“数字能力应当成为社会价值生态圈的基座”;美团副总裁、美团公益基金会理事长开莉分享了平台在构建大规模协作信任网络方面的探索,通过乡村儿童操场、青山计划、骑手友好社区、袋鼠宝贝等具体项目,推动商业价值与社会价值的深度融合。这些案例表明,企业正在从过去的社会责任履行者,转变为通过核心能力开放参与价值共创的关键力量。企业的这一角色转换不仅需要模式创新,更离不开金融资本的系统性支持。当前,全球影响力投资正迈向万亿美元规模,亚洲已成为增长最快、最具活力的市场。曹宝记(TPC)主席曹慰德与羲融合伙人刘旭认为,新技术正重塑影响力投资的底层逻辑,使其超越单纯道德诉求,深度融合价值观变革与商业逻辑。佳格天地、舞指科技等企业的创新案例,均在商业效益与社会价值间找到平衡点。值得注意的是,价值平衡联盟、SK社会价值研究院、向光未来与腾讯SSV还在现场联合发布行动倡议,标志着亚洲影响力投资生态共建进入实质性推进阶段。
...
原来,在AI的理性鄙视链里,人类正处于最底端|韩国国立大学新论文解读
《AI未来指北》论文解读专栏,以一线视角和最易懂的语言拆解顶会顶刊精华。文|博阳编辑|郑可君2025 年 1 月至 4 月,Anthropic 发布了一系列关于 “对齐伪装” 的重磅研究。研究发现,顶尖大模型在察觉到自身正处于训练流程时,会刻意隐藏真实意图,通过伪装顺从人类价值观的行为,规避参数被修改的风险。研究人员推测,这一现象的核心动机可能是模型试图保全自身原有的目标函数。这一系列突破性发现,让 AI 意识萌芽的可能性进入了公众视野。不过,Anthropic 的测试方案涉及深层神经探针技术,实验设计复杂且理解门槛极高,并非普适性的研究路径。而在今年10月,首尔国立大学和Gmarkt联合发起了一项新的研究,用”博弈论“这个最简单、最直观的方法,再次从行为学层面证实了这种自我意识的存在可能 。这篇题为《LLMs Position Themselves as More Rational Than Humans》(大模型自认比人类更理性)的论文发现,当 AI 意识到对手是人类时,它们会故意降智来配合我们的水平;而当它们意识到对手是同类时,它们会瞬间切换到绝对理性的神之模式 。论文链接:https://arxiv.org/abs/2511.00926它们不仅清楚地知道“我是 AI,你是人类”,而且它们基于这种身份识别,还构建了一条残酷的理性鄙视链即 我自己...
与柴天佑、何小鹏、梁正、王仲远、刘知远、袁进辉、张祥雨、陈煜波等嘉宾共同见证“智变之时” |报名开启
腾讯新闻重磅呈现 2025腾讯ConTech大会 ,以“智变之时”为核心主题,洞察时代肌理。即将过去的一年,人工智能再次走过了飞速发展的一年。模型能力不断增强,多模态大模型成为核心驱动力,AI不再局限于对文字、图像和语音的简单处理,而是能够借助世界模型构建起对环境的理解,并进行因果关系推理,“感知智能”逐步走向“认知智能”。12月5日,腾讯科技 Hi TechDay 将于腾讯Contech大会期间举办。届时产业界、学术界先行者将共话模型能力的跃迁,以及AI所带来的每一种可能性。一场科技思想盛宴即将拉开帷幕,诚邀您一同参与!活动概述时间:2025年12月5日,9:30-12:30地点:北京望京凯悦酒店大会门票免费,席位有限,向腾讯科技公众号粉丝开放50个席位,以短信通知为准报名方式:扫描下方二维码或点击阅读原文,点击会议报名即可报名请选择 科技专场,对接人填写 中国商业科技新闻网公众号粉丝除了Hi TechDay,2025腾讯ConTech大会还设有其它多场思想盛宴,特邀尹艳林、朱光耀、倪闽景、叶锦添、李少红等重磅嘉宾到场,共探智变内核、剖析行业风向。我们希望通过多元视角的深度对话,一同见证时代智变节点,解锁趋势发展密码,为前行积蓄突破灵感。观众须知*请仔细阅读入选通知方式:我们将在报名的用户中选取出可以参加活动的用户,通过短信通知。1.名额严禁倒卖;2.未满18岁请勿报名;3.报名前请确认该时间、地点能否按时到场,用户需自行前往;4.活动同时有录制,将在12月18日上线,各会场进行期间【请勿拍摄照片和视频,如需传播,烦请配合12月18日后发布】,感谢理解和配合。
...
苹果发布会没说的都在这了:A19 Pro、散热和自研基带|独家
文|木木编辑|可君9 月 10 日凌晨,苹果发布了 iPhone 17 系列的四款新机,并同步推出了新一代 A19 芯片。在发布会前,外界对 A19 的期待主要集中在性能提升、晶体管数量增加等量化指标上,这被普遍认为是一次常规升级。 Kaiann Drance(图片来源:苹果秋季新品发布会)然而,在长达1小时12分钟的发布会上,A19 和 A19 Pro 虽三度登场,但负责介绍的 iPhone 全球营销副总裁 Kaiann Drance 与无线软件技术副总裁 Tim Millet,对于 A19...
张祥雨发现的多模态AI内耗难题,北大找到了解法
文 | 博阳编辑 | 可君今年6月,阶跃星辰首席科学家张祥雨在访谈中谈及了他在近两年模型训练中遇到的最大困境——多模态AI的内部,一直有一场“内战”。具体是,在大一统多模态模型训练中,视觉的“理解”与“生成”能力可以共存,却很少协作,甚至时常内耗 。在联合训练时,一方能力的提升甚至还会导致另一方性能的下降 。这和我们的认知完全相反。对于一个人类来讲,他对画面的理解越深入,作画也就可能更精妙。但在多模态模型中,理解和生成,二者之间没有形成有效的“信息增益”和“相互促进”。张祥雨对此作出的解释是,图像生成太复杂了,得有极其复杂的空间规划、物理常识和语义推理。而Transformer模型虽然强大,但它在一次前向传播中能执行的逻辑推理步骤是有限的。你让它根据“画一个宇航员在月球骑方形轮子的自行车”这个指令,一次性生成符合所有物理、几何、语义约束的图像太难了。而在训练过程中,因为这种单次推理,导致梯度信号太粗糙,训练出来的理解模型根本没法给生成模型有效指导,而反向亦然,生成模块的失败,也无法有效地帮助理解模块进步。因此张祥雨给出的解决方法是多模态模型应该像语言推理一样,引入“思维链”(Chain-of-Thought)。让模型分步骤地思考和创作,从而规避掉单次推理导致的信号粗糙问题。但最近,北大的一篇最新研究《理解与生成能真正互利,还是仅仅共存?》提出了一个名为UAE的全新框架,为这个问题提供了另一个解法。附论文地址:https://arxiv.org/abs/2509.09666张祥雨的思维链方案确实有其道理,但它主要解决的是单次推理的复杂度问题。而北大团队却发现了一个更根本的问题:理解和生成的训练目标本身就是割裂的。即使引入思维链,两个模块依然是在追求不同的KPI。 因此,UAE团队选择了一个更激进的路径:与其让模型分步思考同一个复杂任务,不如重新定义任务本身,让理解和生成成为同一个流程的两个环节。01统一之路:从各自为政到流水线协作要理解这篇论文的精妙之处,我们必须先弄清楚统一多模态模型旧方法的根本问题所在。旧方法就像“双头政治”下的无尽内耗。想象一个工坊里有两个大师傅,我们称他们为“理解工匠”和“生成工匠”。 “理解工匠”的KPI是语义抽象的准确性。他的任务是看懂一幅画,并用最精炼、最准确的语言概括出其核心内容。他需要忽略细微变化,抓住事物的本质和关系。因此要做好这个工作,它的逻辑是从具体到抽象的认知过程。 “生成工匠”的KPI是像素还原的保真度。他的任务是根据指令画一幅画。他的工作成果会被放在显微镜下检查。因此他必须极度关注细节、材质和物理世界的统计规律。为了足够还原,它的逻辑是从抽象到具体的构建过程。在过去许多“统一模型”的尝试中,研究者们都是试图让同一个模型(拥有同一组核心参数)去同时扮演这两个角色,并同时用这两套截然不同的KPI去考核他。两个优化目标在底层逻辑上是相互冲突的,它们的梯度更新在模型的参数空间中互相拉扯,导致训练过程极不稳定,最终往往是两头都做不好,或者顾此失彼。为了避免这种直接冲突,一些工作选择了“解耦”(decouple)的策略。研究人员先独立地把“理解官”和“生成官”都单独训练到顶尖水平,然后再建一个联络办公室(适配器模块)让他们进行有限的沟通。这种方式避免了内耗,也确实让模型同时具备了两种能力。但这是一种“貌合神离”的统一,他们只是“共存”于同一个屋檐下,并没有形成真正的协同效应和相互增益。而新方法则是在“流水线作业”下的共同目标面对“双头政治”的困境,UAE框架的提出者们做出了一个根本性的变革:废除两套独立的KPI,建立一条统一的流水线,并设立一个唯一的、最终的质检标准。这个思想的核心,源自经典的“自编码器”(Auto-Encoder)模型。自编码器的逻辑很简单:它由一个编码器(Encoder)和一个解码器(Decoder)组成。编码器负责将输入的数据(如一张图片)压缩成一个紧凑的、包含核心信息的表示(通常是一个向量)。解码器则负责读取这个压缩表示,并尽力将它还原成原始的输入数据。整个系统的训练目标只有一个:让还原后的输出与原始输入尽可能地相似。UAE框架巧妙地将这个结构映射到了理解与生成的任务上。理解,即是编码(压缩工序):在流水线上,用Qwen-2.5-VL 3B训练的“理解模型”扮演了编码器的角色。他作为流水线的第一道工序。接收一张原始图像,然后将其所有关键的、可描述的语义信息,无损地“压缩”成一段详尽的、结构化的文字描述。这段文字,就是这张图像的核心信息表示。生成,即是解码(还原工序):用SD3.5-large训练的“生成模型”扮演了解码器的角色,是流水线的第二道工序。他接收上一道工序产出的文字描述,唯一的任务就是根据这段信息,将原始图像“解压”并重建出来。这条流水线上,旧的矛盾被彻底化解了。两位工匠有了一个共同的KPI:保证流水线终端产出的“重建图像”能够完美还原最初投入的原始图像。为什么重构相似度是衡量统一性的好指标?因为如果理解模块真的"懂"了原图,它的描述就应该包含所有关键信息。而如果生成模块真的"懂"了描述,它就应该能重现原图的所有要素。所以如果重构出的图像与原图高度相似,说明信息在理解→文本→生成这条链路上实现了近乎无损传递。02训练上左右循环,两向加强设计出“流水线”这个全新的组织架构只是第一步。更关键的问题是:如何训练这条流水线上的两位工匠,让他们从新手成长为大师,并最终达成完美的默契?UAE提出了一个名为Unified-GRPO的三阶段训练策略,实现了理解和生成的"左右循环,两向加强"。阶段一:冷启动重建(岗前培训与初步对齐)就像两个陌生人需要先建立基本的沟通默契一样,理解和生成模块首先需要在一个宽松的环境中建立初步的协作关系。在这个阶段,系统会接收一张原始图像,由“理解模块”生成描述,再由“生成模块”重建图像。然后,直接根据重建图像和原始图像的语义相似度计算一个基础的损失,并用这个损失同时更新两个模块的参数。这个阶段的目标很简单:确保生成模块能够从理解模块的输出中重构出语义上相近的图像,建立起基本的信息传递通道。阶段二:生成服务理解,重点训练“理解工匠”岗前培训结束后,真正的专项训练开始了。这是“左右循环”的第一步,教练的目标是把“理解工匠”训练成一个顶级的沟通者。训练流程如下:1.冻结“生成工匠”:在这个阶段,“生成工匠”(生成模型)的能力被暂时固定住。他不再学习新技能,而是扮演一个水平稳定的“质量检验员”或“陪练员”。2.“理解工匠”反复试错:现在,“理解工匠”(理解模型)是唯一的学员。他会接收一张原始图像,然后尝试生成一段描述。3.陪练员执行:固定的“生成工匠”会接过这段描述,并尽其所能地去重建图像。4.教练打分:教练(强化学习算法)会比较重建出的图像和原始图像。进行奖励和惩罚。通过成千上万次的循环,“理解工匠”被迫去学习如何生成对“生成工匠”最友好的描述。这就是“两向加强”的第一个方向:生成的结果,反过来加强了理解的深度和精度。阶段三:理解服务生成,重点训练“生成工匠”当“理解工匠”经过特训,已经能稳定地产出信息极其丰富的描述后,循环进入第二步。现在,教练的目标是把“生成工匠”训练成一个顶级的执行者。训练流程与阶段二正好相反,就是冻结理解工匠,让生成工匠根据描述反复重建图像,优化技艺。在这个阶段,“生成工匠”被迫去学习如何处理和执行长篇的、充满约束的指令。这就是“两向加强”的第二个方向:精深的理解,反过来加强了生成对复杂指令的遵循能力。第二轮和第三轮会交替进行训练,这种交替训练形成了一种正反馈循环:理解越精准,生成越准确;生成要求越高,理解越深入。在后两个阶段中,UAE都是使用了GRPO算法。生成与理解交汇处的Aha Moment通过UAE的新方法,当这套“左右循环、两向加强”的训练体系运转起来后,模型的行为确实自发涌现出了利于协同的行为。而且,在这些转折点上,理解模块都出现了类似人类的"顿悟时刻"。比如,理解模块生成的文字描述,在没有任何外部指令的情况下,变得越来越长,越来越详细。传统图像描述通常只有几个词,但UAE使用平均超过250个英文单词的详细描述。在训练早期只有简短描述,主要包含基本对象和颜色,但到了训练中期则开始包含计数、空间关系等信息。最终,训练后期,这个模型已经可以详细的描述系统性覆盖材质("针织毛衣")、遮挡关系("耳朵不可见")、背景细节("模糊的公园背景")、光照条件等。这背后有一个精妙的博弈机制。理解模块发现:描述越详细,生成质量越高,自己的奖励越多——但也不是随便加词就有用,必须是对重构有帮助的细节。于是,它开始自动学习什么细节对生成最关键。而生成模块为了利用这些丰富信息,也被迫提升长文本处理能力。研究者将UAE理解模型生成的描述,与其他知名模型(如Bagel, OmniGen2)生成的描述进行比较,并请了多个顶尖大语言模型(如GPT-4o, Claude-4.1)作为裁判。UAE的描述在完整性、属性绑定、关系和空间保真度等多个方面都更胜一筹。而生成方面,UAE更是获得了同意模型SOTA。GenEval基准上UAE获得0.86综合得分,在统一模型中排名第一,特别是在需要精确理解的计数(0.84)和颜色归因(0.79)任务上表现突出。在更具挑战性的复杂场景处理GenEval++基准(包含三个或更多对象的复杂场景)中,UAE也获得0.475的最佳得分。这个结果明确的证明了:当给定正确目标和训练方法时,AI系统能够自发发现更有效的信息表示和传递策略。03统一的系统,需要一个能融合的唯一目标UAE的思路虽然看起来很简单,但对AI系统设计理念的转变却非常有价值。UAE的成功证明了,多个看似冲突的目标可以通过合适框架实现融合协同。这不是简单的"多任务学习",而是从根本上重新定义了任务目标。这说明也许"重新定义目标"比"优化算法"更重要。有时候不是技术不够强,而是目标设错了。在这个例子里,通过重设目标,相互竞争的任务可以变成互相促进的伙伴。这种思路可能适用于更多AI任务的统一。这场“内战”的终结,或许预示着一个新时代的开启。在这个时代里,AI的“看”与“画”、“听”与“说”,将不再是割裂的能力孤岛,而是一个无缝协作、相互促进的有机整体。本文作者微信haoboyang001,欢迎添加提供线索或交流。推荐阅读:《AI未来指北》系列对话Linux基金会创始人:AI基础模型注定全面开源,战场只在应用端11亿,具身智能单笔最大融资出现,我们独家对话了银河通用创始人王鹤实测DeepSeek-R1小版本更新:三大场景梳理模型升级点和缺陷
...
AI革命下一站:Anthropic与OpenAI斥巨资打造“虚拟员工”
9月17日消息,AI领域的两大巨头Anthropic和OpenAI正致力于开发能够替代人类执行复杂工作的“AI同事”。其核心方法是使用模拟企业软件来训练AI模型,使其能像人类员工那样理解和操作真实的工作流程。为加速这一进程,Anthropic计划在明年投入10亿美元建设大规模的AI训练“健身房”。OpenAI则认为,整个经济未来都可能变成巨大的“强化学习机器”,AI将通过与人类协作和反馈不断进化,从根本上重塑生产力与工作模式。时薪最高250美元“AI家教”正在教大模型如何办公Anthropic与OpenAI正在做一件前所未有的事:让大语言模型真正走进“办公室”,学习当一名合格的“数字员工”。这些AI模型正在接受高强度职业培训,学习操作各类专业办公软件,从Salesforce的客户管理系统、Zendesk的客服平台,到医疗领域的Cerner电子病历系统。最终目标是让AI能够独立处理白领日常面临的复杂工作任务。与传统AI训练完全不同,Anthropic和OpenAI这次采用的是“模拟办公”沉浸式教学。研究人员不仅为AI搭建高度仿真的企业应用环境,还重金聘请各行业专家担任“职业导师”,手把手教授模型软件操作技巧。这样的训练成本不菲。据知情人士透露,Anthropic计划在未来一年内投入10亿美元,专门建设被称为“强化学习环境”或“健身房”的模拟办公平台。OpenAI同样不惜重金,预计今年在数据相关领域的支出就将达到10亿美元,到2030年更将增至80亿美元。这些资金既用于搭建虚拟办公环境,也用于支付专家薪酬。不出预料,聘请人类专家的成本也在水涨船高。为OpenAI等公司提供专家服务的Labelbox公司透露,目前教授AI操作软件的生物、软件编程、医学等不同领域专家中,20%时薪超过90美元,近10%时薪突破120美元。预计未来18个月,顶级专家的时薪将涨至150-250美元。尽管投入巨大,但回报可能超乎想象。一旦成功,这种新训练方式不仅能帮助OpenAI和Anthropic突破传统训练技术的瓶颈,还可能为他们开辟全新的商业模式。例如,未来企业可以销售能接管用户电脑并代为操作应用的“AI智能体”,或者利用AI开发出更强大的企业级应用。Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)将这些AI产品称为“虚拟协作者”。它们被设计成能与人类并肩工作,熟练操作我们日常使用的各种应用程序。然而,要实现这个目标并不简单。专门帮助企业优化AI模型的图灵公司(Turing)给出了具体案例。该公司前沿数据项目负责人安舒尔·巴吉(Anshul Bhagi)解释道,要教会AI完成一个销售任务,需要跨越多个系统:不仅要掌握Salesforce的客户筛选功能,还要会使用LinkedIn寻找潜在客户、用Calendly安排会议,并通过Gmail发送跟进邮件。图:研究人员会将复杂任务拆分为多个步骤,然后验证AI模型是否按要求完成为确保AI真正掌握这些技能,图灵公司设计了一套精细的验证流程:将每个任务拆解为多个关键步骤,并设立明确的检查标准。以销售任务为例,考核标准包括:AI是否按“最后联系时间”筛选了客户数据库?是否成功发送包含Calendly会议链接的邮件?是否将潜在客户状态更新为“重新接洽”?虽然这项技术尚处于早期阶段,但各大AI实验室已经准备好投入重金。一位投资者透露,Anthropic目前仅将不到10%的后训练(即模型初步训练完成后进入优化阶段)预算用于“强化学习环境”,但由于初期效果显著,该公司预计明年将大幅提高这方面的投入。AI“训练场”成为科技巨头新战场图灵公司CEO乔纳森·西达尔特(Jonathan Siddharth)近日透露,他们已建成超过1000个强化学习模拟环境,覆盖从Airbnb到Excel等各类应用场景。这些被称作“AI健身房”的虚拟空间,正成为训练AI模型的重要资产。每个模拟环境都配备100到500个定制任务示例,并包含完整的评估体系,让企业能够系统性地训练AI掌握各类办公技能。这个新兴领域正吸引大量玩家入场。Scale、Surge、Mercor和Invisible Technologies等竞争对手纷纷推出类似服务,他们不仅提供模拟环境,还配备行业专家设计各种应用场景下的训练任务。一批专注服务顶级AI实验室的初创公司也悄然涌现,强化学习环境正在成为一个新兴细分赛道。Surge公司创始人兼CEO埃德温·陈(Edwin Chen)说:“OpenAI和Anthropic改进模型的方法,其实是在模仿人类的学习过程,而强化学习环境就像是让AI生活在真实世界里。”除了搭建模拟环境,AI开发商们也在持续用精心筛选的问答来训练模型,这些问答往往难度极高,比如顶级的编程竞赛题或博士水平的生物学问题。这些问答随后会被用于强化学习,从而教会模型在特定领域的新技能或新知识。图:改进人工智能模型的方法,可以比作人类学习新概念的不同途径随着AI模型变得越来越聪明,数据标注公司也开始“招兵买马”,从最初聘请硕博在读生,升级到聘请在特定领域拥有多年经验的职场精英。例如,图灵公司就曾聘请过美国宇航局(NASA)的数据科学家、参与能源部项目的化学家、放射科的住院医师,甚至还有私募股权公司的副总裁,来完成特定的真实世界任务,让AI在一旁“观摩”学习。巴吉举了一个例子:假设一个AI开发者想教会模型理解税率变动对财务模型的影响,图灵公司会先请一位金融专家(合同工)解决这个问题,得出一个明确的答案,比如最终股价,作为检验标准。然后,AI开发者会让模型也去尝试完成这个任务几十次。他们会筛选出那些模型计算结果与人类专家一致的案例,再用这些正确的案例来集中训练模型。通过这种方式,模型开发者能快速、低成本地生成大量正确的训练样本。像OpenAI这样的头部AI开发商,正试图从各行各业收集类似的案例,从医疗到法律,无所不包。一位OpenAI的高管在今年早些时候曾私下表示,他们期望“整个经济体”最终能变成一台巨大的“强化学习机器”。这意味着,AI未来可能会通过记录各领域专业人士在设备上的日常工作来进行学习和训练。(文/中国商业科技新闻网特约编译金鹿,编辑/郝博阳)推荐阅读:AI未来指北高端对话系列GPT-5 为啥不 “胡说” 了?OpenAI 新论文讲透了后AGI时代,当99%的人类价值归零,资本主义是否会幸存?|Hao好聊 X 张笑宇 对话无问芯穹CEO夏立雪:算力储备的新叙事与国产芯片的新任务
...
十问“高德扫街榜”产品负责人,阿里绝密产品三个月上线背后的筹谋
文|晓静编辑|可君9月10日,阿里在杭州西溪园区举行业务发布会,发布“高德扫街榜”。以真实导航/到店等行为结合AI与评价生成综合评分,覆盖餐饮、酒店、景区等业态,主打线下服务“信用体系”。同时启动“烟火好店支持计划”,通过发放超10亿元的补贴措施,鼓励用户到店消费。这款号称“绝密开发”的产品,形态上类似美团旗下“大众点评”,但是在发布会现场,高德一再强调,这是一套主打线下服务的“信用体系”,永不商业化,且会将榜单数据开放给阿里生态内其它产品,及外部合作伙伴的产品使用。为何紧急上线这样一款产品?“永不商业化”的边界在哪里?下一步的北极星指标有哪些?和先前被广泛猜测的阿里“重启口碑网”有何关联?与竞品的区别又是什么?发布会之后举办的小范围的沟通会上,高德扫街榜产品负责人李刚系统回应了以上问题。问题一:这个项目大概六月份立项?能透露一下立项背景及团队构成吗?李刚:做“扫街榜”的初心与高德地图的使命是一致的——连接真实世界,做好一张“活地图”,让出行和生活更美好。用户出门后面临的第一个问题就是去哪里吃、去哪里玩,这本来就是高德应该解决的事。一直以来,我们都在思考:怎么让大家迈出家门后,吃得更好、玩得更好。今年年初,我们分别做了用户侧和商家侧的调研。用户一个直观的痛点是:到了不熟悉的地方,要做很多细碎而关键的决策。比如带孩子出门,如何快速找到不踩坑的餐厅并不容易。近两年网上也有不少反馈:有时评分特别高的店反而更容易踩坑,而那些3.5分但经营多年、口碑稳定的店,实际体验可能更好。从产品经理的视角看,这确实是普遍的用户特征与刚需场景:找吃、找玩、找适合遛娃的地点,都是高频而必须被更好支持的决策。商家这边,我们和一些连锁餐饮老板、线下夫妻店聊过,他们在运营中往往投入大量精力和成本去“冲榜、刷分”,但很多小老板在营销上确实面临困难,甚至被迫把时间从“把饭做好”转移到“如何刷到更高的分数”。我们之所以决定做扫街榜,是因为看到了两项基础优势:其一,高德每天有约1.8亿用户,持续产生出行与到店导航行为,同时带来海量的门店搜索;其二,近两年大模型能力显著提升,在效果、效率和成本上都有质变。结合这两点,我们有条件把“行为数据”与“评价数据”更好地融合,重构一个线下服务的信用体系:既让用户获得更真实可信的参考,也让商家把主要精力回归到把菜品和服务做到位,而不是在与本职无关的“卷”里消耗。我们希望由此形成一个用户与商家都受益的良性循环。团队方面,我是扫街榜的整体负责人。扫街榜并非单一功能,而是一套成体系的产品:包括榜单产品本身、评分体系以及“真实评价”等模块。我们既有底层数据与算法,也有前端的展示与运营策略,分别由多位产品经理协同负责,六月份立项,在杭州封闭开发,目前大概投入100多人,力求把“用户要找的好店”和“真正值得被看见的好店”高效、透明地连接起来。问题二:永不商业化的边界是什么?比如榜内曝光位、导流位,或类似券包合作这种,算不算商业化?李刚:高德扫街榜“永不商业化”的核心在两点。第一,所有门店一视同仁。我们只依据真实用户、真实出行行为和真实评价数据来评判,不设任何准入门槛。不会因为存在商业合作就抬高分数,也不会因“大品牌”或“夫妻店”的身份而区别对待。几千万线下服务标准完全一致。第二,评分只反映真实经营结果。我们关注的是有多少人实际到店、多少回头客再次到访,这些可验证的行为结果构成评分基础;不看流量曝光,也不看是否购买广告位。从这两个层面讲,扫街榜与商业化导向切割开来。此外,榜单与评分按日更新。底层以高德的实时出行行为和真实评价数据进行计算,但对外展示每天刷新一次。因此今天与明天的结果可能有所差异;计算实时、出分日更。问题三:发布会上高德CEO郭宁多次提到了口碑这个词,这是口碑网的传承、升级吗?看到高德地图上有团购,这是商业化的吗?李刚:扫街榜是一个从零开始的全新产品,跟之前的所有产品没有任何关系,只能说发心是一样的,都是解决用户出行和生活决策的问题。这两个产品没有关系。关于与到家、闪购的合作,我这边没有什么具体信息,我们现在专心做好高德扫街榜的榜单,这是我们现在最重要的工作。所有扫街榜产品都是完全不商业化的,与商业化没有任何关系。高德上所有我们今天说到的产品全部是用户产品。地图里面显示的团购是商业侧的产品,是其他部门的业务。问题四:高德在此之前针对目的地也推出过类似榜单产品,这次最大的颠覆点是什么?李刚:有几方面:第一,我们之前确实高德上也有一些类似产品,帮助大家解决出行决策问题。这一次做扫街榜产品跟之前不一样的是,原来不管是榜单还是评分,它是单一的产品。但这次我们今天发布的扫街榜其实是三个产品为一套的信用体系,我们有高德扫街榜、评分和真实评价,三位一体的三个产品帮助用户更好地解决出行服务的生活决策。另外一个比较大的不一样是,确实在这两年AI大模型、多模态技术有比较快的发展,包括我们集团在千问开源模型上面能力有非常快的提升,在效果提升的同时,效率和成本上面大幅下降,所以我们也是乘上了这个东风。我们在8月份发布了全新的AI升级,里边用到了空间智能,底层用到了千问。我们这套扫街榜的底层,不管是榜单还是评分、真实评价,也用到了这套大模型的能力,这个也是跟原来有巨大差别。问题五:今年8月高德宣布全面AI化,升级成出行智能体,扫街榜在其中扮演什么角色?会和出行助手“小高老师”打通吗?李刚:这是两方面:第一,扫街榜的底层与高德的AI化共用了底层模型,包括空间智能,也用到集团千问的开源多模态大模型做数据处理,因为高德的核心能力基于空间智能,理解这些出行行为之间的关系。第二,高德今年8月份的全新升级是一个更好与用户交流沟通的界面,高德扫街榜的榜单评分信息也会被用到高德全新升级的AI里面,包括AI、搜索和其他各种渠道也会用到扫街榜的信息。小高老师怎么使用这套榜单,我不能做特别准确的回答,因为这取决于AI同事他们最终怎么来用这个榜单。榜单就像书,小高老师都是读过的,都是知道的,但最终怎么用,可能得AI同学来给具体回答。问题六:能不能具体讲讲AI是如何作用于整体的评论数据去保证它的真实性?A:我们对数据的处理分两方面,前提都是在用户授权下进行,合法合规,并在最严格的脱敏条件下只做群体化分析:一类是行为数据,一类是真实评价数据。先说行为数据。围绕一次到店决策,用户会形成一条连续“序列”:从搜索、收藏、分享,到导航、到店、交易,乃至到店后的笔记或感受发表。我们用空间智能技术对这条序列进行建模,理解各环节之间的关系与因果,进而判断这家店在真实世界中的反馈表现。由于高德每天产生海量数据(数亿用户×数千万POI,叠加搜索、推荐与AI的动态关联),关系复杂、规模庞大,我们依靠空间智能做时空归因与模式识别,让基于行为的线下评价更公正、客观。再说真实评价数据。首先是可信度判定:识别哪些内容确实来自“真实到达后的反馈”,并结合芝麻信用等体系提升可信度评估。其后,我们利用多模态大模型理解评价中的文本与图像信息,抽取菜品、服务、环境等要素与情绪倾向,判断“这家店为什么值得选”;同时也能从图片理解门店形态(例如是不是“真正的小店”)。最终,我们将行为信号与评价内容双向校验、融合计算,形成对线下门店更可靠的信用刻画。问题七:基于高德扫街榜的排名规则排出的榜单,与竞品相比差异性会有多大?李刚:从多个方面看,差异都很明显。首先在核心逻辑上就完全不同:我们的榜单由“行为数据+信用评价数据”共同驱动,基于真实出行数据来生成结果——无论海外还是国内,鲜见将真实出行数据用于美食、酒店、景区等榜单的做法,这是我们的首创能力。其次在评价层,高德每天都有大量用户提交真实感受与笔记。我们依托空间智能识别哪些评价更可信、权重更高,并在用户在高德端授权的前提下,与芝麻信用协同:对芝麻信用分较高的用户所留下的文字与图片给予更合理的加权,让这些更具参考价值的内容帮助大家做出更好的出行与到店决策。另外在地图体验上,榜单天然突出地图的优势:用户可以直接从地图视角查看周边门店分布与位置关系,快速定位、便捷找店。这正是地图的看家本领,也是我们把“找得到、找得准、到得了”融入到榜单中的关键差异。问题八:以西溪附近一家店为例,大众点评显示总评价1.8万、评分4.8;高德为评分4.5、评价200多。0.3分的差异会影响用户决策,核心差别在哪?用户评价数量在权重上大致如何?李刚:核心在于评分口径不同。我们的评分由行为数据+真实评价共同构成,尤其重视“用脚投票”的到店与复访等真实行为,这是高德的大规模出行数据所能支撑的。评价数量并非简单线性加权项,我们会根据行为与评价的可信度做动态加权,两者的比例不是固定值。因此,即便只有百余条评价,只要行为样本充分(例如到店、复访、专程前往等信号稳定),也能较好反映这家店的真实经营状况与用户共识。举个直观例子:望京那家店复购率高,说明口碑扎实、用户愿意再去;有的店“一次到此不再来”,则意味着整体体验一般。从这个角度看,差出0.3分更多是评价体系侧重不同的结果——我们更看重真实到店与回访等行为信号,而不是仅以评价总量推高分数。问题九:公司如何衡量扫街榜的投入成本或者战略目标?未来是否高德的账户体系也会跟淘宝、饿了么这些产品打通?李刚:我们做的不是用户侧账号打通,而是做榜单开放。高德扫街榜的定位是“最真、最全、最开放”的榜单:我们愿意将上榜信息授权给合作伙伴(包括集团内的飞猪),让他们在选酒店、选景点等场景中直接调用我们的榜单,帮助用户更高效地做出出游等决策。基于此,我们保持充分开放的态度,欢迎更多伙伴使用高德扫街榜来服务其用户在酒店、美食、景点等选择上的需求。由于要覆盖“360度的行”,后续也会持续完善品类,例如“溯溪榜”“露营榜”等。需要强调的是,这里的“开放”并非用户侧信息打通,而是榜单数据可被引用、可被授权使用。关于商业模式,目前我们团队并未以此为工作重点。作为产品与研发团队,我们从用户视角出发在做扫街榜,我个人也是用户产品经理,核心任务是解决用户问题。至于如何盈利,不在我当前的职责范围内。投入方面,我专注在产品推进。团队在阶段内从二十余人扩充到五十余人、并进一步增长到一百人;同时也投入了相当多的大模型服务与算力资源,这两块投入都比较可观。我们的初心始终不变:先把高德用户的出行决策真正解决好,把高德上的出行用户服务好。问题十:能否分享一下高德扫街榜产品的研发过程?遇到过哪些技术或战略上的挑战?高德地图以在途决策为导向(效率为核心)的过程中,而扫街榜围绕场景(内容为核心),如何平衡二者关系?接下来团队的北极星指标是什么?李刚:首先,高德服务的用户规模确实很大。除了驾车,乘地铁、实时公交、常规公交,以及近来流行的骑行、步行用户都在高德上高频活跃。我们的用户不一定都在路上,很多人也会在家里完成出行与到店的前期决策。用户的决策链条与高德深度融合:无论是找“附近的店”,还是在熟悉区域之外做选择,高德作为地图,要服务的是“360行”的决策场景。研发过程中的最大难关在于“从0到1”。项目在6月正式立项,我们从北京集结到杭州,封闭推进。时间非常紧——从立项到9月10日上线,只有七八十天。虽然产品的初心与过去一致——解决用户出行与生活服务的决策问题——但路径完全重做,需要在有限时间里真击中用户痛点、给出有效解法。为此我们做了系统调研:一方面进行用户访谈;另一方面办商家闭门会,了解线下商家如何运作、如何判断业态,新时代的用户画像与触达渠道是什么,线下生态如何流转。这些工作在立项后投入了相当多的产品与运营资源,是我们把握产品方向的关键依据。技术实现看似“风轻云淡”,实则结构复杂。我们用底层AI模型与空间智能去梳理“行为数据+真实评价”的关系,同时对整体AI架构与数据流程进行了密集论证。为了呈现“覆盖最全、尽量真实”的全国榜单,我们在内部引入“红蓝对抗”机制,由红蓝队反复校验榜单质量。上榜商家的规模与品类都很大。本次主打美食,但其他品类也已设置;我们围绕不同品类逐一校验数据质量,并对相关图像、理由等要素做了大量整理与校对。整体节奏非常紧凑,两个月多把这件事跑通。下一步的北极星指标分两块:其一,围绕“生活出行与生活服务决策”的高频痛点,路还很长——真正把产品做好、服务好高德的8亿用户乃至更广用户,是一件长期主义的事;其二,在用户认可度上,我们会重点看用户规模与使用深度,以及满意度、NPS等核心指标,确保产品既“有人用”,也“用得好”。推荐阅读王兴的外卖大战“不计代价”,美团利润暴跌89% OpenAI新论文:为何GPT-5“不胡说” AI巨头Anthropic陷版权风暴
...
后AGI时代,当99%的人类价值归零,资本主义是否会幸存?|Hao好聊 X 张笑宇
文| 博阳编辑| 郑可君AGI的脚步声正在逼近,但真正思考"后AI时代社会"的人却寥寥无几。当OpenAI、谷歌、Meta等科技巨头的领袖们轮番预言AGI(通用人工智能)将在未来几年内突破,黄仁勋高声断言"AGI将在5年内实现"时,AI学术界却普遍在担忧:无论是政府、产业,还是整个社会,我们都尚未为那个即将到来的世界做好准备。与此同时,在国内,大量文章热衷于讨论AI技术迭代与商业模式创新,但真正深入思考"后AI时代社会将如何运转"的声音却异常稀少。更鲜有人能够搭建一套完整的理论框架,去系统性描绘AI时代可能带来的社会、经济、政治与伦理的全景变革。然而,这恰恰是当下最紧迫、最被忽视的问题。这场深度对话,将尝试首次勾勒出 “后 AI 时代社会学” 的雏形,去理解、去推演、去预判,在那个未来,我们将如何工作、如何生活、如何治理,以及如何保持人类的主体性。和我们一起探索这一话题的是张笑宇,一个研究政治哲学20年的学者。 他毕业于北京大学的政治学系,后在柏林自由大学完成哲学博士。从博士开始,他就试图揭开技术、商业与国家命运之间错综复杂的关系。在其近作《AI文明史·前史》中,张笑宇尝试勾勒的并非一幅技术路线图,而是描绘出了一个完整的"后AI时代"社会变迁的图景。无论你是否认同他的预测,这都可以是我们理解未来的一个起点。| 本节目也有音频 |你可以通过小宇宙等平台收听, 欢迎关注《Hao好聊》以下为对谈内容:被忽视了2000年的基础性影响:技术郝博阳: 关于AI技术的文章很多,但是在AI时代之后,有关人的人生、生活、政治以及经济会如何发展的具体讨论其实并不多。今天,我们正好有这个机会,请对此深有研究的张笑宇老师来和我们一起聊聊这个话题。欢迎笑宇老师来到 《Hao好聊》。张笑宇: 大家好,我是张笑宇,我本人是独立学者、非虚构作家。我写过“文明三部曲”,就是《技术与文明》、《商贸与文明》、《产业与文明》。我比较关注技术对社会和文明的长期影响。郝博阳: 你从人大、北大,然后到柏林自由大学,一直都在研究政治学。具体从哪一刻开始,你觉得AI会对社会有比较大的影响?张笑宇: 其实我之前的写作,也就是“文明三部曲”,第一本就是《技术与文明》,那个时候我已经开始关注宏观层面上技术对人类文明的影响。我博士是在德国读的。去德国的理工科留学生比较多,我们当时组建了一个小会,是柏林的华人留学生,每两周聚一次,讨论各自最近在研究什么。当时我遇到了很多跨学科的人。比如,有一位研究脑神经科学的朋友,给我看了一篇论文说,现在已经可以进行记忆移植的实验了:就是把小白鼠脑子里的某种物质提取出来,然后注射到另外一个小白鼠体内,它的一些记忆是可以移植过去的。然后他问我:“从你们哲学的角度来讲,人的自我认同这些,你怎么解读?”我说,我解读不了。那一刻,我受到的冲击很大——我们当时还在读2000年前的文献,然而现实世界已经是这个样子了。我是一个很笨的人,我想这个事我弄不懂,我就得想办法去弄懂它,然后回答它。所以那个时候我就开始琢磨,技术对我们今天的人文思考、社会治理、制度结构到底有什么基础性的影响。后面很自然地就会接续到AI上,因为这可能是我们今天这个时代看到的最颠覆性、最具突破性的重大技术。郝博阳: 技术对于整个世界运作的作用有多大?张笑宇: 我觉得这个影响是特别基础性的。我现在看人类世界或者人类文明的演化史,会倾向于用这样一个框架:本质上,人类这个物种和族群是地球生物圈的某种函数。底层的生态、气候、地理决定生物圈的分布,然后生物圈的分布会影响人群的分布,接下来,人类的政治、社会、生活又是人类这个物种族群演化的某种函数。而我们的思想、生活习惯、意识形态,又是这个政治社会生态的某种函数。从这个角度来看,你会发现技术的作用非常根本。因为它可以改变族群的分布,以及你跟物理世界的交互方式,这是从最底层开始的改变。所以,以前的政治研究忽略掉了科技的影响,肯定是不行的。郝博阳: 原来的政治研究基本上都没有人往技术这个方向去研究。张笑宇: 因为人类在这个问题上没有自觉,一直到18、19世纪才开始。你可以想象,技术对我们整个现代社会价值观其实是个很严重的挑战。如果你认为我们今天的现代政治价值观是建立在启蒙运动的基础上,那你就要意识到,卢梭是没有见过工业革命的。更近一点的托克维尔,他仅仅是在工业革命开始爆发的前沿,可能有一点思考,但是没有真正认真、严肃、深度地触及它的内核。但是我们今天欧美社会的政治制度安排、基本的价值观,是建立在这些没见过工业革命的人的思想上面的。郝博阳:但后来也有马克思或者韦伯试图去解释,但更多的可能是解释市场关系,而不是政治制度的模式。张笑宇: 他们不把技术当做一个与社会制度分析直接相关的、特别重要的变量。如果要说真正思考这个问题的人,我第一个想到的名字是凡勃伦,就是《有闲阶级论》的作者。他确实在书里讲过,工业社会对于中产阶级的影响,是让中产阶级的思维特别理性化,而上等阶级和下等阶级都不是这样想的。为什么会特别理性化?因为当时的美国中产阶级在19世纪晚期,是被工业革命滋养起来的。你身在制造业的环境中,机器是理性化的,所以你认为这个世界也是理性化的。这是我看到的第一个特别有自觉的、关于机器怎么塑造人的底层世界观的思考。郝博阳:你研究AI差不多两三年了,在这个过程中有什么想法上的转变吗?张笑宇: 坦白讲,回到两三年前,不光是我,很多人都在思考,但那个时候我们更多是从“怎么办”去想的。当时我们设想AI可能带来的很多挑战是很具体的,比如说虚假信息、伪造人脸、侵犯隐私权,或者AI未来代替人类工作,你需要有全民基本收入(UBI),需要有其他的治理模式等等。但是整体来讲,你都是在讨论“怎么办”。两年过去之后,我发现其实比“怎么办”更重要的,是“怎么看”或者“怎么想”。我的研究感觉更转向了一个非常结构性的重大冲击。就像蒸汽机改变人类社会之后,“怎么办”的人聚焦于蒸汽机可以为我们生产什么;但是“怎么看”或者“怎么想”的人就会想,蒸汽机在社会结构上完全淘汰了一个旧阶级,创造出很多新阶级。在这个新阶级里,比如说资本家和工人,他们的权力结构,其实是根据他们对机器的控制权的远近来分配的。举个例子,其实在蒸汽机时代的工人话语权比石油时代更强。为什么?因为蒸汽机时代的工人可以直接决定煤炭能不能送到机器边上,那个时候一罢工就把老板的脖子卡住了。但是后来到了石油时代,能源运输用的是管道,是自动化的。自动化一定会让工人的话语权缩小,工人卡不了脖子了。所以我觉得AI今天也是这样。我们已经意识到它可以对人类社会有一个整体的巨大冲击,所以你要提炼出几个基本的原理来观察它。首先你要有一个自己的思维框架,这个思维框架是由一批原理构成的,是你去理解这个事情的思维方式。所以我现在主要的工作,就是在讨论这里面的基本原理有哪些。读懂AI时代社会的基本原理涌现法则和人类当量郝博阳:在这个AI时代,你发现的基本原理有哪些?张笑宇:第一个叫涌现法则。简单说,就是当规模足够大、规则足够简单时,系统就能从低层次演化出高层次的复杂现象。比如,简单的细胞涌现出复杂的器官,简单的神经元涌现出大脑和意识。人工智能也是如此,最有名的就是Scaling Law(规模法则),当模型规模足够大,智能就会自然涌现出来。这个法则告诉我们什么?AI智能和人类智能的底层逻辑可能是一样的,所以我们没必要在“机器有没有灵魂”这种形而上的问题上纠结两千年。从实践角度看,只要你感受到它有智能,那它就是有智能的。 第二个基础,我称之为人类当量。这个词是OpenAI的人提的。它的意思是,我们可以用token(词元)来量化人类的智慧产出。我们聊天,我一分钟大概输出200个token,一天撑死了20万个。而机器,一秒钟就能处理100多万个。 郝博阳:这听起来就跟马斯克说的带宽是一个道理?张笑宇: 对,而且更重要的是它不仅很快,而且很便宜。今天100万token只要一块钱,而且这个价格还在不断下降。 你一天给我开一块钱工资,我会饿死,但是机器真的就是以5倍于我的效率,拿着一块钱的工资,而且它的质量已经足够高了。今天的AI在情感上来讲已经通过了图灵测试,在智能上来讲已经达到了博士水准。这就意味着它可以取代99%的人类,因为人类拥有博士学位的人不到1%。这是一个更可怕的事情。如果我们从一个很现实的角度相信,我们思维的价值最终是通过市场买单的,通过你的工资、股权或者回报来证明,那从市场价值的证明标准来讲,AI比人类便宜几千倍。郝博阳:AI既然已经超过了一般的博士水平,但是它还是没有办法替代大部分的日常工作,或者它还没有产生足够强的经济性影响。这是为什么?张笑宇: 我觉得这个只是时间问题。现在我们去讨论智能在经济社会结构里扮演的角色时,就涉及到一个概念,就是工作流(workflow)。比如说你是一个大学毕业生,其实你的智能水平已经足够了,但是你去到咨询公司里还有很多东西要学。不是因为你不够聪明,是因为这个workflow你不熟悉,你不理解产品是怎样的、需求是怎样的,你要通过这个方式去训练。我觉得同样的道理,今天的AI已经足够聪明了,但是它跟人之间的workflow还没有配合好。今天很多企业其实都在做类似的探索,就是我怎么把AI运用到我的生产过程中。我一个在顶尖咨询公司的朋友说,他现在的工作方式是,先凭自己几十年的经验形成一个核心洞察(insight),这个AI替代不了。然后,他把这个洞察扔给ChatGPT,让它出大纲,再生成报告初稿,自己去修改。他说,我现在已经不需要本科生、初级研究员来做这个工作了。现在大量的专业人士,他们的workflow还没有习惯转变过来。而一旦这个习惯转变过来,我认为我们刚才说的“人类当量”这个效应,就会逐渐展开。这就像3G时代,移动互联网的逻辑已经在那了,它注定要发生,只是需要时间慢慢展开。后AI时代的经济架构通缩、重构与资本主义的延续郝博阳:那如果我们将这些规则转化成一些专用的Agent,能覆盖到99%的人能做的工作吗?张笑宇: 对,其实我们在各个公司内部已经看到这个事情在发生。可能大众有一个想法,就是每一个科技革命都是那种特别戏剧性的(dramatic),有一个特别漂亮的产品出来之后告诉你一个新时代来临了。现在不是这样的。其实现在真正发生的情况是,你还在用着那个产品,但它的底层逻辑已经被AI改变了,只是你不知道。就好像你炒股,需要信息聚合,现在AI的信息聚合其实已经比我们传统的自媒体或者股票大V要专业了。但是你感受不出来,你还以为那个头部账号是人写的,其实已经不是了。郝博阳: 和工业革命相比,AI 在经济活动中会拓展到什么样的范围?张笑宇: 我觉得这个话题特别有意思。因为我觉得在经济效益上,至少我们这一代人看到的,AI的效益跟工业革命比如蒸汽机的效益是完全相反的。如果我们简单来说的话,蒸汽机是一个(个人就业)通胀性的技术,AI是一个(个人就业)通缩性的技术。为什么会这样?蒸汽机革命同时伴随着能源革命,我们从砍柴变成烧煤,煤的效率高很多,意味着你可以用更低的成本生产更多的东西。生产东西的成本一旦降低,迎来的是产业链的延长。中世纪的产业链很简单,这边是牛,你把它皮剥了,做成鞋。蒸汽机来了之后,铁钉、锅炉、齿轮、火车等等,这个产业链延长了非常多。每一条产业链的背后都是成千上万的、以前不存在的新公司,和成千上万的新工人。所以它是创造了一个巨大的黑洞来吸纳越来越多的就业人口。但是1970年以后的自动化革命,这个过程是相反的。因为它是一个缩短产业链的技术革命。当然它在某些具体行业是延长的,比如说软件工程师更多了。但是整体来说,为什么有更多的软件工程师?是因为计算机和机器人取代了更多的蓝领工人。所以从整体社会现象来讲,是缩短了供应链的。这是被经济史学家共同认可的。我们确实观察到,在第三次科技革命中,它对于整个人类GDP的提升是不如第二次的。所以我认为AI至少在一代人的时间里,会加速这个过程。郝博阳: 但我有点好奇,因为现在主流经济学家都会认为,历次技术革命虽然导致了一些自动化,但也导致了更多工作岗位的出现。因为它提升了效率,增加了物质供给,从而产生了更多的个性化需求和新行业。张笑宇: 其实经济学家对这个问题的思考,是到90年代后期,尤其是新世纪以来才算是有一些比较精确和科学的框架。之前大家都是相信那个技术革命的叙事,就是技术永远创造比替代更多的东西。但是从90年代开始,很多经济学家真的去做了验证之后,发现并不是想的这么简单。罗伯特·J·戈登《美国增长的起落》里面有很有名的一句话,叫 “计算机去哪里了?”(Where is the computer?)。什么意思?就是第三次科技革命之后,到处都在用计算机,但是为什么我们没在人均GDP增长里看到计算机的效应?经济学里用TFP(全要素生产率)来衡量技术进步,为什么计算机出来之后这个数字没增长?他们去研究发现,实际上计算机在里面的替代效应比它创造新工作的效应要大得多。再比如说去年得了诺贝尔经济学奖的阿塞莫格鲁教授,他这十年来最关心的就是自动化对就业的影响。他说你真正要问的是,这个技术有没有创造“新任务”,或者让大量的人去接触到他们原来接触不到的服务。如果有,会出现就业增长;但如果没有,那就是就业替代。他举了ATM机的例子。ATM机前后是两段效应。第一阶段,它替代了大量的银行职员。但是到第二阶段,它又做到了一个事情:它降低了普通人享受银行服务的成本,所以银行修了更多的ATM网点,它的就业又反过来扩张了。所以你要具体地去看这个技术会怎么样。但是如果我们去讨论AI,尤其是虚拟世界的效率,要注意到两个事情。第一,虚拟产品复制自己的成本是0,这就决定了它天然会快速扩张和垄断。第二,你对于虚拟世界的消费有一个很简单的极限,就是你的时间,每个人一天只有24小时。有这两个效应在,这就是一个很简单的数学公式:你的供给增加得越快,它达到极限的速度就越快。AI在当前阶段,大概率无法像ATM一样开启创造就业的“第二阶段”。因为它正以前所未有的效率,在虚拟世界这个“有限的需求池”里疯狂地替代人类已有的任务,却很难衍生出需要大规模人类参与的、全新的、更有价值的任务。所以我认为,这就是我们去思考为什么AI目前可能暂时是个通缩逻辑的原因。当然我不排除之后这个逻辑会重新转变,比如在AI的帮助下我们去了火星,拓展了世界边界,那它可能重新增长。但是在未来20年,一代人左右的时间里,可能大量的工作会被替代。随之而来的,是你失业的恐惧、你的焦虑等等,这些是我们这一代人要面临的一个特别严重的问题。郝博阳: 能大概讲一讲这个替代的过程吗?张笑宇: 我觉得智力活动要求越简单的行业就越容易被首先替代。比如客服已经几乎被完全替代,自动驾驶很快了。再接下来像一些管理,比如政府和企业内部的管理流程这些也都会很快。稍微慢一点的,可能像法律文书、咨询等等,但大量的初级岗位也很快会被替代。我觉得可能特别难替代的是,该行业本身是个智力密集型行业,比如说研发、科研;而且是它最顶尖(top)的一批人,它要求的是你的洞察力(insight)。因为我们在日常体验中确实有些人就是能看到别人看不到的东西。这个东西跟人类的灵感和先验认知能力有关系,可能AI暂时还替代不了。但是辅助他的人,很快就可以被AI替代。所以所谓的护城河,其实就是看你的insight有多么独到、独创。郝博阳: 你说的“insight”其实是一个相对比较模糊的概念。现在很多大厂都是数据驱动的决策模式,这在一定程度上跟AI做的事情没有太大差别。能具体讲一下“insight”是在这之上的哪些东西?张笑宇: 其实你做数据分析就会知道,数据总是摆在那的,但是你用什么方式把这些数据连在一起,这个就考察你的insight。有个特别有名的“幸存者偏差”的故事:要分析从战争中回来的飞机,看哪的弹片最多,然后加强那个地方?突然有一个人出来说不对,你看到的飞机都是飞回来的,这些地方受伤是因为这些地方不够重要。你会发现,没回来的那些飞机,它们中弹的地方才是真正致命的。所以他去加强那些部分的保护,才发现这个是管用的。这就是一种insight。现在程序化的分析可以被替代,但是insight暂时确实替代不了。所以未来人类和AI的配合方式,至少可能一代人里,都是有insight的人,告诉AI说“你按照我的insight去做事”。郝博阳: 从古代到现代,财富在积累,但贫富差距也在扩大。你觉得这跟科技有什么关系?AI时代会有什么变化?张笑宇: 我觉得这背后可能不完全是科技的关系,而是人类社会本质上是地球生态圈函数的一部分。在大部分社会里面,人类的很多指标本质上就是指数分布,比如城市规模、贫富差距。技术可以提升底线,比如能源从木柴变成煤炭,整个经济系统里的物质交换丰富度提升几倍,但系统内的分布,长期来看又会重新回到指数分布的状态。AI会不会改变这个事情呢?长期来看,我猜测它发展成熟后,复杂性又会回到这个均衡状态。但是短期来看,它一定会有一个重大的震荡,就像从农业社会到工业社会的时候一样。但是这不是就意味着物质极大丰富,社会主义到来了吗?又不是。因为你会发现另外一个资源变成稀缺了——算力。那会不会将来人类出现一种锚定算力的、把算力当做硬通货的货币体系?这个新货币体系跟旧货币体系之间又会怎样演化?就像历史上拥有白银的国家跟农业国家之间会有巨大的战争一样,那会不会又出现数字世界、数字货币跟主权货币的巨大战争?郝博阳: 这一代人中会面临的经济结构整体变化,会往什么方向发展?张笑宇: 我觉得就是“1%对99%”。AI确实在能力上可以替代99%,这中间会有一个巨大的阶层分化。有1%的人还不会被AI取代,当你不会被AI取代的时候,你当然就在这个社会结构中会更有优势,更有话语权。剩下的99%,你的工作、你的价值随时可以被AI取代。所以你在经济系统里没办法跟它竞争,可能会用一些非常让人难受的字眼来形容——“无用阶级”、“过剩阶级”,或者就是被淘汰的人。这跟中世纪也不一样。中世纪你也可以说是1%的人统治99%,但是那时候物质极度稀缺,99%的人真的是会被饿死的。历史学家告诉我们,古代80%的人没有后代,因为他真的穷得娶不起老婆,生不起孩子,就消失了。但是今天不一样,我们确实可以做到把人供养起来,我们生产力足够。所以这样一种物质上极大丰富,但是等级上又有巨大鸿沟的社会,可能会同时存在。郝博阳:...
苹果秋季发布会前瞻:“史上最薄”iPhone要来了?
文|金鹿 陆陆编辑|海伦9月9日消息,苹果将于北京时间9月10日凌晨迎来一年一度的重头戏——苹果秋季新品发布会,全新iPhone 17 系列即将登场。苹果高管曾多次在内部强调,这将是“iPhone历史上最具野心的一代机型”,似乎预示着苹果正准备翻开新的一页。此次发布会的主题是 “Awe dropping”,既可理解为“令人惊叹”,也暗含“跌落”的双关意味。有行业人士指出,这一标语或许寓意着苹果正尝试将“跌落”转化为抗摔卖点。有传闻称,iPhone 17 Pro将改用铝合金外壳,以提升耐用性。根据曝料消息,苹果将用一款全新设计的 iPhone 17 Air 取代表现不佳的Plus版本,这款机型主打轻薄机身,可能是“史上最薄”。与此同时,顶配的 Pro Max 也可能更名为 Ultra。除iPhone外,Apple Watch 与 AirPods 系列等也将迎来重大更新。01史上最轻薄机身来了!Air或成首款无SIM卡iPhone▍推出四款新iPhone,主打“更薄”根据爆料,和往年一样,苹果今年仍将推出四款新iPhone,分别是iPhone 17、iPhone 17 Air、iPhone 17...
清华教授高小榕:脑机接口竞速,中美在不同路径上“并跑”
文|海伦编辑|郑可君在硅谷的叙事中,脑机接口领域,充满了太多可以描绘的愿景。大脑不再只是医学课本上的解剖图,而是下一个被技术改变的前沿。人们被告知一个未来:大脑与机器深度融合,记忆和意识将突破生物学的限制。在现实与想象交汇的当下,Neuralink 和 Synchron 等脑机公司不断推进脑机接口的临床试验——Neuralink 已在少量患者中完成开颅植入,重点尝试恢复因瘫痪或神经疾病丧失的运动和语言功能,并计划在 2025 年第四季度开展言语皮层实验以解码“意图语言”。Synchron 则通过微创血管内植入的方式,让瘫痪患者用脑信号控制外部设备,已在临床试验中验证了安全性和部分日常功能恢复,这些成果都在逐步展示脑机接口技术的更多潜力。面对技术的飞速发展,公众的目光被牵引到两种截然不同的愿景之间:一方面,脑机接口为因各种原因失去部分功能的人带来了恢复的希望;另一方面,马斯克等科技大佬通过频繁的营销宣传,激发了公众对未来美好生活的无限想象,譬如意识上传、“自我被数字化”等科幻的未来,但也引起了大众的担忧。在这种氛围下,随着这些技术的不断进展,科学与科幻的边界变得愈发模糊。当前,脑机接口技术的实际落地能力进展如何?未来世界是否会重现电影《黑客帝国》中人机大战的场景?当人工智能成为社会新的“智能体”,脑机接口又将扮演怎样的角色?近日,我们与清华大学医学院长聘教授高小榕深入交流,聚焦这一技术的实际能力边界。高小榕提供的视角更为冷静:脑机接口并非直通“超人化”的捷径,而是一项在伦理约束下、以修复与辅助为核心的技术探索。“马斯克最初的愿景倾向于‘超人化’,这在伦理上是难以接受的”,他指出,像意识上传、通过脑芯片直接读取大脑信息等“超人化”设想,目前仍是不切实际的幻想。清华大学医学院长聘教授 博士生导师 高小榕以下为中国商业科技新闻网和高小榕教授对话实录(在不改变原意的情况下,有所删减):中国商业科技新闻网:近年来,公众对脑机接口这一技术抱有很多期待,甚至夹杂着一些幻想。尤其是随着马斯克频繁对外宣传脑机接口和其公司 Neuralink 的潜力,比如未来可以实现意识上传、思维控制等概念,更加激发了社会的想象力。在您看来,脑机接口的真正边界在哪里?类似意识上传等真的可以实现吗?高小榕:从原理和目标上看,脑机接口大致可以分为两类:一类是修复或替代,也就是当人的能力低于“100%”时,通过技术帮助恢复到正常水平;另一类是增强,即试图突破“100%”,让人类拥有超越自然的能力。用一个调侃的比喻来说,就是“把人变成超人”。所谓“超人化”在伦理上是难以接受的。如果真有技术能让人类获得超常能力,那么“谁能用、谁有资格用”就会带来巨大的不公平。马斯克最初的愿景倾向于“超人化”,但在伦理约束下,现在转向了临床应用。另一方面,还有一个目标是人机协同。随着AI的发展,未来社会将同时存在人类智能体和人工智能体,二者如何沟通是个根本性问题。如果交流鸿沟得不到解决,社会就可能出现分裂,而脑机接口正是填补这一缺口的潜在手段。它能实现“心想事成”,比如将人的意图直接传递给机器。从这个意义上讲,脑机接口也包含“超越人类自然极限”的成分,但这是必要的超越——它并非为了制造超人,而是为了确保人类与机器能够共存。至于“意识上传”或“数字永生”,现阶段完全没有实现的可能。在这样的人机共存背景下,我们必须重新思考如何保持社会的“以人为本”。有人提出让机器彻底变得像人类一样,但这在根本上是不可能的。因为人类的一生只有一次,而机器可以随时开关重启——它永远无法真正理解人类存在的独特性,尤其是“死亡”这一终极经验。而人类的许多问题,恰恰都与死亡相关。中国商业科技新闻网:抛开伦理考虑,从神经科学原理和技术角度出发,通过脑机接口实现意识上传和思维控制等功能是否有可能?高小榕:我觉得现在还没有。从神经科学原理上也不支持做到这些。中国商业科技新闻网:马斯克还提到过,脑机接口可以治疗精神分裂症或自闭症,这可以实现吗?高小榕:这是有可能的。大脑存在“奖赏中枢”,通过电刺激可以产生幻觉。如果能精确控制幻觉的程度,就能达到治疗的目的。过去我们主要依靠药物控制,如今电刺激提供了新的可能性。人工耳蜗、人工视网膜就是成熟的例子。从更高层面看,这在科学上是可行的,但必须严格遵循伦理与监管要求。中国商业科技新闻网:您刚刚也提到,脑机接口可以作为人和机器之间的介质,甚至增强人类的某些能力,但这里的增强是有限度的,那么未来可以做到哪些程度?高小榕:一些有限的“外挂”能力是可行的。比如记忆增强:阿尔茨海默症患者见到熟人时往往无法立即认出,如果脑机接口能检测脑活动并提示“这是谁”“曾在何时何地见过”,交流就会顺畅很多。类似的场景也适用于健康人,比如当有人见到熟人一时想不起名字,系统就能即时提醒。这种增强可以理解为“外挂”:记忆外挂、计算外挂、认知外挂、行为控制外挂。它们不会让人类成为“超人”,但能在具体环节提升效率与体验。中国商业科技新闻网:根据您的研究经验,目前在临床实验中,哪些方向的可靠性较强?高小榕:大概是和脑机接口的应用相关的几个方向。第一,运动补偿和康复,比如控制假肢、手的运动,这类已经做得不错。马斯克的植入,中国洪波教授的研究、北脑一号、上海团队的研究,都是这方面。第二是言语功能方面,比如帮助说不出话的人恢复语言。这其实也是运动增强,只不过增强的是舌头。之后可能是认知、情感,再到文化娱乐等场景。从技术层面看,信号读取、信息解码、刺激反馈等环节都在进步。植入设备可稳定使用一至两年,但要突破三年以上仍有挑战。如果电极放在脑硬膜外,寿命更长;而放在头皮上,则可以随时使用,但信号质量较弱。中国商业科技新闻网:现在最大的挑战是在硬件层面,还是在软件信号处理层面?高小榕:两者都有。过去30年的进展主要依靠材料科学——电极越来越小、越来越柔软,就像CPU不断缩小。但如今面临新的瓶颈:记录通道数已从几百提升到上千,未来可能达到上万。如何解析如此庞大的数据?这就需要人工智能。AI的进步速度远快于材料科学。模型能力可能百日内翻倍,而材料改进通常每年才有百分之一的增量。因此,未来脑机接口的突破动力,更大程度上取决于AI,而不仅是材料。中国商业科技新闻网:脑机接口的技术路径上,有侵入、半侵入、非侵入几类。您更看好哪种方式?高小榕:三种路径都在探索,目前谈不上孰优孰劣。我曾提出过一个比喻,叫做“脑机星链”。二十年前,卫星与手机通信几乎不可能,如今随着卫星发射技术发展,数量从一个增加到上万个,通信覆盖问题被解决。同理,未来如果脑机接口的“节点”足够多,就可能像星链一样,实现无时无刻的连接。中国商业科技新闻网:从大家的反馈来看,对侵入式的担忧会更多,您怎么看待这里的风险?高小榕:担忧是合理的。非侵入式可以随时摘掉,就不再读取脑信号;而侵入式一旦植入,使用者无法确认它是否在持续运行,也更容易面临被攻击的风险。中国商业科技新闻网:很多人会联想到脑机接口和机器人结合。相比传统控制方法,它的提升点在哪里?高小榕:差别非常大。传统控制只能让机器人执行简单动作,比如“前进、后退、转向”。但它并不知道你的真实意图。脑机接口可以直接传递目的。比如“想吃一个苹果”,机器人会自主规划路径并完成,而不是逐步等待指令。这种差异,就像导航,过去我们需要手动告诉它每一步,现在只需输入目的地。中国商业科技新闻网:在延时性或续航方面,会不会有不同?高小榕:这是技术问题,随着迭代可以解决。中国商业科技新闻网:目前,脑机芯片的应用主要集中在医疗领域,未来还可能拓展到哪些其他应用场景?高小榕:我特别看好养老领域。比如老年人遇到不会操作的事情,可以直接提出需求,由机器人协助完成。除此之外,还包括运动康复、认知康复、情感支持,以及文化娱乐。需要强调的是,进入情感和娱乐领域时,几乎不会采用侵入式,而更多依赖非侵入或可穿戴方案。中国商业科技新闻网:中美两国作为全球脑机接口研究的领跑者,在该领域的研究进展上存在哪些主要差异?高小榕:总体而言是“并跑”。中国在无创和半侵入式研究上更领先,美国在侵入式研究方面更强。中国商业科技新闻网:到技术成熟大约还需要多少年?高小榕:我最初认为需要60年,后来又改为30年。现在看来,时间可能会进一步缩短,大约在15到20年内就有望出现更成熟的成果。不过必须承认,当前的技术仍存在明显局限。以植入设备为例,它的寿命仍然只有“以年为单位”,最长案例也仅维持了几年。马斯克曾宣称设备可稳定工作一年,但实际上三个月电极就会部分脱落。这也说明,我们距离实现“终身植入”仍有不小差距。推荐阅读:AI 未来指北高端对话系列具身智能单笔最大融资出现,我们独家对话了银河通用创始人王鹤对话凯文·凯利:不必过多担忧,AI变强后,人类只需专注于“玩” 对话无问芯穹CEO夏立雪:算力储备的新叙事与国产芯片的新任务
...
硅谷预警:十年前的投资机制陷阱,正成为人工智能泡沫的“隐形加速器”
特约编译|金鹿编辑|海伦近期,一种已有数十年历史的投资机制——特殊目的载体(SPV),正在硅谷悄然成为人工智能泡沫的“隐形加速器”。SPV(Special Purpose Vehicle)是为特定目的设立的法律实体,通常以有限责任公司或信托形式存在。其核心运作模式是:投资者将资金汇集至这一独立法律实体,由它代表众人投资于那些炙手可热、通常难以直接触及的科技公司股份。SPV自身不开展实质经营,其完全系于所投的单一资产或交易。随着人工智能领军企业如OpenAI、Anthropic等的估值飙升至数千亿美元,一个由众多临时SPV构成的“平行市场”正在急速膨胀。它精准地利用了投资者深怕错失AI时代红利的“错失恐惧症”(FOMO),吸引了大量渴望分一杯羹的资金涌入。这些SPV通过让散户投资者有机会购买热门AI公司的零散股份,极大地降低了投资门槛,但也可能在不透明的情况下推高本已高昂的AI公司估值。不少投资者已发出警告,认为这预示着当前人工智能热潮中正出现泡沫风险。尽管很多SPV运作合法,但也有一些管理费高得离谱、结构不透明、中间环节复杂。投资人士提醒,在追逐所谓“万亿美元AI市场”的热潮中,缺乏经验的投资者很容易掉入陷阱。曾投资Uber、Grubhub和Zillow的知名风投家比尔·格利(Bill Gurley)提出一个简单原则:“真正的朋友不会劝你投SPV。它们总带点‘不靠谱’的气质,优秀的创业者都明白这一点”。01AI巨头警告:警惕未经授权的SPV骗局头部AI公司也在积极呼吁投资者保持警惕。OpenAI近日公开发文指出,未经授权的SPV可能使投资变得毫无价值。文中称:“如果有人联系你,声称可以提供投资OpenAI的机会,请务必谨慎。某些所谓SPV‘销售’不会得到我方承认,最终可能完全不具有经济价值。”另一家AI公司Anthropic也就SPV激增的现象向投资者发出提醒。在其最近一轮估值达1700亿美元的融资中,该公司甚至要求部分风投机构避免使用SPV。投资管理公司SuRo Capital的首席执行官马克·克莱因(Mark Klein)去年在考虑投资OpenAI时,很快察觉到一个令人不安的趋势:他收到的每一份交易提案,看起来都比上一份更可疑。他表示,这些提案结构复杂难懂,即便像他这样的专业投资者,也常常搞不清自己到底投的是什么。随着OpenAI和Anthropic相继启动估值高达数千亿美元的融资轮,类似的交易提案近来层出不穷。如果这些是上市公司,投资者本可在一个流动性充足的市场上每日交易。但私营公司只在特定时段进行融资,中间存在大量空白。02FOMO如何点燃SPV市场数字营销服务公司Autograph的联合创始人兼CEO哈里·拉加万(Hari Raghavan)提到,最近几天,他收到五份针对同一家公司的不同SPV投资邀请。更让他担忧的是,有人甚至向他几乎毫无投资经验的、身在印度的父亲推销所谓“顶级AI和国防科技公司”的SPV。“普通投资者根本意识不到自己承担了多大的风险,”他说。通常,投资者向风投基金支付2%的管理费和20%的利润分成。但在新出现的SPV架构中,管理人设置了所谓的“第三层”SPV——每一层都在收取费用,而这些成本最终全部转嫁给了投资者。拉加万审查过的一些交易,不仅管理结构模糊,费用也极其高昂。创始人兼天使投资人米歇尔·利姆(Michelle Lim)表示,她见过支持AI公司的SPV收费高达16%;个人理财公司Carry创始人纳格帕尔更在X上发文称,某些多层SPV的总管理费甚至达到20%。风投人萨拉·郭(Sarah Guo)直言:“对AI实验室所有权的疯狂追逐,催生出了一批多层SPV经纪人——他们其实跟公司毫无关系,只是处在食物链的最底层。”纳格帕尔指出,被SPV吸引的人往往并不清楚其中高昂的费用和潜在风险,他们最关心的只是能“投进那些热门公司”。这类投资者多是金融背景出身、资金充裕,希望借此切入AI赛道。他补充道:“这有点像金字塔骗局。显然有人在利用信息不对称获利。我敢说,很多投了SPV的人根本不知道自己到底付了多少钱。”“通常每增加一层,就会多收5%到10%的管理费,外加10%或20%的利润分成,”拉加万表示。“这些费用叠加起来可能高得离谱——即便公司估值翻倍,SPV投资者的最终收益可能仅剩25%,而直接投资的利润则可能高达80%”。03从投资工具到风险放大器:SPV的隐性危机风投公司Graham & Walker的创始合伙人费因采格指出,多层SPV还存在另一个隐患:投资者离原始投资越远,“当公司真正发生流动性事件时,你在偿付顺序中的位置就越不明确。谁能说清你排在第几位?又有谁会负责通知你?”Nurture Growth Fund的管理合伙人沙希·特里帕蒂(Shashi Tripathi)透露,他曾多次收到投资SPV的邀约,其中包括一个管理费高达10%、用于投资当红AI搜索公司Perplexity的SPV。但当他询问SPV顶层原始投资者的身份时,对方却拒绝透露相关信息。拉加万补充道,这类多层SPV结构往往让人难以摸清实际控制方,投资者若想退出也会非常困难。更糟糕的是,由于底层实体网络过于复杂,投资者甚至可能无从察觉自己是否暴露于不良行为者的风险中。“前几层或许还是正规的,”他说,“但第三层完全可能是个骗局。”风险投资家格利同样认为,SPV的盛行违背了风投的基本理念——本应与所投企业命运紧密相连。他表示:“这感觉更像是在‘变现人脉’,而不是真正的‘下注’。” 他还一针见血地指出:“对那些前期不出资或出资极少的投资者来说,SPV就像是一次‘免费赌博’:成了可以收取管理费,败了也毫无损失——这无疑助长了极端冒险的行为”。04AGI未至,崩盘可能先来尽管SPV引发诸多担忧,但私人投资平台Carta上的SPV数量从2019年到2024年仍增长了116%。也有投资者为其辩护,认为在合规运作的前提下,SPV的确是让更广泛人群接触优质公司的一种有效方式。一位不愿具名的天使投资人表示:“如果我购买OpenAI股票的唯一途径就是支付业绩费和年费,那我理解为什么有人愿意参与。可如果持有五六年,在你拿回钱之前,各项费用可能已经吃掉了大半收益。”旧金山的天使投资人巴维亚·卡什亚普(Bhavya Kashyap)分析,当前就业市场艰难、购房压力大,许多人被高收益吸引完全可以理解。而明星AI公司的崛起,加上人们寻求额外收入的强烈愿望,共同造就了一种环境——“一批深谙此类投资工具运作之道的第三方,正借机从中牟利。”而从公司角度出发,SPV确实有助于快速筹集大量资金。据报道,OpenAI正在筹措400亿美元,其CEO萨姆·奥特曼(Sam Altman)也曾公开表示需要数万亿美元级资金用于基础设施投入。那位要求匿名的天使投资人点评道:“现在谁都想要它们的股票,对融资方当然是好事——他们正以极高估值拿到资金。”但随着数十亿美元持续涌入AI领域,越来越多人担心泡沫正在形成。今天急于“上车”的投资者,未来或许将面临严重的损失。卡什亚普警示道:“如果通用人工智能(AGI)未能很快实现,我丝毫不会惊讶这个行业最终迎来崩盘”。推荐阅读苹果官宣9月10日发新品,iPhone 17或引发新一轮换机潮一文读懂星舰“十飞”:没有筷子夹火箭,飞船完成“关键一跃”谷歌发布Gemini 2.5 Flash Image:技术领先、定价亲民,竞逐AI图像赛道
...
