MiniMax闫俊杰:中国不乏AI人才,但我们需要去做难而正确的事

Published:

近日,MiniMax稀宇科技创始人兼CEO闫俊杰做客《罗永浩的十字路口》节目,接受了长达4小时的访谈。

在节目中,闫俊杰和罗永浩聊了很多,从MiniMax为何押注全模态、公司的定位和价值体现,到AI时代的核心竞争力、人才差异等话题。通过观察者与AI从业者的双重视角,拆解了当前AI行业的发展趋势及其未来方向。

1989年出生的闫俊杰,是中科院博士,曾做过百度AI研究院实习生、在实验中提前窥见AI的未来形态;后续进入商汤科技,带领700余人攻克面部识别算法,做到了行业第一。在做到商汤副总裁时选择AIGC技术迸发的节点辞职创业,成立了MiniMax如今,公开数据显示,公司估值超过40亿美元。

据全球权威测评榜单Artificial Analysis显示,MiniMax-M261总分位居全球大语言模型第五、开源第一,整体性能达到全球第一梯队水平。

MiniMax-M2是一款10B激活参数(总参数量230B)的轻量级模型,通过高效的MoE(混合专家)架构实现低算力成本(仅为Claude4.58%),价格优势明显,上线一个多月tokens调用量已突破1万亿次。

值得一提的是,MiniMax是一家从成立之初就押注全模态的AI独角兽,目前在语言模型、视频、音频赛道均做到全球领先(音频全球第一、视频第二),同时还孵化出Talkie、海螺视频等风靡海内外的AI原生应用,在大模型领域显得独树一帜。

随着竞争的白热化,AI大模型已经从单纯的算力比拼转向更多维度场景泛用性、硬件协同效率及部署成本均成为关键。面对行业变化,大批大模型初创企业转型或倒闭,而MiniMax则坚定全模态发展路线,这是闫俊杰和团队在公司创立之初就定下的基调。

闫俊杰认为,真正的AGI(通用人工智能)一定是多模态输入和输出的,只是实现起来太难了,所以要先把每个模态先走通,在合适的时机进行整合。

我们现在基本走通了,未来几个月将探索多模态融合。我觉得我们在全球范围内是比较少见的公司,也是有机会能做成(AGI)这件事的。闫俊杰显得信心十足。难而正确的事,正是MiniMax这家公司的生存之道。

本次访谈的核心观点如下:

  • 全模态发展并非不聚焦,而是实现AGI的必要途径。MiniMax现在已经具备基础条件,未来将探索全模态融合。

  • 大模型时代,真正的产品就是模型本身,正在改变创意和生产力。随着大模型的进化,未来的应用形态能够服务于所有人,实现MiniMax的愿景“Intellience with Everyone”

  • 技术驱动是MiniMax的核心竞争力之一,在此基础上专注国际化和直接服务客户,率先实现商业化落地,因此在融资方面非常顺利。

  • 对于中国AI公司来说,一定不是拿来主义,需要做本土的创新。

  • AI时代,最核心的竞争力是想象力。在未来AI竞争的关键节点,中国公司的挑战是如何发挥环境和人才优势,取得技术和话语权上的引领。

以下为采访节选,中国商业科技新闻网在不改变原意的情况下进行精编整理:

01 预见Scaling Law:驱动闫俊杰创业的关键时刻

罗永浩:你说你本来是要做老师的,怎么后来又去创业了?

闫俊杰:我本科是东南大学数学系,后来去中科院自动化所硕博连读。硕博连读时主要就是写论文、搞科研,当时就觉得这个专业不太好找工作,以后就是当老师什么的。

转折点是2014年深度学习出来时,我当时在百度研究院实习,当时百度有国内最大的GPU集群,环境非常好。我当时可能用了他们三分之一的GPU来做实验,让我意识到AI真的可能会带来实际价值。

罗永浩:所以其实你们提前看到了一些东西了,公众其实是GPT 3.5时才看到突破。

闫俊杰:坦白说我觉得国内有点遗憾,其实当时AnthropicCEO恰好在百度做语音,已经发现了Scaling Law(规模化法则或缩放定律)就是大模型里面最核心的原理,这件事是发生在中国公司的,(中国没做出来类似GPT 3.5的产品)很遗憾。

罗永浩:后来你在读博士后时期就去商汤科技实习了是吧,又用很短的时间做到副总裁和CTO(首席技术官),怎么实现的?

闫俊杰:我觉得主要是承担了重要职责,大概用了一年半把面部识别技术做到了行业第一。

在这个过程中,让我意识到两件事,一是要做取舍,专注更加长期、能够引起质变的技术,而不是修补;其次就是再次意识到Scaling Law的重要性,因为以前每个模型只能做一件事、适配一个场景,但受限于资源和人手,就选择做一个相对全能的模型来应对所有情况,结果非常理想,这也成为驱动后来创业的原因之一。

02 全模态发展是AGI必由之路,国际领先的潜力更加突出

罗永浩:你们十月份发布了新一轮的模型,吹吹牛吧,我是指真实的成绩。

闫俊杰:(笑)我们大概是在两年前的时候做到音频(模型)国际领先,一年前视频国际领先,但语言模型一直还没有做到国际领先。这次语言模型在国际上也比较受到认可,然后有很多开发者用它来做Agent、来写代码,这个事儿我觉得是一个非常大的一个进展。

客观来看,我们几乎是中国唯一一家在语言模型 、视频、音频领域,都做到国际领先的公司。

罗永浩:还包括音乐吧?现在也是第一梯队。

闫俊杰:对,三强之一。但其实这是一个很难的事(做全模态),外界就很奇怪一个创业公司什么都做,是不是不聚焦

罗永浩:是有很多人这么问么,不聚焦?

闫俊杰:对。其实我们一开始就想得比较清楚,真正的AGI一定是多模态输入和输出,只是实现起来非常困难。我们的想法就是把每个模态先走通,找合适的时机再进行整合。比如Open AISora2 ,就是典型的多模态融 ,获得了巨大的成功。

我觉得目前我们基本上具备了基础,每个模态都已经有了数据、使用场景,我希望在接下来几个月把它们整合到下一代模型里。我觉得在全球范围内,我们应该是少数有机会能够做成这件事的公司。

罗永浩:但是跟国外的这些竞争对手比对,花的钱还是少了不知道多少倍。

闫俊杰:对,这其实和中国固有的优势有关。我觉得最核心的一个点是,美国真正能做大模型的其实只有四家公司——谷歌、OpenAIAnthropicxAI这些公司估值可能是中国公司的100倍,但是技术就领先5%,投入可能在50100倍之间。

话说回来,为什么中国公司可以花他们五十分之一的钱就可以做出来,性能差距可能只有5%,甚至这个差距我认为在过去一年是在不断变小的,我觉得核心原因是因为中国人才是非常好的。

03 中国土壤将孕育出本土顶级AI原生人才

闫俊杰:现在中国有非常多优秀的年轻人,包括我们(公司)在内,还是能够有一种机制,将优秀的年轻人组合在一起,这是比较关键的。

当然,我在想如果中国的年轻人出来几个技术天才,会成为中国AI领域的一个突破点,我觉得可能两三年内会出现。

罗永浩:对,一定会出现这样的人。

闫俊杰:并且这种人才一定在中国本土环境里成长的人,而不是美国回来的。

罗永浩:你们大部分人才都是本土的么?没有海归么?

闫俊杰:我们有海归,但是真正在公司起到关键作用的人才,基本上都是来自本土,是他们的第一份工作。

罗永浩:这个事情还挺很神奇的。按我的理解,在AI领域我们是学习和追随者,但是并不依赖海归华人也能搞定,像梁文锋(DeepSeek)那边一个海归都没有,这些年是发生了什么变化么?

闫俊杰:我觉得人工智能不是玄学,可以用第一性原理来拆解,所以把每个技术部分做好并且持续积累,比如算法设计、数据链路搭建、训练效率优化等,就会看到好的结果,这是第一点。

其次是客观来看,中国算力相比美国差距较大,这种情况逼迫中国公司去创新,才能达到美国公司那样的效果。在大的原则上大家可能是一致的,但是中国技术在不同模块上都有创新,(与美国)又不完全一样。

04 天价挖人VS.本土创新,中美AI路径不尽相同

罗永浩:前一阵子Meta的扎克伯格高薪挖人,上亿美元年薪,大家就觉得这个薪水很高。但如果结合这些人在OpenAl的工作经验来看,性价比是很高的,但前提Meta依然要提供足够的资源和资金供他们研究。那么这种烧钱的做法是不是对于我们来说就没那么实用?

闫俊杰:对,我觉得这是一个很好的视角。我认为烧钱肯定有用,但仅仅烧钱又是不够的。对于中国AI公司来说,一定不是拿来主义,需要做本土的创新。

罗永浩:还有一个趋势是过去硅谷的公司可能30%是华人、30%印度人;但现在硅谷AI公司华人的比例远高于印度人,这是个什么原因?

闫俊杰:其实在AI这个领域一直是这样的。大概是十几年前,那个时候的AI前身是计算机视觉,在这个领域里华人占比就很多。来到大模型时代,华人占比就更多了。一是因为华人比较聪明,数学和编程能力较强,另外还需要长时间的努力,同时具备三种特点的人确实很多是中国人。

罗永浩:刚起步的时候,是凭什么吸引到第一波愿意追随你的人?是你发表过的论文和学术成就,还是高工资?

闫俊杰:我觉得对他们来说,第一要素一定是他们是相信的,不是相信我,而是相信AGI本身。对于优秀的人才来说,首先钱肯定是要到位的,但比钱更重要的是热爱,钱只能排第二。

客观来说,中国目前还没有伊利亚(Ilya SutskeverOpenAI前首席科学家、联合创始人)那种最TOP级别的天才。中国有这样潜质的人,但暂时还没变成那样,那他能否在一个环境里变成那样,我觉得这件事对这些人才来说是更重要的。

05 大模型时代真正的产品是模型本身

罗永浩:按我的理解,没有像你们押注全模态的公司是因为资源不够,是这样么?

闫俊杰:我觉得不完全是,可能更多是取决于大家背后的出发点是不一样的。

罗永浩:那是否跟你们的变现能力有关系?像你们这种纯科研的公司,能把C端产品做得那么好的不多。

闫俊杰:其实就是把技术能力做好,做到行业需要你,商业化能力自然水到渠成。这里面的一个本质逻辑是“AI大模型本身就是产品,而通过模型做出来的产品(或者说应用),实际上是一种渠道。

通过模型衍生出的应用形式,不管是面向B端还是C端市场都能实现其价值,便会受到市场的认可。比如视频模型,现在全球每天都产出上千万两级的视频,在创意领域就有很高的价值,这在半年以前还是无法实现的。

罗永浩:这又涉及到一个问题,如果模型本身是产品,那么最强模型不就是通杀吗?如果是这样,那么整个行业是不是都会被颠覆,比如我们内部某个部门就都裁掉了?

闫俊杰:其实过去几年我一直在想,首先我觉得每个职能都是有价值的。

罗永浩:听着像安慰……

闫俊杰:不是的。目前一个核心的原因是,还没有哪个模型是所有领域最好的,各自有不同的特点,比如说有的语言模型对话很流畅、有的写代码比较好等等。

罗永浩:你不是说后面会融合,融合完了最强的就全通吃了么?

闫俊杰:比如说还没有融合的时候,为什么那么多公司的模型都有人在用呢,而且大家的用户量都在增长。其实核心原因是一个经济行为,就像汽车一样,有很多品牌瓜分市场。不同公司的商业属性也不同,所以会有差异。

所以说,其实大家都会有自己的生存空间,并且模型能力越强、商业价值越大,整个市场是越来越大的。

06 AI不是互联网的延伸,而是新的生产力

罗永浩:因为大模型的能力越来越强,都说很多职位会被取代,我觉得产品经理的未来可能一面是天堂、一面是地狱。你给我们产品经理把把脉,未来出路在哪?

闫俊杰:我猜一定会出现一种新的形势。根据我的观察,一个明显变化是现在产品经理可以借助AI写代码直接拿出Demo而不是PRD(产品需求文档),工程师如果有好的想法也可以做出很有创意的产品。

AI的出现很大程度上同时降低了做创意和生产力的门槛,本质上是将核心竞争力从技能转变成想象力不再受限于谁只会写代码、做产品或是做算法的约束去掉了。

罗永浩:所以你的意思是,将来一个很小的公司也能做成很大的事,创始人可能是产品经理出身、也可能是工程师出身?

闫俊杰:对,AI作为工具大幅降低了做生产力的门槛,所以本质上核心竞争力就变成了想象力

从理论上来说,谁有最好的想象力、谁能坚持,然后产品出来对社会价值更大,那就会获得成功。

我现在的理解是AI行业不应该是互联网的延续从这个角度来说就不必在意移动互联网时代的分工。其实我们自己也有这种感觉,就是做出来成功的模型比我本人聪明,就会感觉有点害怕(笑)。

07 AI Native 公司的人才观和组织创新

罗永浩:DeepSeek爆火之后,你们从春节开始到现在也快一年了,这期间工作上有什么调整么?

闫俊杰:有,其实是有一个非常大的调整,因为我们这种公司必须每年都有进步,不进步就可能挂掉了。DeepSeek让我们意识到算法和基础设施一定要是一体的,相当于一定是所有人要优化一个目标而不是分散的。这件事其实让我们的组织上发生了非常大的变化。

罗永浩:这么大的调整?你们内部是用OKR(目标与关键成果法)吗?

闫俊杰:对,这就是一个典型的例子,我们曾经试过OKR,但发现根本行不通。这也是为什么我说AI行业不是互联网行业的自然延伸,它是一个新的行业。

罗永浩:KPI呢,更行不通吧。

闫俊杰:行不通,所以我们没有组织工具。

罗永辉:那如果公司到了几千人规模如何管理?

闫俊杰:我认为AI Native公司(原生AI公司)的组织和大模型有相同之处,几种不同画像的人才对应多模态,能够在基于底层原则的情况下进行排列组合,产生更丰富、更多样化的东西。

当然对于人才筛选肯定是有底层原则的,第一是足够聪明,能够有悟性,自我学习,主动发现;第二有热情,热情是没有办法被表演的;第三,这个领域没法个人英雄主义,需要很多人合作,需要很好的合作能力。

在这个基础上,我觉得一个人在不同阶段承担的职责不应该再遵循互联网的定义,而是通过组织创新更灵活地用人,在不同阶段实现不同排列组合。如果我们没有做一些组织上的创新,那么很多模型是做不出来的。

罗永浩:公司有没有遇到特别困难的时候,如何提升士气?

闫俊杰:士气低迷的时候,通常需要用第一性原理拆解,让大家接受这件事是可行的。其次就是给大家发更多的钱,让努力获得反馈。我觉得背后的意义在于大家在一起有希望,即便是遇到挫折,也还是能够做更好的东西。

08 三个原则,驱动MiniMax不断前进

罗永浩:我觉得你们公司让外界看不明白的一点是,你们明显是一个技术型驱动公司,那么为什么做出了好几个成功的To C产品?

闫俊杰:首先我们有非常好的产品经理,对技术理解很深、产品能力也很强。另外,公司成立之初定下三个原则:技术驱动、直接服务客户和国际化,到今天我们也是在坚持的。

技术驱动对于我们来说其实是最难的。通过模型能力赋能业务或产品,和直接复制移动互联网已有的成功案例,这两种路线可能都是正确的、但无法共存,我们后来意识到只有技术驱动是更适合我们的。

罗永浩:所以你们融资非常顺利,上一轮估值超40亿美元了吧。

闫俊杰:这里面的两个逻辑第一个是技术的领先性,第二是技术领先后能够带来的收入跳变。从公司经营层面来看,我们一直在优化这两个目标,并且每次实现后,规模和量级都实现了很大的增长。因此,我们对股东、员工的严肃承诺几乎都实现了,后续融资自然更加顺利。

罗永浩:最后一个问题。公司做到了现在这个阶段,你的终极愿景是什么?

闫俊杰:我思考的更多是两个问题。一是AGI行业什么时候能够真正带来GDP上的变化;其次是目前行业还是美国公司引领,如果到了关键节点,中国公司能否实现超越。

我觉得中国已经有这个环境了,但是中国的AI人才需要更加自信地成长起来,我希望在三年内看到变化吧。

文章原文

Related articles

Recent articles