河南青年闫俊杰与他的3000亿AI帝国:MiniMax的崛起之路

摘要: 原文作者:林晚晚 2014年,一个来自河南县城的中科院自动化所博士生来到百度研究院实习。他给自己算过一笔账:毕业后最理想的去处是IBM,写Java,年薪28万。 2026年春节,一款名为OpenClaw的Agent工具在全球爆火,其开发者搭龙虾需要底层大模型支撑。其中,一个又快又便宜的模型在一周内于...

原文作者:林晚晚

2014年,一个来自河南县城的中科院自动化所博士生来到百度研究院实习。他给自己算过一笔账:毕业后最理想的去处是IBM,写Java,年薪28万。

2026年春节,一款名为OpenClaw的Agent工具在全球爆火,其开发者搭龙虾需要底层大模型支撑。其中,一个又快又便宜的模型在一周内于OpenRouter平台上处理了1.44万亿Token,登顶全平台第一。

这个模型叫M2.5,公司叫MiniMax。

上市仅两个月,MiniMax的股价从165港元飙升至1300港元,市值突破3000亿港元,而它还是一家年收入不到8000万美元的公司。

这家公司的缔造者,正是十二年前那位实习生——闫俊杰。

提前一年多的赌注

2021年春节,闫俊杰回河南老家过年,去看望了外公。

外公跟他说,想写一本回忆录,记录这80年的人生。但因为不会打字,也没办法将故事组织起来,说了几次后便搁置了。

闫俊杰已在AI行业深耕十多年。那一刻,他突然意识到,尽管他参与的技术已经在产业中落地,帮助了许多企业,但对于一个想写回忆录的老人来说,却毫无用处。

这个细节后来被反复引用,带有励志故事的色彩。但它确实解释了一件事:闫俊杰做AI的动机非常朴素——让普通人真正能用上。这种执念,后来驱动了一系列反直觉的决策。

2021年底,他从商汤离职。

时间点很关键。当时商汤正准备港股上市,他是副总裁、研究院副院长以及智慧城市事业群CTO,离开时正值公司估值最高的阶段之一。他没有等到上市,也没有等到财富兑现,就选择了离开。

ChatGPT是在2022年11月发布的。

而MiniMax,则成立于2021年12月。

这个时间差,成为后来一切的基础。闫俊杰后来坦言,如果不是做得早,在后来“明星研究员和大厂AI背景更受欢迎”的融资环境中,MiniMax根本无法与对手竞争。

闫俊杰的父母都是普通人。他在县城读完高中,考入东南大学数学系,随后进入中科院自动化所攻读博士,并在清华完成博士后研究,之后加入商汤。他一步步走出来,没有任何海外背景,也没有显赫的人脉起点。

在百度实习期间,他与地平线创始人余凯有过交集。余凯后来评价道:“学术能力可以训练,但能把AI技术工程化落地的人,凤毛麟角。闫俊杰是其中之一。”

河南青年闫俊杰与他的3000亿AI帝国:MiniMax的崛起之路

进入商汤后,他用了七年时间,从实习生一路做到副总裁。2018年,在人手不足的情况下,他带领团队开发出一套“All for One”模型算法,在竞标中反超旷视和依图,拿下行业第一。有人评价他“看论文速度奇快,不管陈词滥调,只看精华要义”。这种效率,后来成为MiniMax的公司文化。

他给公司取名MiniMax,灵感来源于博弈论中冯·诺依曼的极小化极大算法。

他的解释是,做决策时要先防住最坏的风险,再选择相对最优解。

一张奇特的股东表

2021年12月,MiniMax完成天使轮融资,金额为3100万美元,投前估值1.7亿美元。投资方包括米哈游、IDG、高瓴和云启。

米哈游的投资有些特别。闫俊杰与米哈游董事长刘伟私交甚好,天使轮便参与进来,如今刘伟仍在MiniMax董事会中担任非执行董事。

米哈游本身也是MiniMax的客户,其游戏中的NPC对话和剧情生成都在使用MiniMax的模型。

天使轮之后,故事遭遇了一个小插曲。

2023年3月,硅谷银行宣布破产。当时,MiniMax的所有资金都存放在这家银行。这是创业初期最危险的一次危机,资金链几乎断裂,融资环境也一片混乱。但他们挺了过来,两个月后完成了A轮融资,金额为2.57亿美元,估值达到11.57亿美元。

接下来的投资名单愈发夸张。阿里、腾讯、红杉相继入场。到上市前,MiniMax共完成7轮融资,累计近15亿美元,估值达42亿美元。IPO后,阿里持股12.52%,成为最大外部股东。

闫俊杰早期融资有一个习惯:只与投资机构的最高层谈判。他曾与红杉的沈南鹏、高瓴的张磊会面。

但这张股东表上还有一个人值得单独提及:贠烨祎。

贠烨祎出生于1994年,本科毕业于约翰·霍普金斯大学电子工程专业,辅修经济学和数学。2017年本科毕业后,她加入商汤,从事融资与战略投资工作,一年后升任CEO徐立的行政助理兼战略部总监,并深度参与了商汤从早期到港股上市的全过程。

2021年,她与闫俊杰一起出来创业。

河南青年闫俊杰与他的3000亿AI帝国:MiniMax的崛起之路

有投资人评价她“干练、有气场、执行力强,有一种超出其年龄的成熟”。她与闫俊杰的分工非常清晰:一个定义技术愿景,一个将愿景转化为资金和资源。闫俊杰能够专注于技术,甚至剃光头发也无所谓;而市场、资本和全球化,则是贠烨祎的战场。

上市敲钟那天,两人站在同一个台上。贠烨祎31岁,身价超过40亿港元。

385人和1%的钱

MiniMax上市时,全公司仅有385人,平均年龄29岁。

从成立到2025年9月,公司累计花费约5亿美元。相比之下,OpenAI同期花费了400亿至550亿美元。

这种对比令人震惊。用不到对手1%的资金,MiniMax却成为了全球领先的全模态AI公司。省钱只是结果,真正的原因在于他们将AI应用到了极致。公司80%的代码由AI完成,内部称AI为“实习生”,这些“实习生”权限之高,可以直接访问代码库、修改线上环境,通过飞书与其聊几句,review完成后即可上线。

这种效率让MiniMax的人均产出异常突出。

产品层面,他们从一开始就选择了全模态路线:语言、视频、语音、音乐四个方向同时推进。当其他公司还在模仿ChatGPT做对话时,闫俊杰押注的是多模态融合。他的判断是,多模态是持续提升智能的基本前提,不做全模态,下一代模型就没有机会。

2023年夏天,他做出了一个更加激进的决定。

将80%的算力和研发资源全部投入到MoE(混合专家系统)上。

当时,国内主流仍聚焦于迭代稠密模型,MoE被认为“前沿但不成熟”。闫俊杰的逻辑很简单:如果要服务千万级甚至亿级用户,生成Token的成本和延迟问题,用稠密模型根本无法支撑。不做MoE,规模上不去,一切都是徒劳。

2024年初,MiniMax发布了国内首个MoE大模型。

在产品策略上,他们并未卷入国内市场的竞争。C端推出了星野和Talkie两款产品,一个面向国内市场,一个面向海外市场,主打AI陪伴;海螺AI则专注于视频生成,2024年下半年连续半年成为全球视频生成应用月活第一。

目前的数据:2.36亿用户,覆盖200个国家和地区,海外收入占比73%。B端拥有21.4万企业客户和开发者,Google Vertex AI、微软Azure、AWS均已部署MiniMax的模型,Notion首个开源模型的选择也是MiniMax。

2月的ARR突破了1.5亿美元,M2系列单日Token消耗量是去年12月的6倍,其中编程方向增长超过10倍。

这才是市场愿意给出200倍市销率的原因。

但有一组数据需要拆开来看。

年报显示,C端毛利率为4.7%,B端毛利率为69.4%。公司67%的收入来自C端,但C端几乎不贡献毛利。四季度粗略计算,C端毛利率已跌至约2.1%。整体毛利率从12.2%提升至25.4%,主要是因为B端收入比例在四季度快速拉升,从而带动了整体数字。

这是一道尚未完全解答的难题。

大山不是不能翻越

2025年6月,MiniMax发布了M1模型。

闫俊杰在朋友圈发了一句话:

“第一次感觉到大山不是不能翻越。”

河南青年闫俊杰与他的3000亿AI帝国:MiniMax的崛起之路

这句话背后的现实是,中美头部模型技术能力可能仅相差5%,但这5%让海外公司占据了价值高出10倍的场景,收取高出10倍的价格,最终形成近百倍的商业化差距。OpenAI最新估值超过7000亿美元,而MiniMax上市时市值仅为800亿港元,不到100亿美元。

他曾做出一个判断:未来全球会有五家顶级AGI公司,其中至少两家来自中国,甚至有一家能做到第一。

2026年1月9日上市后,他紧接着在1月19日出席了总理主持的专家企业家座谈会,成为继DeepSeek梁文锋之后第二位参会的AI大模型创始人。

随后,3月2日首份年报发布,港股当天大涨。

财报会上,闫俊杰花了很长时间讲述一件事:MiniMax要从“大模型公司”转型为“AI时代的平台型公司”。

他为平台价值下了一个公式:智能密度 × Token吞吐。互联网时代的平台是流量入口,而AI时代的平台则是能够定义智能边界并从中获得商业红利的公司。Google在做,OpenAI在做,他们也要做。

他面对的对手,体量是他的几十倍。

港股上市只是将他推到了另一个战场。季报、分析师、市值压力,这些东西与写代码完全不同。二级市场不相信情怀,只看数字。C端的故事能否转化为毛利,B端的增速能否维持,M3何时推出,这些问题接下来每个季度都需要回答。

但如果把视角拉远一点,MiniMax的故事不仅仅是一家公司的故事。

近年来,美国在芯片领域对中国施加了越来越严格的限制。A100限售,H100限售,H800也限售。逻辑很简单:掐住算力,就掐住了AI的喉咙。

而中国被迫走上了一条完全不同的道路。

DeepSeek用H800跑出了接近H100的效果。MiniMax用5亿美元完成了OpenAI花费数百亿美元才做到的事情。闫俊杰2023年押注MoE,原因是手中的算力卡根本无法支撑亿级用户的推理需求。M2.5连续工作一小时只需1美元,是GPT-5成本的二十分之一。混合注意力架构、线性注意力、CISPO算法等创新,都是在资源受限的情况下被逼出来的。

芯片封锁的初衷是拉大差距,但实际效果却是将中国AI公司逼进了一条低算力、高效率的进化路径。

钱少、卡少、人少,反而催生了极致的工程能力和架构创新。

这与华为做芯片的逻辑相同:你封锁我一项能力,我就在其他维度补回来,在补的过程中,可能会孕育出你没有的东西。

OpenAI现有4000多人,2025年烧掉了80亿美元现金,计划到2030年投入6000亿美元的算力。而MiniMax只有385人,累计花费5亿美元。

胜负尚未可知。但至少现在,赌MiniMax会失败的人越来越少。

2014年那个在百度实习的河南博士生,大概不会想到,十二年后他站上的这个位置,背后牵连着一场关乎国运的技术竞争。

他选择继续奔跑下去。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...