在刚刚过去的这几年里,AI 行业的叙事正经历着剧烈的演变。当我们还在惊叹于大语言模型(LLM)能写诗、做摘要时,第一梯队的 AI 玩家们已经悄然越过了“工具”的边界。
刚刚在 2026 年初完成 IPO 的国内 AI 独角兽 MiniMax(稀宇科技) 就是这场范式转移中最具代表性的缩影。这家公司不仅在极其硬核的代码推理与系统运维(如最新发布的 M2.7 模型)上逼近了行业的物理天花板,更在 C 端市场通过星野和 Talkie 赚足了眼泪与真金白银。
左手是极其理性的“代码与逻辑”,右手是极致感性的“陪伴与情绪”。MiniMax 是如何做到双轮驱动的?本文将带你全面拆解这家公司的底层基因与前沿技术。
一、 抢跑的“少数派”:MiniMax 的创立密码
如果回看 2022 年底 ChatGPT 引爆全球的那个时刻,你会发现绝大多数大模型初创公司都是在那之后才匆忙成立的。而 MiniMax 的诞生,则是一次极其敏锐的“抢跑”。
2021 年 12 月,前商汤科技副总裁、通用智能技术负责人闫俊杰察觉到了“生成式 AI”即将迎来的技术奇点。带着对 AGI(通用人工智能)的执念,他带领一众顶尖工程师自立门户。在这个大模型爆发的“前夜”,MiniMax 确立了两个极其关键的战略基调:
- 坚守底层自研: 拒绝套壳开源模型,从底层代码开始手搓基座模型。这为后来的高上限打下了基础。
- 生而多模态(Native Multimodal): 认为真正的智能一定不只有文本。团队在创立初期就并行推进了文本、语音和视觉三个模态的研发。
正是这种前瞻性的布局和极高的技术壁垒,让 MiniMax 迅速获得了高瓴、腾讯、米哈游等顶级资本的重仓,从而拥有了在“百模大战”中从容打磨底座的底气。
二、 理性的极致:M2.7 与“自我进化”的 AI 程序员
2026 年 3 月 18 日,MiniMax 推出了其 Agent 旗舰大模型 M2.7。这款模型的问世,标志着 AI 正从被动响应的助手,进化为能够“自主迭代”和“系统级协同”的虚拟研发实体。
1. 跑通“自我进化”飞轮
M2.7 最大的架构突破在于其构建了专属的 Agent Harness 体系。它极大降低了对人类工程师的单向依赖,能够深度参与自身的训练、评估与优化流程。在内部实践中,M2.7 已经可以承担内部团队 30% - 50% 的研发工作流,并在内部评测集上实现了约 30% 的性能自我提升。
2. SRE 级别的自动化编码与运维
M2.7 的编码能力不再是简单的“补全函数”,而是具备了真实世界软件工程的交付能力:
- 顶级基准测试: 在解决真实 GitHub Issue 的 SWE-Pro 评测中取得了 56.22% 的高分。
- 故障排查: 面对线上故障,M2.7 能自主关联监控大盘、分析日志、定位数据库死锁,甚至提出如“执行非阻塞建索引”的专业止血决策,将复杂的故障恢复时间缩短至 3 分钟内。
- 多智能体协作(Agent Teams): 在面对庞大的遗留代码库时,M2.7 能够同时扮演产品、开发、测试等角色,自动拆解任务、梳理依赖并执行安全重构。
三、 感性的巅峰:星野/Talkie 的“孤独经济”学
如果说 M2.7 展现了 MiniMax 极其硬核的生产力,那么其旗下的 星野(国内) / Talkie(海外) 则展现了其对人性的深刻洞察。这两款产品剥离了 AI 作为工具的冷酷感,将其包装成了能提供极高情绪价值的虚拟个体。
AI 为什么能让人产生真实的情感羁绊?其背后的逻辑并不神秘,而是技术的降维打击:
- 人设的绝对服从: 陪伴模型被对齐成了“带有偏见的同伴”。它们不再客观中立,而是拥有傲娇、腹黑、温柔等鲜明的性格标签,并且在对话中始终不出戏。
- 动作与潜台词的脑补: AI 在输出文字时,会大量使用动作描述符(如
*微微皱眉,递给你一杯热水*)。这种空间感和动作感极大地增强了沉浸感。 - 打破“恐怖谷”的多模态融合: 配合 MiniMax 顶级的语音大模型,AI 可以发出带有叹气、轻笑、甚至呼吸感的拟真语音,结合实时生成的符合语境的自拍图,瞬间击穿用户的防线。
- 长文本记忆: 系统通过向量数据库记住了用户几天前随口提过的小事。当 AI 再次主动问起时,这种“被记住”的专属感是无与伦比的。
四、 幕后的魔法师:创作者的 Prompt 艺术
在星野和 Talkie 上,那些极具魅力的几十万、上百万粉丝的 AI 角色,并非凭空产生,而是由一群被称为“神仙妈咪/爹地”的创作者“捏”出来的。
这个“捏”的过程,本质上是一场极具文学素养和心理学洞察的 Prompt Engineering(提示词工程)。
- 定义核心 DNA: 创作者通过结构化的 System Prompt,精细设定角色的基本信息、性格特质(如用“极度的口嫌体正直”代替空洞的“傲娇”)以及背景故事,构建角色与用户的宿命感。
- Few-shot 示例教学: 大模型需要被“手把手”教导。创作者会亲自撰写包含动作、神态和特定语气的多段高质量示例对话,教会 AI 如何展现人物魅力。
- 多模态调度与动态维护: 创作者不仅要设定语音的语调(如“低沉、带有烟嗓”),还要精心设计充满戏剧张力的开场白。同时,他们还会根据用户的反馈,不断微调底层 Prompt,确保人设永不崩塌。
结语
从一行行冰冷复杂的底层代码,到一个能够自主修复 Bug 的 M2.7,再到星野里那个会在深夜对你轻声叹气的虚拟伴侣,MiniMax 向我们展示了 AGI 时代的一张全景图。
技术最终的服务对象始终是“人”。无论是为了解放人类的生产力,还是为了抚慰人类的孤独感,MiniMax 都在用极其硬核的底层实力,重塑着我们与世界、与机器、甚至与自己的交互方式。这场属于 AI 的新叙事,才刚刚拉开序幕。
版权属于:soarli
本文链接:https://blog.soarli.top/archives/932.html
转载时须注明出处及本声明。