Andrej Karpathy——OpenAI联合创始人、前特斯拉AI总监,作为全球最具影响力的AI研究者之一,以通俗易懂的表达拆解了行业最关键的六大技术成果与趋势变革。
一、训练范式革新:RLVR开启推理能力进化新纪元
2025年前,大模型训练始终遵循“预训练(Pretraining)-监督微调(SFT)-人类反馈强化学习(RLHF)”的经典三步法,核心依赖数据模仿与人类标注引导。而今年的革命性突破来自RLVR(可验证奖励强化学习) ——这一新增的关键步骤,让模型在数学、代码等有明确标准答案的场景中自主试错,通过结果核对反向优化解题策略,就像把学习者直接投入实践场景摸索方法,而非仅靠模仿示范。
这一变革带来两大核心影响:一是模型首次“悟”出自主推理能力,学会拆分问题、回头纠错等复杂思维策略,这些能力靠人类标注根本无法实现;二是算力分配彻底重构,过去集中于预训练阶段的算力,如今大量倾斜至RL阶段,即便模型参数规模未显著增长,推理效率仍实现质的飞跃。OpenAI的o1是该路线的起点,而o3则成为真正的技术拐点,同时还为用户新增了“让模型思考更久”的能力调节旋钮。
二、智能形态认知:“锯齿状智能”打破全能幻想
经过一年的实践探索,行业终于明确:大模型并非进化而来的“智能生物”,更像是为特定目标被“召唤的幽灵”。人类智能以“生存进化”为优化目标,而大模型的智能核心是“模仿人类表达、获取测试高分”,这造就了其“锯齿状智能(Jagged Intelligence)” 的独特特征——既能攻克复杂奥数题、推导专业公式,又会在数单词字母数量、基础常识判断等简单任务上犯低级错误。
这种“薛定谔的聪明”也让传统基准测试失去参考价值:所有企业都在针对测试数据集“刷题式训练”,即便榜单分数拉满,也与真正的通用智能相去甚远,AGI的实现无法依赖这种表面优化。
三、应用层爆发:Cursor定义垂直封装新范式
今年爆火的Cursor,其核心价值远超产品本身——它成功验证了“LLM应用层”的商业逻辑,催生了“XX行业的Cursor”这一全新赛道,标志着大模型从通用技术向场景落地的深度渗透。
Cursor开创的应用范式包含四大核心:一是上下文工程,精准整理场景化信息投喂模型;二是多模型编排,通过串联多个API调用平衡效果与成本;三是专业界面适配,让人类在关键节点高效介入;四是自主程度滑杆,允许用户灵活调节AI参与深度。正如Karpathy的生动比喻:模型厂商负责培养“具备通用能力的大学生”,而Cursor类应用则承担“岗位培训”角色,将通用技术转化为即插即用的行业生产力工具,数据处理、反馈循环等场景化工作成为应用层的核心竞争力。
四、部署形态迁移:本地智能体成人机协同新主流
Anthropic推出的Claude Code,被Karpathy评为“迄今为止最令人信服的AI智能体”,其核心突破在于本地部署模式——摆脱云端依赖,直接“住进”用户电脑,依托本地环境、数据(代码、密钥等)工作,理论上可复刻人类所有键盘鼠标操作。
这一模式精准击中当前行业痛点:相较于OpenAI将所有功能塞进ChatGPT云端的路线,Claude Code选择以极简命令行界面,成为与用户并肩工作的“田螺姑娘”。在模型能力不稳定、上下限差异巨大的现阶段,这种“端到端”的本地智能体更符合实际需求——用户核心数据仍留存在本地,人机协同更安全、高效,开启了全新的交互范式。
五、生产力革命:Vibe Coding实现编程“全民化”
Karpathy随手发明的词汇“Vibe Coding(体感编程)”,成为2025年最火的技术概念之一——它让纯自然语言描述需求即可生成程序,彻底打破了专业编程的门槛,实现“权力归于人民”的软件自由。
与过往技术革命不同,Vibe Coding的受益群体呈现“反常规”特征:普通用户的获益远超专业程序员与大型企业。对非专业人士而言,编程不再是遥不可及的技能;对开发者而言,代码变得“廉价化、即用即弃”,像草稿纸一样可随时编写、随时丢弃——Karpathy本人就曾用它写定制分词器、工具类App,甚至只为查找一个Bug编写一次性程序。这种变革将彻底重塑软件生产逻辑与程序员的岗位要求,推动行业进入全民创新的新阶段。
六、交互形态升级:Nano Banana开启LLM“GUI时代”
被多数人视为“优秀图片模型”的Google Gemini Nano Banana,在Karpathy眼中却是大模型“图形界面化”的关键雏形,标志着人机交互即将迎来质的飞跃。
大模型天然擅长文本对话,但人类更倾向于通过视觉化信息高效获取内容——这正如计算机从DOS命令行向Windows图形界面的演进。Nano Banana的核心突破,是将文本生成、图像生成与世界知识深度融合,能根据对话实时输出图表、动画、简报等可视化内容,而非单纯的文字回复。当前的Emoji与Markdown只是文字的“初级化妆”,未来的大模型将彻底走出文本舒适区,以人类喜闻乐见的视觉化格式实现信息交互,这一变革被Karpathy称为“2025年最难以置信的标志性事件”。
总结:在聪明与愚蠢之间,探索10%后的无限可能
Karpathy用“既比预期更聪明,也比预期更愚蠢”总结2025年的大模型——它们在可验证领域的推理能力突飞猛进,却仍在基础场景频繁出错。但可以确定的是,整个行业仅挖掘了10%的潜力,大量创新空间等待探索。
正如他在播客中所言:“进步会继续飞速推进,同时还有大量工作要做”——这两句看似矛盾的话,恰恰揭示了LLM行业的现状与未来。2026年,这场技术革命仍将加速前行,值得我们系好安全带,共同见证更多颠覆式变革。











