kar模型是什么AI 简讯｜2025年压轴专题：Andrej Karpathy视角下的大模型年度范式跃迁-上海聚慕医疗器械有限公司

AI赋能网安创新

本期AI简讯基于OpenAI前核心研究员、特斯拉前AI总监Andrej Karpathy于2025年12月20日发布的文章《2025 LLM Year in Review》。

该文并非传统意义上的技术综述，而是作者基于一线工程与研究经验，总结的2025年大语言模型领域出现的若干“范式级变化”。Karpathy将2025年视为LLM发展的关键转折点，认为模型能力提升的主因已从“规模扩张”转向“训练方式、推理形态与应用结构”的系统性变化。本期简报围绕作者提出的六大核心观点进行整理，并结合网络安全行业视角，提炼其对安全技术与产品演进的启示。

观点一：RLVR成为大模型能力跃迁的核心引擎

2025年，强化学习从人类反馈（RLHF）进一步演进为基于可验证奖励的强化学习（Reinforcement Learning from Verifiable Rewards, RLVR），成为事实上的新标准训练阶段
通过在数学、代码等可自动验证环境中进行长时间强化学习，模型自发形成类似“推理”的问题拆解与回溯策略，这是以往SFT与RLHF难以实现的
RLVR具备高能力产出与高算力效率的特点，推动算力资源从预训练阶段转向更长周期的强化学习与推理阶段
模型能力开始显著依赖测试时计算资源，推理“思考时间”成为新的能力调节变量

观点二：LLM 是“幽灵智能”，能力呈现高度锯齿化

LLM并非类似人类或动物的连续智能体，而是在完全不同优化目标下生成的“幽灵式智能”
这类智能在部分可验证领域能力极强，但在相邻任务或开放场景中可能表现出明显脆弱性
大模型同时具备“天才级能力”和“易被欺骗”的特征，能力分布呈现明显锯齿状
这一特性决定了模型在安全敏感场景中存在不可忽视的失效边界与行为不连续风险

观点三：基准测试正在快速失去判别价值

由于基准测试本身属于可验证环境，模型可以通过RLVR或合成数据对其进行高度针对性的优化
“在测试集附近训练”逐渐成为一种普遍却难以避免的工程现实，导致Benchmark得分与真实泛化能力脱钩
Karpathy对2025年的Benchmark体系表达了明显的不信任态度，认为其已难以反映模型真实智能水平
对产业界而言，单纯依赖Benchmark排名进行技术决策的风险正在显著上升

观点四：LLM应用进入“中间层主导”的新阶段

Cursor的成功表明，真正释放模型价值的关键不在模型本身，而在于对模型调用、上下文与流程的系统性组织
新一代LLM应用通过上下文工程、多步骤调用编排、人机协同界面等方式，将通用模型转化为可用的专业能力
基础模型将趋向“通用能力毕业生”，而应用层负责将其组织为可落地的“专业团队”
这意味着产业竞争重心正在从模型能力转向应用架构与工程能力

观点五：Agent形态发生转变，AI开始“驻留”本地环境

Claude Code被视为首个真正意义上的LLM Agent，其特征在于长时运行、持续推理与本地工具调用
与云端Agent相比，本地Agent能直接访问真实的开发环境、数据、配置与密钥，交互延迟更低，上下文更完整
Agent并不只是“在哪里运行”的问题，而是与整个系统环境深度耦合的智能体
这一变化显著扩大了AI的权限边界，也同步放大了潜在的安全风险

观点六：Vibe Coding与LLM GUI重塑人机与软件形态

2025 年，大模型跨越了“仅用自然语言构建复杂软件”的能力门槛，“Vibe Coding”成为现实生产方式
软件从高成本资产转变为低成本、可快速生成与丢弃的工具，软件生产范式被系统性重构
Chat只是早期交互形态，未来LLM将直接生成图形界面、流程图和可操作应用
Google Gemini Nano Banana 被视为LLM GUI的早期信号，预示着AI正从“文本助手”走向“界面生成者”

对网络安全行业的综合启示

大模型能力的锯齿化与长推理路径，使安全评估必须从结果导向转向过程与行为导向
本地Agent与工具调用链将成为新的高风险攻击面，传统模型安全假设面临挑战
AI安全产品的核心价值将更多体现在上下文控制、权限约束与流程治理，而非模型规模
身份安全、终端安全与AI行为审计将成为重要技术演进方向

作者介绍：Andrej Karpathy

Andrej Karpathy是全球最具影响力的AI研究者与工程实践者之一，曾参与创建OpenAI并主导GPT系列早期研究
他曾担任特斯拉AI总监，负责自动驾驶系统中的计算机视觉与端到端学习体系
其观点兼具研究深度与工程现实感，对AI产业路线判断具有高度参考价值
其年度回顾文章通常被视为理解AI技术真实进展的重要非官方参考

山石网科是中国网络安全行业的技术创新领导厂商，由一批知名网络安全技术骨干于2007年创立，并以首批网络安全企业的身份，于2019年9月登陆科创板（股票简称：山石网科，股票代码：688030）。

现阶段，山石网科掌握30项自主研发核心技术，申请560多项国内外专利。山石网科于2019年起，积极布局信创领域，致力于推动国内信息技术创新，并于2021年正式启动安全芯片战略。2023年进行自研ASIC安全芯片的技术研发，旨在通过自主创新，为用户提供更高效、更安全的网络安全保障。目前，山石网科已形成了具备“全息、量化、智能、协同”四大技术特点的涉及基础设施安全、云安全、数据安全、应用安全、安全运营、工业互联网安全、信息技术应用创新、AI安全、安全服务、安全教育等10大类产品及服务，50余个行业和场景的完整解决方案。

kar模型是什么AI 简讯｜2025年压轴专题：Andrej Karpathy视角下的大模型年度范式跃迁

相关推荐

作者介绍

聚慕医疗

热门文章

切换注册登录

切换登录注册