罗福莉讲的是模型能力，但每一条都藏着对场景落地的启示

1 minute read

上周看完张小珺对罗福莉的 3.5 小时访谈，我做了笔记。

这场访谈在朋友圈、行业群里被反复刷屏。每一条核心判断都被截图——

“Anthropic 的路径是正确的，这是当下共识。”

“1T 是入场券。”

“卡的比例从 3 : 5 : 1 变成 3 : 1 : 1。”

“中层模型 + 好框架，85% 任务接近顶尖模型。”

“我们没有职级、没有小组、没有 deadline。”

每一条都立得住。每一条都是模型公司一线的真实判断。

这场访谈值得每个做 AI 的人好好看看——不管你做的是模型能力，还是场景落地。3.5 小时不算长，张小珺的提问耐心，罗福莉讲得坦诚，把模型公司这两个月怎么思考、怎么调整、怎么押注，都摊开来了。光是这份坦诚，在当下的 AI 行业就稀缺。

但我看完之后心里有一个声音越来越大——

这场访谈讲的是模型能力，但听访谈的人，绝大多数在做场景落地。

国内做基座模型的人加起来不会超过几千。做 AI 场景落地的人——保险、医疗、银行、制造、政务、零售——加起来是几十万。

罗福莉的访谈本来就不是讲给场景落地的。要求她讲落地，是错位的期待。

但有一件事是真的——她讲的每一条关于模型能力的判断里，都藏着一条对场景落地的启示。只是这些启示，需要落地的人自己反推出来。

下面是我读完之后，反推出来的三件事。

第一件事：当顶尖能力变得可借力，护城河就转移到了下限

罗福莉讲了一个非常有冲击力的发现：

“中层模型 + 好的 Agent 框架，在 85% 任务上能达到跟顶尖模型一样的水准。”

她讲这句话的时候是兴奋的——意味着模型不必无限堆参数，框架的工程红利可以释放。这句话对模型公司是利好。

那对落地意味着什么？

意味着——顶尖模型的能力，正在变得越来越容易被借到。这是一件好事。意味着行业落地不再需要等待”我们有没有 1T 模型”这个问题被解决。中层模型 + 好框架，对大多数行业场景已经够用。

但同样这件事，也带来一个反向推论：当能力上限越来越容易获取，竞争的护城河就不在能力上限了，在下限。

模型公司面对的是任务平均完成率。行业落地面对的是单次错误代价。这两件事不是同一个量纲。

医疗 AI 辅助诊断的 85%，等于不可用。银行反欺诈风控的 85%，等于在放过 15%。制造工业质检的 85%，等于让 15 个不良品流到下游。保险智能核保的 85%，等于每一百单里十五单要赔出去。

模型给你 85% 的上限。剩下那 15%，决定产品生死。

而那 15% 从来不是模型给的——是工程，是规则引擎，是和业务部门一起趟出来的边界，是法务签字时的那一刻底气。

所以罗福莉那句话给落地人的真正启示是：把更多精力，从”找更强的模型”转到”守住下限的那 15%”。那是真正的护城河。

第二件事：当模型公司在追赶共识，落地的人要学会领先共识

整场访谈最值得反复琢磨的，是这一句：

“Anthropic 的路径是正确的，这是当下共识。”

注意——当下共识。

罗福莉讲这句话是没问题的。她在做基座，她在追赶一个被验证过的方向。这条赛道有清晰的对标对象、有清晰的指标、有清晰的成功定义。追赶本身就是后验。

但对落地的人，”等共识形成再做”这个节奏不成立。

为什么？因为客户的需求一旦变成”行业共识”，意味着所有人都在做了。等共识形成那天，你已经被甩在第二梯队，客户已经选了别人。

落地的工作恰恰相反——要在共识形成之前，先把自己放到对的位置上。

信创路线要不要押？端侧推理要不要练？规则引擎要不要保留？和年长的业务专家一起改 SOP 要不要做？这里面没有一件是当下”行业共识”。但每一件，都是客户两年后会问你”你们做了吗”的事。

罗福莉的工作是追赶共识——这件事难，需要 1T 模型、几千张卡、世界级人才。

落地的工作是领先共识——这件事也难，需要的是另一套能力：对行业流程的判断、对客户决策链路的耐心、对监管和合规演变的预感。

所以这条访谈里”当下共识”的启示是：模型公司在共识里跑，落地的人要在共识形成之前下注。两种节奏，两种纪律。

第三件事：自迭代是模型公司的故事，沉淀是落地公司的故事

在讲这件事之前，先插一个观察。

整场访谈里，最让我警觉的不是某一条具体判断，是她修正自己判断的频率。

“我两个月前很相信多模态产生智能，最近稍微有点质疑这个事情。”

“我之前认为我们做的工作已经足够有创造力，但我现在发现它竟然也能。”

“我以前认为（预训练的方向）要提前一年想清楚，现在我觉得半年就必须想清楚了。”

她在一场访谈里，三次承认自己几个月前的判断被自己推翻了。这件事比”AGI 还有两年”更值得记下来。因为这意味着——一个每天在训 1T 大模型的内部人士，自己的判断区间正在以月为单位变化。

这是为什么”自迭代”这件事，对模型公司来说会比所有人想象的都来得更快。

但顺着这句话往下推一层——

她讲的”自迭代”，前提是奖励信号清晰。代码会编译，数学有标准答案，模型可以靠”对/错”这样的信号自己往前走。

行业 AI 的世界没有这种信号。

业务专家对一个 AI 输出说”还行”是什么意思？客户法务说”我们再讨论一下”是支持还是反对？某个一线员工不愿意点那个 AI 按钮，是技术问题还是组织问题？

这些信号是模糊的、延迟的、文化嵌入的。模型不会”左脚踩右脚”训出对它们的理解。它只能在和现场磨合的过程中，被人翻译进来。

这件事的启示是——

模型公司的故事是”自迭代”：靠数据、算力、清晰 reward，模型自己越变越强。

行业落地的故事是”沉淀”：靠和客户的一次次磨合，把那些模糊的、说不清的、藏在业务里的判断，慢慢沉淀成可用的规则、可用的数据、可用的下一代提示词。

它的样子，可能是这样的——

一个干了二十年的老理赔员，在新上线的 AI 辅助系统前坐了一下午，不肯点那个”一键生成定损建议”的按钮。工程师后来去问他原因。他说不出来。沉默了半天，憋出一句：”你这个’建议金额’我签了字就要担责，你让我签个机器算的数，我心里没底。”

第二天，工程师把按钮上的字改了。把”一键生成定损建议”，改成”参考价区间”。把那个具体到个位的数字，改成一个上下浮动的范围。

老理赔员开始用了。

这件事不会出现在任何一篇技术报告里。但它就是沉淀。很笨。很慢。不性感，不会被写进访谈，不会被截图传播。但这就是场景落地的工作方式。

场景落地的迭代节奏不是”自迭代”，是另一套：客户用 → 数据沉淀 → 规则增厚 → 模型替换 → 效果保持。每一步都需要人，每一步都不能跳过。

写给做场景落地的人

罗福莉那场访谈其实给落地的人留下了三个可借力的判断——

第一，她说”中层模型 + 好框架 = 85% 接近顶尖”——告诉我们，不必再被”基座模型代差”绑架了。能力供给越来越平价，工程编排越来越关键。

第二，她说”接下来两三个月会非常精彩”——告诉我们，Agent 框架本身正在以肉眼可见的速度变好。这意味着行业落地的”中间层”会变厚、变稳、变便宜。这是落地这一侧的红利。

第三，她说”开源 Agent 框架的群体智能正在涌现”——告诉我们，很多模型短板会被框架补上。我们不必什么都自建，但要清楚什么该自建、什么该借用、什么该交给社区。

这三件事都是天花板上发生的好消息。

但天花板的好消息要变成地基的产能，需要一个翻译过程。这个翻译过程，没有任何一场基座模型公司的访谈会替你做。也不会有任何一篇技术研究会替你写。它只能在地基上，由我们自己一砖一瓦地搭起来。

一个题外话：讲落地的人有几十万，被听见的没几个

我看完罗福莉访谈那天，去搜了一下”AI 落地的访谈”——想看看有没有类似的、深度还原一个落地一线人物的长对谈。

不是没有。36 氪有一篇《对话网商银行 CIO 高嵩：AI 应用要找高价值场景》，质量很高。海外的 Lenny’s Podcast 访谈过 OpenAI Codex 团队、Block 的 CTO、Anthropic 的产品负责人，里面有大量落地一线的真实困境。麦肯锡、爱分析每年都出企业 AI 落地的深度报告。CIO 闭门会的复盘文章也越来越多。

讲落地的内容是有的——只是和讲模型的内容比起来，完全不在一个量级。

罗福莉一场访谈，3.5 小时，全网刷屏，朋友圈截图、行业群转发、B 站搬运、文字稿满天飞。而那些 CIO 访谈、那些落地复盘——大多是几千字的稿件，配在 36 氪、新浪财经、行业垂直号的角落里，几天之后就被新的热点冲走了。

这不是因为落地不重要。恰恰相反——”AI + 行业会跑出巨头”是 2026 年的共识。YC W26 那一批的 198 家公司，85% 是 AI first，最大的赛道是医疗、法律、销售、金融。麦肯锡、爱分析、达沃斯论坛今年的核心议题都是 AI 的 ROI 和场景落地。资本和共识都已经在往落地这一侧倾斜。

但共识归共识，叙事归叙事——这两件事是脱钩的。

落地的故事在叙事上天然吃亏，原因有三个：

第一，落地没有”奇点时刻”。 罗福莉访谈里最有传播力的那句”自己左脚踩右脚就提升了”——是奇点叙事，一瞬间的认知颠覆。但落地的故事是”我们花了三个月让一个老理赔员愿意点按钮”。这件事极其重要，但它没有奇点，它是一个累积过程。累积叙事在注意力时代天然吃亏。

第二，落地的核心经验难公开。 罗福莉可以坦然讲卡的比例、MTP 选择、注意力稀疏比——这些都是可以公开的技术判断。但一个 CIO 怎么公开讲他们处理客户法务犹豫的方法？怎么讲他们和监管之间的边界？真正有价值的落地经验，恰恰是最难公开讲的。

第三，落地的英雄主义不张扬。 把”AI 建议”四个字改成”参考价区间”——这件事改完之后没人会觉得是英雄时刻。但它解决的可能是一个团队半年没解决的问题。这种英雄主义不张扬，所以传不出去。

但讲不出去，不代表不存在。保险 AI 的护城河，是某个团队真的让一群干了二十年的老理赔员开始用 AI。法律 AI 的护城河，是某个团队真的把上万份合同变成了可训练的语料。这些事在故事性上输给”训出 GPT-5”，但在商业价值上，会赢。

讲落地的人有几十万。讲落地的内容也有不少。但被认真听见、被沉淀成行业共识的，没几个。这是这个行业的结构性缺口，也是这个号想试着做的事。

两种位置，三条纪律

把上面三件事压成一句话——

她在共识里追赶，我们在共识形成之前下注。她讲自迭代，我们做沉淀。她在意 85% 的上限，我们守 15% 的下限。

两个位置都重要。但用她的尺子量自己，会量出错的答案。

罗福莉讲了 3.5 小时模型之内的事——这是她的世界，是她的位置。绝大多数 AI 从业者做的，是模型之外的事——这是我们的世界，我们的位置。

那是这场访谈，最不该被忽略的那条线。

「模型之外的事」系列。在 AI 的喧嚣里，替你找到真正能用的东西。不搬运新闻，不贩卖焦虑。

Share on

X Facebook LinkedIn Bluesky

Madden Zhang

罗福莉讲的是模型能力，但每一条都藏着对场景落地的启示

第一件事：当顶尖能力变得可借力，护城河就转移到了下限

第二件事：当模型公司在追赶共识，落地的人要学会领先共识

第三件事：自迭代是模型公司的故事，沉淀是落地公司的故事

写给做场景落地的人

一个题外话：讲落地的人有几十万，被听见的没几个

两种位置，三条纪律

Share on

You May Also Enjoy

工程师的两条上行路：从 Software Engineer 到 Business Builder 和 Harness Engineer

激动人心的噪音里，你的护城河反而变厚了——一个写给 AI 工程化落地从业者的反常识判断

AI 项目死在工程，不是模型

「AI 学得比我快吗？」——你可能问错了问题