1 minute read

上周看完张小珺对罗福莉的 3.5 小时访谈,我做了笔记。

这场访谈在朋友圈、行业群里被反复刷屏。每一条核心判断都被截图——

“Anthropic 的路径是正确的,这是当下共识。”

“1T 是入场券。”

“卡的比例从 3 : 5 : 1 变成 3 : 1 : 1。”

“中层模型 + 好框架,85% 任务接近顶尖模型。”

“我们没有职级、没有小组、没有 deadline。”

每一条都立得住。每一条都是模型公司一线的真实判断。

这场访谈值得每个做 AI 的人好好看看——不管你做的是模型能力,还是场景落地。3.5 小时不算长,张小珺的提问耐心,罗福莉讲得坦诚,把模型公司这两个月怎么思考、怎么调整、怎么押注,都摊开来了。光是这份坦诚,在当下的 AI 行业就稀缺。

但我看完之后心里有一个声音越来越大——

这场访谈讲的是模型能力,但听访谈的人,绝大多数在做场景落地。

国内做基座模型的人加起来不会超过几千。做 AI 场景落地的人——保险、医疗、银行、制造、政务、零售——加起来是几十万。

罗福莉的访谈本来就不是讲给场景落地的。要求她讲落地,是错位的期待。

但有一件事是真的——她讲的每一条关于模型能力的判断里,都藏着一条对场景落地的启示。只是这些启示,需要落地的人自己反推出来。

下面是我读完之后,反推出来的三件事。

第一件事:当顶尖能力变得可借力,护城河就转移到了下限

罗福莉讲了一个非常有冲击力的发现:

“中层模型 + 好的 Agent 框架,在 85% 任务上能达到跟顶尖模型一样的水准。”

她讲这句话的时候是兴奋的——意味着模型不必无限堆参数,框架的工程红利可以释放。这句话对模型公司是利好。

那对落地意味着什么?

意味着——顶尖模型的能力,正在变得越来越容易被借到。这是一件好事。意味着行业落地不再需要等待”我们有没有 1T 模型”这个问题被解决。中层模型 + 好框架,对大多数行业场景已经够用。

但同样这件事,也带来一个反向推论:当能力上限越来越容易获取,竞争的护城河就不在能力上限了,在下限。

模型公司面对的是任务平均完成率。行业落地面对的是单次错误代价。这两件事不是同一个量纲。

医疗 AI 辅助诊断的 85%,等于不可用。银行反欺诈风控的 85%,等于在放过 15%。制造工业质检的 85%,等于让 15 个不良品流到下游。保险智能核保的 85%,等于每一百单里十五单要赔出去。

模型给你 85% 的上限。剩下那 15%,决定产品生死。

而那 15% 从来不是模型给的——是工程,是规则引擎,是和业务部门一起趟出来的边界,是法务签字时的那一刻底气。

所以罗福莉那句话给落地人的真正启示是:把更多精力,从”找更强的模型”转到”守住下限的那 15%”。那是真正的护城河。


第二件事:当模型公司在追赶共识,落地的人要学会领先共识

整场访谈最值得反复琢磨的,是这一句:

“Anthropic 的路径是正确的,这是当下共识。”

注意——当下共识

罗福莉讲这句话是没问题的。她在做基座,她在追赶一个被验证过的方向。这条赛道有清晰的对标对象、有清晰的指标、有清晰的成功定义。追赶本身就是后验。

但对落地的人,”等共识形成再做”这个节奏不成立。

为什么?因为客户的需求一旦变成”行业共识”,意味着所有人都在做了。等共识形成那天,你已经被甩在第二梯队,客户已经选了别人。

落地的工作恰恰相反——要在共识形成之前,先把自己放到对的位置上。

信创路线要不要押?端侧推理要不要练?规则引擎要不要保留?和年长的业务专家一起改 SOP 要不要做?这里面没有一件是当下”行业共识”。但每一件,都是客户两年后会问你”你们做了吗”的事。

罗福莉的工作是追赶共识——这件事难,需要 1T 模型、几千张卡、世界级人才。

落地的工作是领先共识——这件事也难,需要的是另一套能力:对行业流程的判断、对客户决策链路的耐心、对监管和合规演变的预感。

所以这条访谈里”当下共识”的启示是:模型公司在共识里跑,落地的人要在共识形成之前下注。两种节奏,两种纪律。


第三件事:自迭代是模型公司的故事,沉淀是落地公司的故事

在讲这件事之前,先插一个观察。

整场访谈里,最让我警觉的不是某一条具体判断,是她修正自己判断的频率。

“我两个月前很相信多模态产生智能,最近稍微有点质疑这个事情。”

“我之前认为我们做的工作已经足够有创造力,但我现在发现它竟然也能。”

“我以前认为(预训练的方向)要提前一年想清楚,现在我觉得半年就必须想清楚了。”

她在一场访谈里,三次承认自己几个月前的判断被自己推翻了。这件事比”AGI 还有两年”更值得记下来。因为这意味着——一个每天在训 1T 大模型的内部人士,自己的判断区间正在以月为单位变化。

这是为什么”自迭代”这件事,对模型公司来说会比所有人想象的都来得更快。

但顺着这句话往下推一层——

她讲的”自迭代”,前提是奖励信号清晰。代码会编译,数学有标准答案,模型可以靠”对/错”这样的信号自己往前走。

行业 AI 的世界没有这种信号。

业务专家对一个 AI 输出说”还行”是什么意思?客户法务说”我们再讨论一下”是支持还是反对?某个一线员工不愿意点那个 AI 按钮,是技术问题还是组织问题?

这些信号是模糊的、延迟的、文化嵌入的。模型不会”左脚踩右脚”训出对它们的理解。它只能在和现场磨合的过程中,被人翻译进来。

这件事的启示是——

模型公司的故事是”自迭代”:靠数据、算力、清晰 reward,模型自己越变越强。

行业落地的故事是”沉淀”:靠和客户的一次次磨合,把那些模糊的、说不清的、藏在业务里的判断,慢慢沉淀成可用的规则、可用的数据、可用的下一代提示词。

它的样子,可能是这样的——

一个干了二十年的老理赔员,在新上线的 AI 辅助系统前坐了一下午,不肯点那个”一键生成定损建议”的按钮。工程师后来去问他原因。他说不出来。沉默了半天,憋出一句:”你这个’建议金额’我签了字就要担责,你让我签个机器算的数,我心里没底。”

第二天,工程师把按钮上的字改了。把”一键生成定损建议”,改成”参考价区间”。把那个具体到个位的数字,改成一个上下浮动的范围。

老理赔员开始用了。

这件事不会出现在任何一篇技术报告里。但它就是沉淀。很笨。很慢。不性感,不会被写进访谈,不会被截图传播。但这就是场景落地的工作方式。

场景落地的迭代节奏不是”自迭代”,是另一套:客户用 → 数据沉淀 → 规则增厚 → 模型替换 → 效果保持。每一步都需要人,每一步都不能跳过。


写给做场景落地的人

罗福莉那场访谈其实给落地的人留下了三个可借力的判断——

第一,她说”中层模型 + 好框架 = 85% 接近顶尖”——告诉我们,不必再被”基座模型代差”绑架了。能力供给越来越平价,工程编排越来越关键。

第二,她说”接下来两三个月会非常精彩”——告诉我们,Agent 框架本身正在以肉眼可见的速度变好。这意味着行业落地的”中间层”会变厚、变稳、变便宜。这是落地这一侧的红利。

第三,她说”开源 Agent 框架的群体智能正在涌现”——告诉我们,很多模型短板会被框架补上。我们不必什么都自建,但要清楚什么该自建、什么该借用、什么该交给社区。

这三件事都是天花板上发生的好消息。

但天花板的好消息要变成地基的产能,需要一个翻译过程。这个翻译过程,没有任何一场基座模型公司的访谈会替你做。也不会有任何一篇技术研究会替你写。它只能在地基上,由我们自己一砖一瓦地搭起来。


一个题外话:讲落地的人有几十万,被听见的没几个

我看完罗福莉访谈那天,去搜了一下”AI 落地的访谈”——想看看有没有类似的、深度还原一个落地一线人物的长对谈。

不是没有。36 氪有一篇《对话网商银行 CIO 高嵩:AI 应用要找高价值场景》,质量很高。海外的 Lenny’s Podcast 访谈过 OpenAI Codex 团队、Block 的 CTO、Anthropic 的产品负责人,里面有大量落地一线的真实困境。麦肯锡、爱分析每年都出企业 AI 落地的深度报告。CIO 闭门会的复盘文章也越来越多。

讲落地的内容是有的——只是和讲模型的内容比起来,完全不在一个量级。

罗福莉一场访谈,3.5 小时,全网刷屏,朋友圈截图、行业群转发、B 站搬运、文字稿满天飞。而那些 CIO 访谈、那些落地复盘——大多是几千字的稿件,配在 36 氪、新浪财经、行业垂直号的角落里,几天之后就被新的热点冲走了。

这不是因为落地不重要。恰恰相反——”AI + 行业会跑出巨头”是 2026 年的共识。YC W26 那一批的 198 家公司,85% 是 AI first,最大的赛道是医疗、法律、销售、金融。麦肯锡、爱分析、达沃斯论坛今年的核心议题都是 AI 的 ROI 和场景落地。资本和共识都已经在往落地这一侧倾斜。

但共识归共识,叙事归叙事——这两件事是脱钩的。

落地的故事在叙事上天然吃亏,原因有三个:

第一,落地没有”奇点时刻”。 罗福莉访谈里最有传播力的那句”自己左脚踩右脚就提升了”——是奇点叙事,一瞬间的认知颠覆。但落地的故事是”我们花了三个月让一个老理赔员愿意点按钮”。这件事极其重要,但它没有奇点,它是一个累积过程。累积叙事在注意力时代天然吃亏。

第二,落地的核心经验难公开。 罗福莉可以坦然讲卡的比例、MTP 选择、注意力稀疏比——这些都是可以公开的技术判断。但一个 CIO 怎么公开讲他们处理客户法务犹豫的方法?怎么讲他们和监管之间的边界?真正有价值的落地经验,恰恰是最难公开讲的。

第三,落地的英雄主义不张扬。 把”AI 建议”四个字改成”参考价区间”——这件事改完之后没人会觉得是英雄时刻。但它解决的可能是一个团队半年没解决的问题。这种英雄主义不张扬,所以传不出去。

但讲不出去,不代表不存在。保险 AI 的护城河,是某个团队真的让一群干了二十年的老理赔员开始用 AI。法律 AI 的护城河,是某个团队真的把上万份合同变成了可训练的语料。这些事在故事性上输给”训出 GPT-5”,但在商业价值上,会赢。

讲落地的人有几十万。讲落地的内容也有不少。但被认真听见、被沉淀成行业共识的,没几个。这是这个行业的结构性缺口,也是这个号想试着做的事。


两种位置,三条纪律

把上面三件事压成一句话——

她在共识里追赶,我们在共识形成之前下注。她讲自迭代,我们做沉淀。她在意 85% 的上限,我们守 15% 的下限。

两个位置都重要。但用她的尺子量自己,会量出错的答案。

罗福莉讲了 3.5 小时模型之内的事——这是她的世界,是她的位置。绝大多数 AI 从业者做的,是模型之外的事——这是我们的世界,我们的位置。

那是这场访谈,最不该被忽略的那条线。


「模型之外的事」系列。在 AI 的喧嚣里,替你找到真正能用的东西。不搬运新闻,不贩卖焦虑。