让世界因你生长

每天，人们都在跟各种各样的软件互动。

很久以前，我们教软件背——文件名、密码、邮件地址、书签、桌面快捷方式。软件不会「学」，它只是把我们明确告诉它的东西原样收好，等我们回来取。

后来推荐系统出现，软件开始学——我们看了什么、跳过了什么、停留多久、收藏了什么。它能从行为反推偏好，从一个固定的内容库里，把最合适的那份挑出来给你。

但这种学的成立是有前提的：内容是不动的。同一段视频、同一篇文章、同一首歌，对每个人都是同一个 item。学习的本质，是用一群相同的 item 把不同的用户对齐——你跟我看过一样的东西、有过一样的反应，我们就被认为口味相近。它实际上是用 item 来定义 user。

这套方法解决了一整代产品的问题。但当内容由模型实时生成时，前提塌了——

每一次对话都是一段独一无二、不可重放的轨迹。同一个用户、同一句话，模型这次给出的回应和下次都不是同一段。两个用户的「同一段对话」其实根本不是同一段。没有不变的 item，user 也就无法靠它被对齐。

那一整套用 item 定义 user 的范式，在这里失效了。

我们需要一种新的方式让软件认识人——不是通过他和别人共享了什么内容，而是通过他和这个系统之间，真正发生过的、独属于他的那段互动——

我们教得很多。但它学得很浅。

不是模型不够聪明——是大多数系统从一开始就没打算「学习」。它们被设计成给所有人一个还不错的回答，而不是被设计成和你长期相处、慢慢变得不一样的对象。

但生成式系统显然不只能这样：它可以在和你的每一次对话里，真的去学、去适应、去因你而变；让它的世界因你生长。

我们想要解决的问题

要让一个系统在互动中真正生长，至少要重新回答几件事：

我们把这些命题拆成四个方向：

从用户的即时交互中学习。

不再依赖一次集中、离线的训练周期，而是把每一次对话当成模型可以立刻吸收的信号——你的纠正、追问、转向、沉默都是。

学到的东西必须能被留下来，否则下一次对话又是一个新用户。我们同时探索两条互补的路径：

不再干预模型的决策，只是为它能更好地学习、理解用户提供环境，让用户对模型有最大的控制权，同时让模型有最大的学习自由度。

在大多数系统里，模型只是 pipeline 末端的一个组件——记忆、个性化、内容选择、界面逻辑都在它之外，由代码编排着模型。我们想要的是相反的关系：代码退到旁边，决策权交回给模型；用户保留对自己体验的最终控制。

不再是传统的 AB 评估或者离线 benchmark。为了模型能更好地在用户的交互中生长，我们必须实时地将用户交互转化为模型可学习的信号，即时地纠正和鼓励模型的行为。

离线 benchmark 告诉我们模型在群体上的好坏，但不会告诉模型，它刚才那一句话有没有真的接住你。

这一层缺口必须被补上。

我们相信，下一代内容不会再是被挑选着推到你面前的——而是会在你与系统的互动中生长出来。

娱乐、陪伴、教育、创作工具——当系统真的开始学着和具体的人相处，这些体验都会被根本性地重塑。它面对的是一个具体的人，而不是一段画像。

这件事不是来自一个更强的新模型，也不是来自更多的训练数据。它来自一个不一样的设计选择——让模型可以学，让它学到的东西能留下来，让整个系统围绕它生长，让反馈发生在每一次互动里。

实验室里的每一个研究方向，都是为了让这件事真的发生。我们的工作每天都在一个被真实用户使用的产品里被检验。

如果这件事，正好是那个你也停不下来想的问题——
来和我们一起做。