Kaon /keɪ.ɒn/[ ai-native content lab ]
SF · BJS

让世界因你生长

Alex · mouse · nociza · ZireVahn · 12 min 阅读

每天,人们都在跟各种各样的软件互动。

很久以前,我们教软件——文件名、密码、邮件地址、书签、桌面快捷方式。软件不会「学」,它只是把我们明确告诉它的东西原样收好,等我们回来取。

后来推荐系统出现,软件开始——我们看了什么、跳过了什么、停留多久、收藏了什么。它能从行为反推偏好,从一个固定的内容库里,把最合适的那份挑出来给你。

但这种学的成立是有前提的:内容是不动的。同一段视频、同一篇文章、同一首歌,对每个人都是同一个 item。学习的本质,是用一群相同的 item 把不同的用户对齐——你跟我看过一样的东西、有过一样的反应,我们就被认为口味相近。它实际上是用 item 来定义 user。

这套方法解决了一整代产品的问题。但当内容由模型实时生成时,前提塌了——

每一次对话都是一段独一无二、不可重放的轨迹。同一个用户、同一句话,模型这次给出的回应和下次都不是同一段。两个用户的「同一段对话」其实根本不是同一段。没有不变的 item,user 也就无法靠它被对齐。

那一整套用 item 定义 user 的范式,在这里失效了。

我们需要一种新的方式让软件认识人——不是通过他和别人共享了什么内容,而是通过他和这个系统之间,真正发生过的、独属于他的那段互动——

  • 我们告诉它我们的语气、我们思考的方式、我们想要的节奏;
  • 我们解释自己的背景,纠正它的措辞,告诉它这次想去哪里;
  • 我们希望它记得我们昨天说过的话、我们的口味、我们曾经搭过的设定。

我们教得很多。但它学得很浅。

不是模型不够聪明——是大多数系统从一开始就没打算「学习」。它们被设计成给所有人一个还不错的回答,而不是被设计成和你长期相处、慢慢变得不一样的对象。

但生成式系统显然不只能这样:它可以在和你的每一次对话里,真的去学、去适应、去因你而变;让它的世界因你生长。


我们想要解决的问题

要让一个系统在互动中真正生长,至少要重新回答几件事:

  1. 如何学习?
  2. 学习信号是什么?
  3. 这个系统长什么样?

我们把这些命题拆成四个方向:

1. 实时学习 (Real-time Learning)

从用户的即时交互中学习。

不再依赖一次集中、离线的训练周期,而是把每一次对话当成模型可以立刻吸收的信号——你的纠正、追问、转向、沉默都是。

2. 持久存储 (Persistent Memory)

学到的东西必须能被留下来,否则下一次对话又是一个新用户。我们同时探索两条互补的路径:

  • persona vector:将学习到的知识存在某个向量中并持久化,并且这个向量可以被条件化地注入到模型中。
  • memory file:以某种记忆的文本化表示。

3. 模型为中心的架构 (Model-Centric Architecture)

不再干预模型的决策,只是为它能更好地学习、理解用户提供环境,让用户对模型有最大的控制权,同时让模型有最大的学习自由度。

在大多数系统里,模型只是 pipeline 末端的一个组件——记忆、个性化、内容选择、界面逻辑都在它之外,由代码编排着模型。我们想要的是相反的关系:代码退到旁边,决策权交回给模型;用户保留对自己体验的最终控制。

4. 实时评估系统 (Online Evaluation)

不再是传统的 AB 评估或者离线 benchmark。为了模型能更好地在用户的交互中生长,我们必须实时地将用户交互转化为模型可学习的信号,即时地纠正和鼓励模型的行为。

离线 benchmark 告诉我们模型在群体上的好坏,但不会告诉模型,它刚才那一句话有没有真的接住

这一层缺口必须被补上。


为什么这件事重要

我们相信,下一代内容不会再是被挑选着推到你面前的——而是会在你与系统的互动中生长出来。

娱乐、陪伴、教育、创作工具——当系统真的开始学着和具体的人相处,这些体验都会被根本性地重塑。它面对的是一个具体的,而不是一段画像。

这件事不是来自一个更强的新模型,也不是来自更多的训练数据。它来自一个不一样的设计选择——让模型可以学,让它学到的东西能留下来,让整个系统围绕它生长,让反馈发生在每一次互动里。

实验室里的每一个研究方向,都是为了让这件事真的发生。我们的工作每天都在一个被真实用户使用的产品里被检验。

如果这件事,正好是那个你也停不下来想的问题——
来和我们一起做。

[ Next from the lab ]
Research · 25 May 2026

Online Autoresearch: Running Autoresearch with Real Online Feedback.

Position · 19 May 2026

What personalization means to us.