Wink - AI原生创新，忠于用户，专属智能体验

![GitHub仓库截图显示RLM项目页面，右上角有戴着圣诞帽的皮卡丘图标](https://wink.run/image?url=https%3A%2F%2Fpbs.twimg.com%2Fcard_img%2F2010762981508788224%2FSF7259Qg%3Fformat%3Djpg%26name%3Dlarge)

当语言模型遇到超出上下文长度的任务时，传统做法往往是截断或分块处理。但Meta PyTorch团队和开发者Sergio Paniego最近在OpenEnv中集成的RLM（递归语言模型）库，提供了一种更优雅的解决方案。

## 什么是递归语言模型？

RLM的核心思想很简单：让语言模型学会像程序员一样思考。它不再是一次性处理整个提示词，而是将上下文作为变量放入REPL环境中，让模型能够交互式地检查、分解并递归调用自身来处理输入。

想象一下，你让模型计算前100个2的幂次方。传统模型可能会因为输出长度超出限制而失败，但RLM可以编写一个循环程序来逐步生成结果。

## 即插即用的设计

这个开源库最实用的特点是其模块化架构。开发者可以轻松切换不同的后端模型（OpenAI、本地LLM等）和运行环境。

目前支持三种沙盒环境：

- **本地环境**：在主机进程上运行，适合低风险任务和快速测试

- **Docker环境**：使用容器提供一定程度的隔离

- **云端沙盒**：如Prime Sandboxes和Modal Sandboxes，提供完全隔离的执行环境

## 快速上手

安装过程很直接：

```bash

curl -LsSf https://astral.sh/uv/install.sh | sh

uv init && uv venv --python 3.12

uv pip install -e .

```

然后只需几行代码就能体验RLM的能力：

```python

from rlm import RLM

rlm = RLM(

backend="openai",

backend_kwargs={"model_name": "gpt-5-nano"},

verbose=True

)

result = rlm.completion("打印前100个2的幂次方，每行一个")

print(result.response)

```

## 实际价值

有开发者指出，这种递归推理模式特别适合处理长文档分析、复杂数学问题和多步骤编程任务。传统模型在处理这类任务时往往"记忆力有限"，而RLM通过程序化分解让模型能够处理近乎无限长度的上下文。

仓库目前已经获得954颗星和158次fork，显示社区对这种新推理范式的兴趣。项目采用MIT许可证，鼓励开源贡献。

对于想要深入理解技术细节的用户，团队提供了完整的[论文](https://arxiv.org/abs/2512.24601)和[技术博客](https://alexzhang13.github.io/blog/2025/rlm/)。而对于只想快速集成的开发者，简洁的API设计让集成变得相当直接。

这种将语言模型转化为可编程推理引擎的思路，可能会改变我们构建AI应用的方式——从单纯的文本生成转向更结构化的问题解决。

Wink Pings

递归语言模型RLM：让AI学会自我迭代的推理库