Wink Pings

UltraRAG:用低代码框架加速RAG系统开发

清华大学THUNLP实验室等团队推出的低代码RAG框架UltraRAG,通过MCP架构实现复杂流程的快速搭建与迭代。

![UltraRAG](https://github.com/OpenBMB/UltraRAG/raw/main/docs/ultrarag.svg)

当RAG系统从简单的检索-生成拼接进化到多轮推理、动态检索的复杂架构时,研究者们面临着一个新困境:算法创新总被工程实现拖后腿。最近开源的UltraRAG 2.0试图用MCP架构解决这个问题——用YAML文件声明循环和条件分支,比写Python脚本快得多。

这个框架把检索、生成等模块封装成标准化MCP Server,通过函数级Tool接口调用。最实用的设计是内置了17个主流Benchmark的评测流程,省去了研究者自己搭评测框架的时间。毕竟在学术界,能快速复现基线结果有时比算法本身还重要。

![架构图](https://github.com/OpenBMB/UltraRAG/raw/main/docs/architecture.png)

有意思的是,他们用Model Context Protocol(MCP)实现了模块间的松耦合。这意味着你可以把现成的检索Server直接插到新项目里,不用重写适配层代码。对于需要快速验证想法的科研场景,这种"热插拔"特性确实能省下不少时间。

安装过程意外地简洁,conda虚拟环境+uv包管理器就能跑起来。文档里特别标注了FAISS的GPU版本需要手动编译——这种细节提示比那些只会说"pip install"的教程实在多了。

目前框架已经支持从NQ、TriviaQA到HotpotQA等主流数据集,以及IRCoT、Search-o1等典型基线方法。不过wiki-2024语料库还显示"整理中",看来再好的框架也逃不过数据处理的脏活累活。

如果你受够了在RAG项目里反复造轮子,这个工具至少值得放进备选清单。毕竟在算法迭代越来越快的当下,能省下工程时间就是最大的竞争力。

发布时间: 2025-09-07 03:47