RAG #
RAG (Retrieval-Augmented Generation
) 框架:
是一种结合才信息检索 Retrieval
和生成 Generation
的语言模型架构。
可以动态地从外部知识源检索信息,使用检索到的数据作为参考来组织答案。来提高模型在回答复杂问题时的准确性和深度。
RAG 工作过程分两个阶段:
- 知识构建阶段
- 文本分片清洗、文本向量化、存入向量数据库
- 检索应用阶段
- 用户输入查询、 用户问题向量化、向量检索、排序、生成答案
如果给大模型喂企业私有数据,做模型微调,也能实现同样的效果,为什么还要用 RAG 呢,我认为还要看场景:
- 私有数据存在一定频率的动态更新的;
- 需要给出引用原文的;
- 硬件资源(GPU)不是太充足的(即使用 RAG 也需要微调,但一次微调处处可用,远比每个企业私有库微调一个模型成本低的多);
叶王 © 2013-2024 版权所有。如果本文档对你有所帮助,可以请作者喝饮料。