Rag Foundations and Applications

Posted Nov 4, 2024 Updated Jun 29, 2025

By cryanskl

4 min read

1. 应用开发

在使用大语言模型进行应用开发时，模型偶尔会生成错误的回答（即产生“幻觉”）。

常见的解决方案包括：

Prompt 编写不当：设计更具引导性和明确性的提示词可以有效减少模型误判。
缺乏背景知识：模型并非实时联网，缺乏最新或领域特定的信息，此时可采用 RAG（Retrieval-Augmented Generation）方法补充外部知识。
模型能力不足：针对特定任务，预训练模型可能无法胜任，此时可通过微调增强其能力。

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索与文本生成的技术框架。它通过实时检索与用户查询相关的外部知识文档，并将检索结果作为上下文输入给生成模型，以提升生成内容的准确性、时效性与可解释性。

简而言之，RAG 就像是在问答过程中“实时联网”，为生成提供参考依据。

此阶段通常在系统初始化时完成，可定期增量更新。

📌 注意：RAG 实际上重构了一个更具上下文支持的 Prompt，通过检索增强模型的推理基础。

客户的query会从indexing(向量数据库)进行检索, 检索的文档会加上上下文中. llm会基于新上下文进行生成

零代码: Dify, Coze

部署: LangChain, LlamaIndex

LLM

llm rag

This post is licensed under CC BY 4.0 by the author.