Cryanskl

Getting Started with Graphrag

1.回顾RAG RAG分为构建检索阶段和生成阶段. 在构建索引阶段, 我们把结构化的数据转化大模型能识别的向量格式进行存储, 能借助向量数据库高效模糊匹配检索的方式, 非常快速的在庞大的chunk群中检索出最相关的. 在query阶段, 通过用户的问题, 检索出相关的块, 填充prompt最后生成最终的回复.例如让大模型基于检索出来的文本块中的既定事实来回答用户的问题. 2.传统...

Deploying a Static Website on Alibaba Cloud Oss Without Using Cdn

1. 起因 之前遇到一个问题:使用 GitHub Actions 自动部署博客时频繁失败。后来发现,将静态网站直接发布到阿里云 OSS(对象存储服务)是一种更简单、稳定的方式,而且能有效避免格式错乱的问题。 至于取消 CDN 的原因,主要是出于成本考虑。由于博客访问量较小,使用 CDN 每天需要支付两三元,一个月下来大约七八十元,性价比不高,因此选择直接使用 OSS 提供的公网地址访问页...

How to Improve Rag Quality

1. 数据准备阶段 在基于文档的 LLM 应用中,数据准备往往是影响最终效果的关键环节。本节将探讨数据准备过程中常见的问题,并介绍构建完整数据流程的建议方案。 常见问题 数据质量低:非结构化文档(如 PDF、网页快照)可能包含大量敏感、过时、冗余或矛盾的信息,甚至存在事实性错误,直接用于训练或问答可能导致模型输出不可靠内容。 多模态信息处理困难:PDF 文档常包含图片、配色、...

Rag Foundations and Applications

1. 应用开发 在使用大语言模型进行应用开发时,模型偶尔会生成错误的回答(即产生“幻觉”)。 常见的解决方案包括: Prompt 编写不当:设计更具引导性和明确性的提示词可以有效减少模型误判。 缺乏背景知识:模型并非实时联网,缺乏最新或领域特定的信息,此时可采用 RAG(Retrieval-Augmented Generation)方法补充外部知识。 模型能力不足:针对特...

© cryanskl. Some rights reserved.

本页浏览 2476 次 | 总访问量 13481

Using the Chirpy theme for Jekyll.