Skip to main content
知识库是 RAG(检索增强生成)系统的核心组件,负责将非结构化文档转换为可检索的向量表示,为 AI 模型提供准确的上下文信息。

RAG 系统架构

知识库在 RAG 系统中承担文档存储与检索的关键角色:

文档处理能力

LangChat Pro 知识库支持多种文档格式的智能解析:

支持的文档类型

文档类型处理方式输出格式
Office 文档Word、PowerPoint、Excel结构化文本
PDF 文档文本提取 + OCR纯文本
图片文件PaddleOCR 识别文本内容
Excel 表格结构化解析Table 格式文本
纯文本直接处理原始文本

处理流程

创建知识库

在 LangChat Pro 的「知识库」页面统一管理所有知识库资源: image-20250925175611334

前置配置要求

创建知识库前需完成以下基础设施配置:

1. 对象存储服务 (OSS)

  • 用途:存储原始文档文件
  • 要求:必须配置 OSS 服务用于文件上传
  • 配置路径:AI 配置 -> 文件存储配置

2. 向量数据库

  • 用途:存储文档向量表示
  • 支持类型:Redis、PgVector、Milvus、Elasticsearch
  • 配置路径:AI 配置 -> 模型配置 -> 向量数据库

3. 向量模型 (Embedding)

  • 用途:将文本转换为高维向量
  • 要求:已配置 Embedding 模型
  • 配置路径:AI 配置 -> 模型配置 -> 向量模型

4. 重排序模型 (Rerank) - 可选

  • 用途:对检索结果进行二次排序
  • 优势:提升检索精度
  • 配置路径:AI 配置 -> 模型配置 -> 重排序模型
image-20250925180002912

检索配置

完成基础配置后,可调整检索参数以优化 RAG 性能: image-20250925180148860

核心参数说明

召回数量 (Top-K)

  • 定义:从向量数据库返回的相关文档片段数量
  • 范围:通常设置为 5-20
  • 影响
    • 数值过小:可能遗漏相关信息
    • 数值过大:增加计算成本,可能引入噪声

相似度阈值 (Score Threshold)

  • 定义:文档片段与查询的最小相似度分数
  • 范围:0.0 - 1.0
  • 影响
    • 阈值过高:检索结果过少,可能无法回答问题
    • 阈值过低:检索结果过多,可能包含不相关信息

RAG 检索流程

参数调优建议

场景Top-K阈值说明
精确问答5-100.7-0.8高精度,少噪声
开放对话10-150.6-0.7平衡精度与覆盖
探索性查询15-200.5-0.6更多信息,容忍噪声
参数调优需要根据实际业务场景和文档特点进行测试优化,建议从默认值开始逐步调整。