创建知识库 - LangChat Pro

RAG 系统架构
文档处理能力
支持的文档类型
处理流程
创建知识库
前置配置要求
1. 对象存储服务 (OSS)
2. 向量数据库
3. 向量模型 (Embedding)
4. 重排序模型 (Rerank) - 可选
检索配置
核心参数说明
召回数量 (Top-K)
相似度阈值 (Score Threshold)
RAG 检索流程
参数调优建议

知识库是 RAG（检索增强生成）系统的核心组件，负责将非结构化文档转换为可检索的向量表示，为 AI 模型提供准确的上下文信息。

RAG 系统架构

知识库在 RAG 系统中承担文档存储与检索的关键角色：

文档处理能力

LangChat Pro 知识库支持多种文档格式的智能解析：

支持的文档类型

文档类型	处理方式	输出格式
Office 文档	Word、PowerPoint、Excel	结构化文本
PDF 文档	文本提取 + OCR	纯文本
图片文件	PaddleOCR 识别	文本内容
Excel 表格	结构化解析	Table 格式文本
纯文本	直接处理	原始文本

处理流程

创建知识库

在 LangChat Pro 的「知识库」页面统一管理所有知识库资源：

前置配置要求

创建知识库前需完成以下基础设施配置：

1. 对象存储服务 (OSS)

用途：存储原始文档文件
要求：必须配置 OSS 服务用于文件上传
配置路径：AI 配置 -> 文件存储配置

2. 向量数据库

用途：存储文档向量表示
支持类型：Redis、PgVector、Milvus、Elasticsearch
配置路径：AI 配置 -> 模型配置 -> 向量数据库

3. 向量模型 (Embedding)

用途：将文本转换为高维向量
要求：已配置 Embedding 模型
配置路径：AI 配置 -> 模型配置 -> 向量模型

4. 重排序模型 (Rerank) - 可选

用途：对检索结果进行二次排序
优势：提升检索精度
配置路径：AI 配置 -> 模型配置 -> 重排序模型

检索配置

完成基础配置后，可调整检索参数以优化 RAG 性能：

核心参数说明

召回数量 (Top-K)

定义：从向量数据库返回的相关文档片段数量
范围：通常设置为 5-20
影响：
- 数值过小：可能遗漏相关信息
- 数值过大：增加计算成本，可能引入噪声

相似度阈值 (Score Threshold)

定义：文档片段与查询的最小相似度分数
范围：0.0 - 1.0
影响：
- 阈值过高：检索结果过少，可能无法回答问题
- 阈值过低：检索结果过多，可能包含不相关信息

RAG 检索流程

参数调优建议

场景	Top-K	阈值	说明
精确问答	5-10	0.7-0.8	高精度，少噪声
开放对话	10-15	0.6-0.7	平衡精度与覆盖
探索性查询	15-20	0.5-0.6	更多信息，容忍噪声

参数调优需要根据实际业务场景和文档特点进行测试优化，建议从默认值开始逐步调整。

数据监控 RAG向量维度概念