Skip to main content
知识库文档处理涉及文档拆分、向量化等计算密集型异步任务,执行日志提供完整的任务状态监控和问题诊断能力。

任务队列监控

知识库处理采用异步任务队列模式,支持大规模文档的并发处理: image-20250926104926975

任务状态统计

状态描述处理方式
总任务任务队列中的任务总数实时统计
运行中正在执行的任务数量并发处理
已完成成功完成的任务数量正常结束
失败执行失败的任务数量需要排查

任务进度监控

任务进度以百分比形式显示处理完成度,帮助评估剩余处理时间。

异步任务类型

文档处理任务

任务执行流程

  1. 文档解析:提取文档内容和结构
  2. 文本分段:按配置策略分割文档
  3. 向量化处理:生成文档向量表示
  4. 索引构建:构建检索索引
  5. 状态更新:更新任务执行状态

任务状态管理

状态持久化

  • 存储位置:Redis 缓存系统
  • 保存期限:默认 24 小时
  • 自动清理:超期任务自动清除
  • 状态同步:实时更新任务状态

状态异常处理

长时间显示”执行失败”或”进行中”状态可能由以下原因导致:
  • 服务异常中断
  • 网络连接问题
  • 资源不足
  • 配置错误

常见问题排查

问题类型可能原因解决方案
任务卡死服务中断、资源不足重启服务、检查资源
解析失败文档格式不支持、文件损坏检查文档格式、重新上传
向量化失败模型服务异常、配置错误检查模型配置、验证服务
索引构建失败数据库连接问题、权限不足检查数据库连接、验证权限

监控最佳实践

实时监控

  • 任务队列长度:监控队列积压情况
  • 处理速度:跟踪任务处理效率
  • 错误率:统计任务失败比例
  • 资源使用:监控 CPU、内存使用情况

告警配置

日志分析

  • 错误日志:记录详细的错误信息
  • 性能日志:跟踪任务执行时间
  • 统计报表:生成任务执行统计
  • 趋势分析:分析任务处理趋势
建议定期清理过期的任务日志,避免占用过多存储空间。同时建立完善的监控告警机制,及时发现和处理异常情况。