Skip to main content
OCR解析节点是LangChat Pro工作流中的AI工具节点,提供图像文字识别能力,利用PaddleOCR高精度模型识别图片中的文字内容。

节点特性

OCR解析节点属于工具型处理节点,其核心特性是执行图像文字识别操作并将结果封装为上下文变量,而非直接输出给用户。

工具节点 vs 输出节点

在LangChat Pro工作流中,节点按照输出特性分为两类: 输出节点(直接响应用户):
  • LLM大模型节点:支持流式输出
  • 直接回复节点:输出变量内容
工具节点(上下文变量传递):
  • OCR解析节点
  • 百度搜索节点
  • 知识库检索节点
  • 其他功能节点
工具型节点不会直接将内容输出给用户,必须通过直接回复节点引用其输出变量才能向用户展示结果。

执行场景对比

OCR解析节点

OCR解析节点基于PaddleOCR高精度模型,提供强大的图像文字识别能力,支持多种图片格式和语言文字。

配置参数

输入参数

输入内容
  • 支持动态引用流程上下文变量
  • 支持静态图片链接输入
  • 支持变量和链接的混合输入
  • 通过智能变量选择器配置
  • 默认引用系统文件变量:{{#sys.files#}}

输出变量

识别结果
  • 数据类型:TEXT文本格式
  • 内容:从图片中识别出的文字内容
  • 用途:供下游节点引用和处理

典型使用场景

场景一:简单图片文字识别

适用场景
  • 用户上传图片,识别其中文字
  • 简单的图片文字提取
  • 文档数字化处理

场景二:OCR+AI处理

适用场景
  • 需要AI分析识别出的文字
  • 结合OCR和AI推理
  • 智能化的图片内容理解

场景三:多图片批量处理

适用场景
  • 批量处理多张图片
  • 文档扫描件处理
  • 大量图片的文字提取

场景四:证件信息提取

适用场景
  • 身份证、驾驶证等证件信息提取
  • 结构化数据提取
  • 自动化表单填写

场景五:手写文字识别

适用场景
  • 手写文字识别和纠错
  • 笔记数字化
  • 手写文档处理
OCR解析节点是工作流中图像文字识别的重要工具,基于PaddleOCR高精度模型,支持多种图片格式和语言文字。通过合理配置输入参数,可以实现高效的图片文字提取和处理。