OCR解析节点是LangChat Pro工作流中的AI工具节点,提供图像文字识别能力,利用PaddleOCR高精度模型识别图片中的文字内容。
节点特性
OCR解析节点属于工具型处理节点,其核心特性是执行图像文字识别操作并将结果封装为上下文变量,而非直接输出给用户。工具节点 vs 输出节点
在LangChat Pro工作流中,节点按照输出特性分为两类: 输出节点(直接响应用户):- LLM大模型节点:支持流式输出
- 直接回复节点:输出变量内容
- OCR解析节点
- 百度搜索节点
- 知识库检索节点
- 其他功能节点
执行场景对比
OCR解析节点
OCR解析节点基于PaddleOCR高精度模型,提供强大的图像文字识别能力,支持多种图片格式和语言文字。配置参数
输入参数
输入内容:- 支持动态引用流程上下文变量
- 支持静态图片链接输入
- 支持变量和链接的混合输入
- 通过智能变量选择器配置
- 默认引用系统文件变量:
{{#sys.files#}}
输出变量
识别结果:- 数据类型:TEXT文本格式
- 内容:从图片中识别出的文字内容
- 用途:供下游节点引用和处理
典型使用场景
场景一:简单图片文字识别
适用场景:- 用户上传图片,识别其中文字
- 简单的图片文字提取
- 文档数字化处理
场景二:OCR+AI处理
适用场景:- 需要AI分析识别出的文字
- 结合OCR和AI推理
- 智能化的图片内容理解
场景三:多图片批量处理
适用场景:- 批量处理多张图片
- 文档扫描件处理
- 大量图片的文字提取
场景四:证件信息提取
适用场景:- 身份证、驾驶证等证件信息提取
- 结构化数据提取
- 自动化表单填写
场景五:手写文字识别
适用场景:- 手写文字识别和纠错
- 笔记数字化
- 手写文档处理
OCR解析节点是工作流中图像文字识别的重要工具,基于PaddleOCR高精度模型,支持多种图片格式和语言文字。通过合理配置输入参数,可以实现高效的图片文字提取和处理。

