Skip to main content
图片识别节点是LangChat Pro工作流中的模型节点,利用视觉模型识别图片内容,将识别结果作为变量传递给下游节点。

节点特性

图片识别节点属于工具型处理节点,其核心特性是执行图片内容识别操作并将结果封装为上下文变量,而非直接输出给用户。

工具节点 vs 输出节点

在LangChat Pro工作流中,节点按照输出特性分为两类: 输出节点(直接响应用户):
  • LLM大模型节点:支持流式输出
  • 直接回复节点:输出变量内容
工具节点(上下文变量传递):
  • 图片识别节点
  • 百度搜索节点
  • 知识库检索节点
  • 其他功能节点
工具型节点不会直接将内容输出给用户,必须通过直接回复节点引用其输出变量才能向用户展示结果。

执行场景对比

图片识别节点

图片识别节点基于视觉AI模型,提供强大的图片内容识别和理解能力。

配置参数

输入参数

视觉模型
  • 选择用于图片识别的AI模型
  • 支持多种视觉模型选择
  • 通过模型选择器配置
  • 影响识别的准确性和效果
文档链接
  • 支持动态引用流程上下文变量
  • 支持静态图片链接输入
  • 支持变量和链接的混合输入
  • 通过智能变量选择器配置
  • 默认引用系统文件变量:{{#sys.files#}}
提示词
  • 视觉模型的系统提示词
  • 用于指导AI识别方向
  • 支持多行文本输入
  • 影响识别的重点和风格
流式输出控制
  • 开启:直接流式输出给用户
  • 关闭:输出变量供下游节点使用
  • 影响图片识别的输出方式

输出变量

识别结果
  • 数据类型:TEXT文本格式
  • 内容:从图片中识别出的内容描述
  • 用途:供下游节点引用和处理

典型使用场景

场景一:简单图片识别

适用场景
  • 用户上传图片的内容识别
  • 简单的图片内容描述
  • 图片信息的自动提取

场景二:图片识别+AI分析

适用场景
  • 需要AI分析图片内容
  • 智能化的图片理解
  • 结合视觉和AI的图片处理

场景三:多图片批量识别

适用场景
  • 批量处理多张图片
  • 图片集合的内容分析
  • 大量图片的自动识别

场景四:特定场景图片识别

适用场景
  • 特定场景的图片识别
  • 专业化的图片分析
  • 定制化的视觉识别

场景五:图片内容验证

适用场景
  • 图片内容的质量验证
  • 智能化的图片处理
  • 条件化的图片识别
图片识别节点是工作流中视觉AI处理的重要工具,基于视觉AI模型提供强大的图片内容识别和理解能力。通过合理配置视觉模型、提示词和输出方式,可以实现高效的图片内容识别和分析。