Skip to main content
网页解析节点是LangChat Pro工作流中的工具型节点,解析网页链接,返回清洗后网页的文本内容(此节点不包含网页爬虫),将解析结果作为变量传递给下游节点。

节点特性

网页解析节点属于工具型处理节点,其核心特性是执行网页内容解析操作并将结果封装为上下文变量,而非直接输出给用户。 link-parse-node 注意此节点不会爬取网页内容,仅仅是返回将HTML内容清除TAG后的文本内容。

工具节点 vs 输出节点

在LangChat Pro工作流中,节点按照输出特性分为两类: 输出节点(直接响应用户):
  • LLM大模型节点:支持流式输出
  • 直接回复节点:输出变量内容
工具节点(上下文变量传递):
  • 网页解析节点
  • 百度搜索节点
  • 知识库检索节点
  • 其他功能节点
工具型节点不会直接将内容输出给用户,必须通过直接回复节点引用其输出变量才能向用户展示结果。

执行场景对比

网页解析节点

网页解析节点专门用于解析网页链接,提供网页内容的清洗和文本提取能力。

配置参数

输入参数

网页链接
  • 支持动态引用流程上下文变量
  • 支持静态网页链接输入
  • 支持变量和链接的混合输入
  • 通过智能变量选择器配置
  • 待解析的网页链接地址

解析特性

网页内容清洗
  • 自动移除HTML标签
  • 清理广告和无关内容
  • 保留核心文本内容
  • 格式化文本结构
支持的网页类型
  • 新闻网站
  • 博客文章
  • 技术文档
  • 产品页面
  • 其他公开网页
注意事项
  • 不包含网页爬虫功能
  • 仅解析可公开访问的网页
  • 需要网页支持内容提取

输出变量

网页解析结果
  • 数据类型:TEXT文本格式
  • 内容:清洗后的网页文本内容
  • 用途:供下游节点引用和处理

典型使用场景

场景一:简单网页解析

适用场景
  • 用户提供网页链接的内容解析
  • 简单的网页内容展示
  • 网页信息的自动提取

场景二:网页+AI分析

适用场景
  • 需要AI分析网页内容
  • 智能化的网页处理
  • 结合网页和AI的内容分析

场景三:多网页对比分析

适用场景
  • 多网页的内容对比
  • 网页差异分析
  • 批量网页处理

场景四:网页内容提取

适用场景
  • 从结构化网页中提取特定信息
  • 网页数据的格式化处理
  • 关键信息的自动提取

场景五:网页内容存储

适用场景
  • 网页内容的数据库存储
  • 网页信息的持久化
  • 网页管理系统的集成
网页解析节点是工作流中网页处理的重要工具,专门用于解析网页链接并提取文本内容。通过智能的网页内容清洗算法,可以自动移除HTML标签和无关内容,保留核心文本信息,为后续的AI分析、数据存储等操作提供清洁的文本数据。