网页解析节点是LangChat Pro工作流中的工具型节点,解析网页链接,返回清洗后网页的文本内容(此节点不包含网页爬虫),将解析结果作为变量传递给下游节点。
节点特性
网页解析节点属于工具型处理节点,其核心特性是执行网页内容解析操作并将结果封装为上下文变量,而非直接输出给用户。
注意此节点不会爬取网页内容,仅仅是返回将HTML内容清除TAG后的文本内容。
工具节点 vs 输出节点
在LangChat Pro工作流中,节点按照输出特性分为两类: 输出节点(直接响应用户):- LLM大模型节点:支持流式输出
- 直接回复节点:输出变量内容
- 网页解析节点
- 百度搜索节点
- 知识库检索节点
- 其他功能节点
执行场景对比
网页解析节点
网页解析节点专门用于解析网页链接,提供网页内容的清洗和文本提取能力。配置参数
输入参数
网页链接:- 支持动态引用流程上下文变量
- 支持静态网页链接输入
- 支持变量和链接的混合输入
- 通过智能变量选择器配置
- 待解析的网页链接地址
解析特性
网页内容清洗:- 自动移除HTML标签
- 清理广告和无关内容
- 保留核心文本内容
- 格式化文本结构
- 新闻网站
- 博客文章
- 技术文档
- 产品页面
- 其他公开网页
- 不包含网页爬虫功能
- 仅解析可公开访问的网页
- 需要网页支持内容提取
输出变量
网页解析结果:- 数据类型:TEXT文本格式
- 内容:清洗后的网页文本内容
- 用途:供下游节点引用和处理
典型使用场景
场景一:简单网页解析
适用场景:- 用户提供网页链接的内容解析
- 简单的网页内容展示
- 网页信息的自动提取
场景二:网页+AI分析
适用场景:- 需要AI分析网页内容
- 智能化的网页处理
- 结合网页和AI的内容分析
场景三:多网页对比分析
适用场景:- 多网页的内容对比
- 网页差异分析
- 批量网页处理
场景四:网页内容提取
适用场景:- 从结构化网页中提取特定信息
- 网页数据的格式化处理
- 关键信息的自动提取
场景五:网页内容存储
适用场景:- 网页内容的数据库存储
- 网页信息的持久化
- 网页管理系统的集成
网页解析节点是工作流中网页处理的重要工具,专门用于解析网页链接并提取文本内容。通过智能的网页内容清洗算法,可以自动移除HTML标签和无关内容,保留核心文本信息,为后续的AI分析、数据存储等操作提供清洁的文本数据。

