Files
wiki_crawler/README.md

50 lines
1.5 KiB
Markdown
Raw Normal View History

2025-12-18 14:37:39 +08:00
# wiki_crawler
2025-12-19 00:52:32 +08:00
本仓库主要用于存放和更新dify中wiki_crawler的代码节点的代码
2025-12-20 17:08:54 +08:00
2025-12-29 11:30:59 +08:00
`git config --local user.email "qinggang.deng@dxc.com"`
2025-12-19 00:52:32 +08:00
## 节点返回值格式约定
2025-12-20 17:08:54 +08:00
2025-12-19 00:52:32 +08:00
节点返回值统一采用json格式包含以下字段
2025-12-20 17:08:54 +08:00
2025-12-19 00:52:32 +08:00
- code状态码0失败1成功2警告
- msg状态描述用于提示调用方
- data返回数据json格式根据不同节点有不同的字段若失败则为null
## 节点输入输出设计
2025-12-20 17:08:54 +08:00
2025-12-19 00:52:32 +08:00
- start启动节点
- input
- input
- type: ['url''task_id'] # 根据输入类型对input进行处理
- output
2025-12-20 17:08:54 +08:00
- register注册节点涉及sql
2025-12-19 00:52:32 +08:00
- input
- url任务url
- output
- task_id任务id用于后续查询任务状态
- is_new_task是否为新任务1表示是0表示否
2025-12-20 17:08:54 +08:00
- pending_urls剩余待处理url涉及sql
2025-12-19 00:52:32 +08:00
- input
- task_id任务id
- limit最多返回的url数量默认值为10
- output
2025-12-20 17:08:54 +08:00
- urls: 剩余待处理url列表
- save_results保存处理结果涉及sql
2025-12-19 00:52:32 +08:00
- input
- task_id任务id
- results任务结果列表用于存入数据库
- output
- completed已入库url列表
2025-12-20 17:08:54 +08:00
- failed入库url列表
- warnings入库警告列表
- message消息节点前置一个变量聚合器不涉及sql操作
- input
- msgs各个节点的msg经过前置节点整合后统一输出
- output
- output整合消息之后输出给end
- end结束节点
- input
- message节点整合的