Files
wiki_crawler/README.md
2025-12-29 11:30:59 +08:00

1.5 KiB
Raw Blame History

wiki_crawler

本仓库主要用于存放和更新dify中wiki_crawler的代码节点的代码

git config --local user.email "qinggang.deng@dxc.com"

节点返回值格式约定

节点返回值统一采用json格式包含以下字段

  • code状态码0失败1成功2警告
  • msg状态描述用于提示调用方
  • data返回数据json格式根据不同节点有不同的字段若失败则为null

节点输入输出设计

  • start启动节点
    • input
      • input
      • type: ['url''task_id'] # 根据输入类型对input进行处理
    • output
  • register注册节点涉及sql
    • input
      • url任务url
    • output
      • task_id任务id用于后续查询任务状态
      • is_new_task是否为新任务1表示是0表示否
  • pending_urls剩余待处理url涉及sql
    • input
      • task_id任务id
      • limit最多返回的url数量默认值为10
    • output
      • urls: 剩余待处理url列表
  • save_results保存处理结果涉及sql
    • input
      • task_id任务id
      • results任务结果列表用于存入数据库
    • output
      • completed已入库url列表
      • failed入库url列表
      • warnings入库警告列表
  • message消息节点前置一个变量聚合器不涉及sql操作
    • input
      • msgs各个节点的msg经过前置节点整合后统一输出
    • output
      • output整合消息之后输出给end
  • end结束节点
    • input
      • message节点整合的