Files
wiki_crawler/README.md

22 lines
1.0 KiB
Markdown
Raw Normal View History

2025-12-18 14:37:39 +08:00
# wiki_crawler
2025-12-30 16:19:58 +08:00
本仓库主要用于存放wiki_crawler的代码
核心依赖 `firecrawl` 和 阿里百炼 的api支持
完成wiki网页爬取和向量化与知识库查找
## 当前状况
1. 当前在我的电脑本地跑没部署看chenwei有没有空了教我往我们服务器上我自己买的学生服务器还没来得及放上去三月份到期
2. 这个demo后端只实现了功能没有auth相关的部分后续可以直接迁移chenwei那边gtco_ai开一个模块放进去
3. firecrawl的apikey我自己的免费试用apikey快用完了需要准备部署调查付费
4. 可演示但是还没有包装到可以向客户汇报的层次后续考虑直接用dify做一个工具包装集成到Done的bot里或者用chatflow直接包装里面用节点请求部署好的后端进行知识库查询
切割逻辑准确率定义归结资料测试设计mcp服务调用搜索逻辑问题分类流程架构设计场景假设
整理dify报错
包装mcp server