Crawl4AI
面向 AI Agent 的开源 Web 爬取框架,支持网页爬虫、Markdown 生成、JavaScript 执行和 LLM 结构化提取。为 Agent 提供可靠的 Web 数据获取能力,支持异步爬取、智能去重和内容清洗,是构建 RAG 系统和 Agent 知识库的关键基础设施
🎯适用场景:AI 数据采集、RAG 知识库构建、网页内容结构化提取
📊 仓库数据
📈 上次抓取以来 ↑+37 ⭐
✅ 优点
- •专为 AI Agent 设计
- •支持 JS 渲染和动态内容
- •Markdown 输出适配 LLM
- •异步高性能爬取
⚠️ 限制
- •相对较新,稳定性待验证
- •大规模爬取需自行优化
- •反爬对抗能力有限
- •文档和示例较少
🔗 相关工具
OpenBB Platform
开源⭐ 67k↑+47github.com/openbb-finance/openbb
金融数据分析平台,66,139+ stars。开源金融数据基础设施,提供股票、加密货币、宏观经济等全方位数据查询和分析能力,支持 Python SDK 和终端使用
🎯 金融数据分析、量化投资研究、市场数据监控
TradingAgents
开源⭐ 53k↑+317github.com/TauricResearch/TradingAgents
多 Agent 金融交易框架,51,885+ stars。基于多 Agent 协作的金融交易决策框架,模拟分析师、风控师、交易员等角色协同制定交易策略
🎯 量化交易策略研究、投资决策辅助、金融 AI 教学
EasySpider
开源⭐ 44k↑+3github.com/NaiboWang/EasySpider
可视化无代码爬虫,43,797+ stars。零编程基础的网页数据采集工具,通过可视化界面设计爬虫流程,支持动态页面和 API 采集
🎯 网页数据采集、竞品监控、价格跟踪、内容聚合
Qlib
开源⭐ 41k↑+34github.com/microsoft/qlib
AI 量化投资平台,41,008+ stars。微软开源的 AI 量化投资研究平台,提供从数据处理、模型训练到回测的完整量化投资工作流
🎯 量化策略研究、AI 选股、投资组合优化、金融数据分析
MindsDB
开源⭐ 39k↑+10github.com/mindsdb/mindsdb
AI 分析查询引擎,39,018+ stars。将 AI/ML 能力直接嵌入数据库,通过 SQL 即可进行预测分析和智能查询,支持多种数据源和 AI 模型集成
🎯 数据库智能分析、预测建模、AI 增强查询
Posthog
免费⭐ 34kgithub.com/posthog/posthog
🦔 PostHog is an all-in-one developer platform for building successful products....