Firecrawl

免费+付费数据处理 › 爬虫与采集141k↑+227

AI 友好的网页抓取 API,支持 URL → Markdown/结构化数据,110K+ stars。专为 LLM 应用设计,自动处理 JS 渲染、分页、反爬,是 RAG 系统的理想数据源

🎯适用场景:网页自动化与数据采集

#爬虫#API#LLM数据源#Markdown

📥 收录于 2026/4/13

📊 仓库数据

Stars140,547
Forks8,079
语言TypeScript
上线2024/4/16
更新2026/6/29

📈 Stars 变化 6 小时 +227· 统计区间 6/28 18:12 → 6/29 00:15(6 小时)

优点

  • 专为 LLM 设计
  • 自动处理 JS 渲染
  • 反爬能力强
  • API 简单易用

⚠️ 限制

  • 免费额度有限
  • 大规模抓取需付费
  • 依赖外部服务

🔗 相关工具

MediaCrawler

开源54k+63

github.com/NanmiCoder/MediaCrawler

中文社交媒体爬虫工具,50K+ stars。支持小红书、抖音、快手、B 站、微博、贴吧、知乎等平台的笔记/视频/评论爬取,是中文互联网数据采集的标杆项目

🎯数据爬取与 ETL 处理

#爬虫#社交媒体#中文互联网#数据采集
语言Python
🍴 Forks11,033
🔄 更新2026/6/29
📥 收录2026/6/4

EasySpider

开源44k+1

github.com/NaiboWang/EasySpider

可视化无代码爬虫,43,797+ stars。零编程基础的网页数据采集工具,通过可视化界面设计爬虫流程,支持动态页面和 API 采集

🎯AI 辅助 UI/UX 设计与前端规范、网页自动化与数据采集

#爬虫#无代码#数据采集#可视化
语言JavaScript
🍴 Forks5,381
📅 上线2020/7/18
🔄 更新2026/6/28
📥 收录2026/4/20

OpenBB Platform

开源70k+11

github.com/openbb-finance/openbb

金融数据分析平台,66,139+ stars。开源金融数据基础设施,提供股票、加密货币、宏观经济等全方位数据查询和分析能力,支持 Python SDK 和终端使用

🎯金融数据采集与分析、股票与宏观数据查询

#金融数据#股票分析#Python#开源
语言Python
🍴 Forks7,062
📅 上线2020/12/20
🔄 更新2026/6/29
📥 收录2026/4/20

Scrapling

开源67k+87

github.com/D4Vinci/Scrapling

自适应 Web 爬取框架,52K+ stars。从单请求到全规模爬取全覆盖,智能处理反爬、动态渲染和复杂页面结构,是 AI Agent 数据采集的瑞士军刀

🎯AI Agent 数据采集、舆情分析数据源爬取、竞品监控自动化

#Web 爬取#自适应#反爬#数据采集
语言Python
🍴 Forks6,582
🔄 更新2026/6/29
📥 收录2026/5/22

TrendRadar

开源60k+11

github.com/sansan0/TrendRadar

AI 驱动的舆情监控与趋势分析助手,58K+ stars。支持多平台信息聚合、RSS 订阅、智能预警,帮助打破信息茧房,还原舆情全貌并预测未来走向,辅助决策

🎯AI 舆情监控、行业趋势分析与情报收集系统

#舆情分析#多平台聚合#RSS#智能预警+1
语言Python
🍴 Forks24,741
🔄 更新2026/6/28
📥 收录2026/5/22

Made With ML

开源48k+1

github.com/GokuMohandas/Made-With-ML

生产级 ML 开发教程,47,348+ stars。从数据处理到模型部署的完整 ML 开发课程,涵盖 MLOps、模型监控、CI/CD 等生产环境最佳实践

🎯AI 技术学习与实践教程、数据采集与 ETL 处理

#ML 教程#MLOps#生产实践#最佳实践
语言Jupyter Notebook
🍴 Forks7,620
📅 上线2018/11/5
🔄 更新2026/6/28
📥 收录2026/4/20