Polars

开源数据处理39k↑+5

极速 DataFrame 库,38K+ stars。Rust 编写的高性能数据处理引擎,支持懒执行、流式处理和多线程并行,比 pandas 快数倍,是 AI 数据预处理和 ETL 的理想工具。

🎯适用场景:大规模数据集的预处理和特征工程

#DataFrame#Rust#高性能#数据处理

📥 收录于 2026/5/29

📊 仓库数据

Stars38,541
Forks2,836
语言Rust
更新2026/5/20

📈 上次抓取以来 ↑+5

优点

  • Rust 内核性能远超 pandas
  • 支持懒执行和流式处理
  • Python/Rust/Node.js 多语言绑定

⚠️ 限制

  • API 与 pandas 不同需要学习成本
  • 部分生态工具链不如 pandas 成熟

🔗 相关工具

TradingAgents

开源80k↑+61

github.com/TauricResearch/TradingAgents

多 Agent 金融交易框架,51,885+ stars。基于多 Agent 协作的金融交易决策框架,模拟分析师、风控师、交易员等角色协同制定交易策略

🎯多 Agent 金融交易决策、策略回测与量化投资研究

#金融交易#多Agent#量化投资#决策框架
语言Python
🍴 Forks15,649
📅 上线2024/12/28
🔄 更新2026/5/28
📥 收录2026/4/20

OpenBB Platform

开源68k↑+9

github.com/openbb-finance/openbb

金融数据分析平台,66,139+ stars。开源金融数据基础设施,提供股票、加密货币、宏观经济等全方位数据查询和分析能力,支持 Python SDK 和终端使用

🎯金融数据采集与分析、股票与宏观数据查询

#金融数据#股票分析#Python#开源
语言Python
🍴 Forks6,857
📅 上线2020/12/20
🔄 更新2026/5/28
📥 收录2026/4/20

Crawl4AI

开源67k↑+144

github.com/unclecode/crawl4ai

面向 AI Agent 的开源 Web 爬取框架,支持网页爬虫、Markdown 生成、JavaScript 执行和 LLM 结构化提取。为 Agent 提供可靠的 Web 数据获取能力,支持异步爬取、智能去重和内容清洗,是构建 RAG 系统和 Agent 知识库的关键基础设施

🎯企业知识库问答与 RAG 检索、网页自动化与数据采集

#开源#Web 爬取#Agent 基础设施#Markdown
语言Python
🍴 Forks6,845
📅 上线2024/5/9
🔄 更新2026/5/28
📥 收录2026/4/15

TrendRadar

开源59k↑+20

github.com/sansan0/TrendRadar

AI 驱动的舆情监控与趋势分析助手,58K+ stars。支持多平台信息聚合、RSS 订阅、智能预警,帮助打破信息茧房,还原舆情全貌并预测未来走向,辅助决策

🎯AI 舆情监控、行业趋势分析与情报收集系统

#舆情分析#多平台聚合#RSS#智能预警+1
语言Python
🍴 Forks24,457
🔄 更新2026/5/28
📥 收录2026/5/22

Scrapling

开源55k↑+31

github.com/D4Vinci/Scrapling

自适应 Web 爬取框架,52K+ stars。从单请求到全规模爬取全覆盖,智能处理反爬、动态渲染和复杂页面结构,是 AI Agent 数据采集的瑞士军刀

🎯AI Agent 数据采集、舆情分析数据源爬取、竞品监控自动化

#Web 爬取#自适应#反爬#数据采集
语言Python
🍴 Forks5,259
🔄 更新2026/5/28
📥 收录2026/5/22

EasySpider

开源44k1

github.com/NaiboWang/EasySpider

可视化无代码爬虫,43,797+ stars。零编程基础的网页数据采集工具,通过可视化界面设计爬虫流程,支持动态页面和 API 采集

🎯AI 辅助 UI/UX 设计与前端规范、网页自动化与数据采集

#爬虫#无代码#数据采集#可视化
语言JavaScript
🍴 Forks5,334
📅 上线2020/7/18
🔄 更新2026/5/28
📥 收录2026/4/20