Cactus

开源LLM 运行时5.3k

面向移动设备和可穿戴设备的低延迟 AI 推理引擎。支持 Android 和 iOS,采用 ARM 优化和低延迟设计。5.3K+ stars,是移动端 LLM 推理的新选择

🎯适用场景:移动端 AI 应用、可穿戴设备智能交互、低延迟边缘推理

#移动端#低延迟#可穿戴设备#ARM 优化#边缘推理

📥 收录于 2026/6/2

📊 仓库数据

Stars5,269
Forks418
语言C
协议NOASSERTION
更新2026/6/1

优点

  • 专为移动设备优化延迟极低
  • 支持 Android 和 iOS
  • ARM 架构性能优异
  • 适合可穿戴设备

⚠️ 限制

  • 许可声明不够清晰
  • 生态和社区较小
  • 功能相对 Ollama 有限

🔗 相关工具

ExecuTorch

开源4.7k↑+1

github.com/pytorch/executorch

PyTorch 端侧 AI 推理引擎,4.6K+ stars。覆盖移动设备、嵌入式和边缘端的 PyTorch 端侧推理方案,支持模型量化、编译和优化部署

🎯将 PyTorch 模型编译部署到手机与嵌入式设备的端侧推理

#端侧 AI#PyTorch#嵌入式#移动端
语言Python
🍴 Forks1,014
🔄 更新2026/6/1
📥 收录2026/5/27

Ollama

开源173k↑+24

github.com/ollama/ollama

本地运行开源大语言模型的最简方案,支持 Llama、Qwen、DeepSeek 等主流模型,一键安装、自动下载模型、提供 OpenAI 兼容 API,是 AI 开发者本地部署的首选工具

🎯生产环境模型推理服务

#本地部署#开源模型#API
语言Go
🍴 Forks16,388
📅 上线2023/6/26
🔄 更新2026/6/1
📥 收录2026/4/13

gpt4free

开源66k↑+2

github.com/xtekky/gpt4free

多模型免费访问平台,66,037+ stars。提供多种大语言模型的免费访问接口,包括 GPT-4、Claude、Gemini 等主流模型的聚合调用方案

🎯本地模型运行与推理服务

#免费模型#API聚合#多模型#开源
语言Python
🍴 Forks13,585
📅 上线2023/3/29
🔄 更新2026/6/1
📥 收录2026/4/20

LocalAI

开源47k↑+5

github.com/mudler/LocalAI

开源本地 AI 引擎,45,607+ stars。完全兼容 OpenAI API 的本地 AI 推理引擎,支持 LLM、语音识别、图像生成等多种模型,数据完全本地处理保护隐私

🎯生产环境模型推理服务、多模态内容理解与生成

#本地部署#隐私保护#OpenAI 兼容#多模型
语言Go
🍴 Forks4,127
📅 上线2023/3/18
🔄 更新2026/6/1
📥 收录2026/4/20

Kronos

开源28k↑+42

github.com/shiyu-coder/Kronos

面向金融市场的 Foundation Model,将金融市场语言建模为序列预测问题。支持金融时间序列分析、市场趋势预测和量化交易策略生成。由 shiyu-coder 团队开发,GitHub 20K+ 星,周增 3200+ 星,是金融 AI 领域增长最快的项目之一。采用类 Transformer 架构处理结构化金融数据,可对接主流交易 API。

🎯金融时间序列预测、量化交易策略生成、市场趋势分析

#金融 AI#时间序列预测#量化交易#Foundation Model+1
语言Python
🍴 Forks4,837
📅 上线2025/10/8
🔄 更新2026/6/1
📥 收录2026/4/21

llamafile

开源25k↑+5

github.com/mozilla-ai/llamafile

用单个可执行文件分发和运行大型语言模型,支持跨平台本地推理的轻量级方案,无需复杂环境配置即可快速启动 AI 模型

🎯本地运行 LLM 的轻量级方案

#local-llm#inference#cross-platform#gguf
语言C++
🍴 Forks1,367
🔄 更新2026/6/1
📥 收录2026/5/31