AirLLM

开源LLM 运行时 › 量化与压缩⭐ 23k↑+218

仅需单张 4GB GPU 即可运行 70B 大模型推理。采用层卸载和量化技术，让消费级显卡也能跑超大模型，是资源受限场景下大模型推理的破局方案

🎯适用场景：消费级 GPU 上的大模型推理、低资源 LLM 部署场景

#边缘推理#量化#low-vram#大语言模型#gpu-optimization

📥 收录于 2026/6/4

访问工具 📖 官方文档

📊 仓库数据

Stars23,202

Forks2,648

语言Jupyter Notebook

上线2023/9/1

更新2026/7/18

📈 Stars 变化 ↑1 天 +218· 统计区间 7/17 20:11 → 7/18 23:22（1 天）

✅ 优点

•4GB GPU 即可运行 70B 模型
•大幅降低大模型推理硬件门槛
•量化+层卸载技术成熟
•适合个人开发者和小团队

⚠️ 限制

•推理速度比满配 GPU 慢
•大模型加载时间较长
•仅支持部分模型架构

🔗 相关工具

BitNet

开源⭐ 40k↑+6

github.com/microsoft/bitnet

微软 1-bit LLM 官方推理框架，将模型权重量化为 1-bit，大幅降低推理成本

🎯金融 AI 应用与量化分析

#大语言模型#量化#推理#1-bit

语言C++

🍴 Forks3,654

🔄 更新2026/7/18

📥 收录2026/5/18

MNN

开源⭐ 16k↑+5

github.com/alibaba/MNN

阿里巴巴端侧 AI 推理引擎，15K+ stars。轻量高效的移动端和边缘端推理引擎，支持 LLM 端侧部署，在 ARM、RISC-V 等平台上提供极致性能

🎯手机、IoT 等设备上的轻量模型与 LLM 端侧推理部署

#端侧 AI#推理引擎#嵌入式#大语言模型

语言C++

🍴 Forks2,385

🔄 更新2026/7/18

📥 收录2026/5/27

bitsandbytes

开源⭐ 8.3k↑+2

github.com/bitsandbytes-foundation/bitsandbytes

PyTorch k-bit 量化库，让大语言模型可在消费级 GPU 上运行。支持 4-bit/8-bit 量化、QLoRA 微调，是本地部署大模型的核心工具。8.2K+ stars。

🎯大模型消费级 GPU 部署、QLoRA 微调、内存优化推理

#大语言模型#机器学习#Pytorch#QLoRA

语言Python

🍴 Forks884

🔄 更新2026/7/18

📥 收录2026/6/3

Nexa SDK

开源⭐ 8.2k↑+5

github.com/qualcomm/nexa-sdk

跨平台 LLM/VLM 推理引擎——在 GPU、NPU 和 CPU 上运行前沿模型。零日模型支持、量化优化、多硬件后端，是端侧 AI 部署的统一推理方案

🎯端侧 LLM/VLM 推理运行时，适用于手机、IoT 设备等边缘部署场景

#端侧推理#NPU#量化#跨平台

语言Rust

🍴 Forks1,025

📅 上线2024/6/1

🔄 更新2026/7/18

📥 收录2026/5/26

Kronos

开源⭐ 32k↑+26

github.com/shiyu-coder/Kronos

面向金融市场的 Foundation Model，将金融市场语言建模为序列预测问题。支持金融时间序列分析、市场趋势预测和量化交易策略生成。由 shiyu-coder 团队开发，GitHub 20K+ 星，周增 3200+ 星，是金融 AI 领域增长最快的项目之一。采用类 Transformer 架构处理结构化金融数据，可对接主流交易 API。

🎯金融时间序列预测、量化交易策略生成、市场趋势分析

#金融 AI#时间序列预测#量化交易#Foundation Model+1

语言Python

🍴 Forks5,546

📅 上线2025/10/8

🔄 更新2026/7/18

📥 收录2026/4/21

UniLM

开源⭐ 22k

github.com/microsoft/unilm

UniLM 是微软的统一预训练模型仓库，涵盖跨任务、跨语言、跨模态的大规模自监督预训练。包含 BEiT、LayoutLM、Kosmos、TextDiffuser 等多个经典模型，是多模态 AI 研究的重要参考资源。22K+ stars。

🎯多模态预训练模型研究、文档 AI、视觉语言模型开发

#Beit#Beit-3#Bitnet#Deepnet

语言Python

🍴 Forks2,704

🔄 更新2026/7/18

📥 收录2026/6/3

← 浏览全部 1318 个工具