LPU(语言处理单元)

Groq 造的那个超快推理芯片

亦作、亦称:语言处理单元 · Language Processing Unit · Groq LPU · Tensor Streaming Processor · TSP

概述

LPU(Language Processing Unit,语言处理单元)是 Groq 公司开发的 AI 推理加速器 ASIC,最初称为张量流处理器(Tensor Streaming Processor, TSP),2023 年 ChatGPT 爆发后更名为 LPU。其核心创新是「功能切片微架构」——内存单元与向量/矩阵计算单元交替排列,利用数据流局部性实现确定性低延迟推理,Llama 2 70B 推理速度可达 300 tokens/s 以上。

工作原理

LPU(Language Processing Unit,语言处理单元)是 Groq 公司开发的 AI 推理加速器 ASIC,最初称为张量流处理器(Tensor Streaming Processor, TSP),2023 年 ChatGPT 爆发后更名为 LPU。其核心创新是「功能切片微架构」——内存单元与向量/矩阵计算单元交替排列,利用数据流局部性实现确定性低延迟推理,Llama 2 70B 推理速度可达 300 tokens/s 以上。

应用场景

LPU常见于:AI 研究与产业落地。实际选型需结合业务指标、数据规模与部署约束评估适用性。

局限与误区

围绕 LPU 的口语化说法(见「常见误解」)常过度简化。效果依赖数据质量、任务匹配与系统整体设计;生产环境应配合评测、监控与人工复核。

背景与发展

LPU随 AI 研究与工程实践持续演进,定义边界与最佳实践仍在更新。建议结合原始论文、官方文档与本站延伸阅读建立准确认知。

常见误解

日常交流中容易听到的简化说法,未必准确,但能帮助理解误解从何而来。

  • 「Groq 造的那个超快推理芯片」
  • 「比 GPU 快十倍的 AI 芯片」

相关术语

和本术语关联紧密的其他词条,便于串联理解。