TensorFlow Lite 是什么？适用于哪些场景？

Question 1

Accepted Answer

TensorFlow Lite（TFLite） 是 TensorFlow 的轻量级推理解决方案，面向资源受限设备：手机、IoT、嵌入式 MCU。 工作流程： 1. 在服务器用 TF/Keras 训练完整模型 2. TFLite Converter 转为 .tflite flatbuffer 3. 可选 量化（Post-training INT8、float16）压缩 4×、加速 2～3× 4. 设备端 TFLite Interpreter 执行推理 典型场景： 场景 示例 ------ ------ 移动 App 人像分割、实时滤镜 语音唤醒 关键词检测 on-device 工业边缘 缺陷检测、低带宽离线 MCU TensorFlow Lite for Microcontrollers 优势：包体小、延迟低、隐私（数据不出设备）、无网络依赖。 与 TF Serving（云端批服务）、ONNX Runtime（跨框架）形成互补。详见 深度学习基础。

Question 2

量化会损失多少精度？

Accepted Answer

视模型与方法而定。float16 几乎无损；INT8 训练后量化（PTQ）在分类任务上通常掉 1% 以内，但对量化敏感的检测/分割或激活分布长尾的模型可能掉得更多。关键是用代表性数据集做校准统计激活范围；若 PTQ 损失过大，可改用量化感知训练（QAT），在训练中模拟量化误差，通常能把精度恢复到接近 float。

Question 3

TFLite 能训练吗？

Accepted Answer

主要定位是推理引擎，不做完整训练。但它提供 On-Device Training 能力，支持在端侧对部分层做小规模微调/个性化（如键盘联想、本地适配），需在转换时显式开启对应签名。大规模训练仍应在服务器用完整 TF 完成，再转换部署。

Question 4

和 Core ML / NNAPI 关系？

Accepted Answer

它们是底层硬件加速代理。TFLite 通过 Delegate 机制把算子下放到平台加速器：iOS 上可用 Core ML delegate 走 Apple Neural Engine，Android 上用 NNAPI delegate 调用厂商 DSP/NPU，还有 GPU delegate。TFLite 提供统一的跨平台模型与运行时，Core ML/NNAPI 负责具体设备上的高效执行。

TensorFlow Lite 是什么？适用于哪些场景？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习


场景	示例
移动 App	人像分割、实时滤镜
语音唤醒	关键词检测 on-device
工业边缘	缺陷检测、低带宽离线
MCU	TensorFlow Lite for Microcontrollers