基于RKNN的嵌入式深度学习开发（2）

news/2025/3/3 11:12:21/

上一个章节我们介绍的RKNN模型的模型转换和模型的推理，这一章节我们将介绍模型的量化和评估部分。

2.3 RKNN模型的量化

量化就是将浮点转换为定点运算的过程，或者训练后由rknn来量化。量化模型使用较低精度（如int8/uint8/int16）保存模型的权重信息，在部署时可以使用更少的存储空间，获得更快的推理速度。但各深度学习框架训练、保存模型时，通常使用浮点数据，所以模型量化是模型转换过程中非常重要的一环。RKNN Toolkit目前对量化模型的支持主要有以下两种形式：

RKNN Toolkit根据用户提供的量化数据集，对加载的浮点模型进行量化，生成量化的RKNN 模型。
- 支持的量化精度类型：int16，int8，uint8
- 量化方式：训练后静态量化
- 支持的量化粒度：per-tensor（或 per-layer），不支持 per-channel 量化
由深度学习框架导出量化模型，RKNN Toolkit加载并利用已有的量化信息,生成量化 RKNN 模型。
- 支持的深度学习框架：PyToch(v1.9.0)、ONNX(Onnxruntime v1.5.1)、Tensorflow、TFLite
- 支持的量化精度类型：int8, uint8
- 量化方式：训练后静态量化, 量化感知训练(QAT)

以下代码为量化的示例代码：

# 导入RKNN库  
from rknn.api import RKNN  # 创建RKNN对象  
rknn = RKNN()  # 加载已训练的模型，例如TensorFlow或PyTorch模型  
# 这里以TensorFlow Frozen Graph为例  
model_path = 'your_model.pb'  
rknn.load_tensorflow(model=model_path, inputs=['input_tensor'], outputs=['output_tensor'])  # 配置量化  
rknn.config(quantized_enable=True, quantized_dtype='int8')  # 编译模型  
print("编译模型...")  
rknn.compile()  # 进行量化  
print("量化模型...")  
rknn.quantize()  # 导出量化后的模型  
output_model_path = 'quantized_model.rknn'  
rknn.export(output_model_path)  print("量化完成，模型已保存到：", output_model_path)  # 释放RKNN对象  
rknn.release()