【个人开源】——从零开始在高通手机上部署sd(一)

news/2025/2/25 1:06:54/

代码:https://github.com/chenjun2hao/qualcomm.sd

从零基础开始,在自己的高通手机(骁龙8 gen1+)上用NPU跑文生图stable diffusion模型。包含:

  • 高通qnn下载安装
  • sd模型浮点/量化导出
  • 高通手机上用cpu跑浮点模型,htp跑量化模型

1. python依赖安装

主要对齐transformers, diffusers的版本,其他参考requirements.txt

pip install transformers==4.40.0 diffusers==0.32.2

2. python浮点模型测试

# 1.下载sd 模型
git clone https://hf-mirror.com/segmind/portrait-finetuned# 2.通过diffuser的pipe测试模型
cd $PROJECT_HOME
python sd_portrait_diffpip.py# 3.通过自己实现的pipe测试模型
python sd_portrait_ownpip.py

结果可视化:
sdnimg.cn/direct/7127ed0a0026494084f4581eb6e2420b.jpeg" alt="请添加图片描述" />
sdnimg.cn/direct/8423e51bcd0b4ec28eecd3e33770c699.jpeg" alt="请添加图片描述" />

3. 导出浮点模型/x64 cpu模拟推理/高通cpu推理

高通libQnnCpu.so好像只支持浮点模型,不支持量化模型(可能后续的硬件,会支持)。

qnn_35">3.1 高通qnn安装

coming soon …

3.2 导出浮点模型

cd $PROJECT_HOME
python export_model.py --export_quant_model false

导出的模型在qnn_models/xxx下. eg: qnn_models/text_encoder_float/x86_64-linux-clang/libtext_encoder.so是x64上模拟推理时需要的模型。qnn_models/text_encoder_float/aarch64-android/libtext_encoder.so是push到android手机上使用的模型

3.3 x64 cpu模拟推理

参考项目readme运行:qualcomm.ai

3.4 高通cpu推理

将所有依赖的东西push到android手机上。参考项目readme运行:qualcomm.ai

4. 导出量化模型/高通htp推理

4.1 生成量化用数据

cd $PROJECT_HOME
python make_calibration_data.py

4.2 导出量化模型

4.3 x64模拟htp推理

高通在x64平台上,有模拟HTP硬件执行的软件库,但是sd模型运行太慢了。

4.4 高通HTP推理

将所有依赖的东西push到android手机上。参考项目readme运行:qualcomm.ai

5. reference

  1. StableDiffusionOnDevice

http://www.ppmy.cn/news/1574730.html

相关文章

Qt/C++面试【速通笔记一】

Qt 信号与槽机制 什么是信号(Signal)和槽(Slot)? 在Qt中,信号(Signal)和槽(Slot)是实现对象之间通信的一种机制。信号是对象在某些事件发生时发出的通知&…

现代无线通信接收机架构:超外差、零中频与低中频的比较分析

写在前面:本博客是对三种接收机架构的学习笔记,仅供个人学习记录使用。内容主要是上网查阅的资料,以及个人的一些理解。如有错误的地方请指出! 文章目录 一、通信机基本架构 1、射频发射级的基本组成及完成功能2、射频接收级的基…

微服务即时通信系统---(三)框架学习

目录 brpc RPC框架 核心概念 工作原理 介绍 安装 头文件包含和编译时指明库 类与接口介绍 日志输出类与接口 protobuf类与接口 Closure类 RpcController类 服务端类与接口 ServerOptions类 Server类 ClosureGuard类 HttpHeader类 Controller类 客户端类与…

【JavaEE进阶】Spring MVC(2)

欢迎关注个人主页:逸狼 创造不易,可以点点赞吗 如有错误,欢迎指出~ 传递JSON数据 JSON(JavaScript Object Notation)是一种轻量级的数据格式,有自己的语法和格式,主要负责不同语言中的数据传递和交换(作用类似于"英语,普通话"等语…

Java集合框架之ArrayList解析

目录 一、ArrayList概述 二、优缺点分析 三、底层数据结构 四、源码分析ArrayList初始化容量 五、源码分析ArrayList扩容策略 六、ArrayList集合源码分析 1. 属性分析 2. 构造方法分析 无参构造方法 指定初始容量的构造方法 传入集合的构造方法 3. 添加元素 add(E…

Java List 自定义对象排序 Java 8 及以上版本使用 Stream API

从 Java 8 开始,你可以使用 Stream API 对 List 进行排序,这种方式更加简洁和灵活。 以下是一个示例代码: import java.util.ArrayList; import java.util.Comparator; import java.util.List; import java.util.stream.Collectors;// 自定…

智慧废品回收小程序php+uniapp

废品回收小程序:数字化赋能环保,开启资源循环新时代 城市垃圾治理难题,废品回收小程序成破局关键 随着城市化进程加速与消费水平提升,我国生活垃圾总量逐年攀升,年均增速达5%-8%,其中超30%为可回收物。然…

在 Vue 中处理跨域请求:全面解析与实践指南

在 Vue 中处理跨域请求:全面解析与实践指南 在现代 Web 开发的复杂生态中,跨域请求(CORS)如同一个无处不在的难题,时刻考验着开发者的技术能力。当我们构建基于 Vue.js 的前端应用时,这一问题尤为凸显。因为…