《机器学习》—— SVD奇异值分解方法对图像进行压缩

ops/2024/9/23 6:30:24/

文章目录

  • 一、SVD奇异值分解简单介绍
  • 二、代码实现—SVD奇异值分解方法对图像进行压缩

一、SVD奇异值分解简单介绍

SVD(奇异值分解)是一种在信号处理、统计学、线性代数、机器学习等多个领域广泛应用的矩阵分解方法。它将任何 m×n 矩阵 A 分解为三个特定矩阵的乘积:
在这里插入图片描述

  • 其中:

    • U 是一个 m×m 的正交矩阵(或 m×min(m,n),取决于是否计算完整矩阵),其列被称为左奇异向量。
    • Σ 是一个 m×n 的矩形对角矩阵(但通常以 m×min(m,n) 的形式出现,并且只在对角线上有值,其余位置为0),对角线上的元素称为奇异值,它们是非负的,并按降序排列。在实际应用中,Σ 经常以一维数组的形式返回,仅包含对角线上的奇异值。
    • V^T 是 V 的转置,V 是一个 n×n 的正交矩阵(或 n×min(m,n)),其列被称为右奇异向量。
  • SVD 的一些重要性质和用途包括

    • 信息压缩:由于奇异值是按降序排列的,因此可以通过只保留最大的几个奇异值及其对应的左右奇异向量来近似原始矩阵,从而实现数据的压缩。这种方法在图像压缩、信号处理等领域非常有用。
    • 噪声过滤:SVD 可以用于过滤噪声,特别是当噪声主要影响较小的奇异值时。通过去除或减小这些较小的奇异值,可以去除或减轻噪声的影响。
    • 主成分分析(PCA):在统计学中,PCA 可以通过 SVD 来实现。PCA 旨在找到数据中的主成分,这些成分解释了数据中的最大方差。SVD 的左奇异向量对应于 PCA 的主成分方向。
    • 求解线性方程组:SVD 可以用于求解线性方程组 Ax=b,特别是当 A 是非方阵或奇异矩阵时。
    • 推荐系统:在推荐系统中,SVD 可以用于矩阵补全,即根据部分已知的评分来预测用户对物品的评分。

二、代码实现—SVD奇异值分解方法对图像进行压缩

  • 在 python的NumPy库 中,np.linalg.svd() 函数用于计算矩阵的 SVD。

  • 它返回三个对象:左奇异向量 U、奇异值数组 σ(注意这里返回的是一维数组,而不是完整的对角矩阵 Σ)和右奇异向量的转置 V ^T(在 NumPy 中通常直接返回 V,因为 V^T 可以很容易地通过 V.T (转置)获得)。

  • 代码对一张灰度图像进行压缩

  • 代码如下:

    import numpy as np
    from PIL import Image
    import matplotlib.pyplot as plt""" 定义奇异值分解函数 并返回压缩后的图片和大小"""
    # k为压缩的维度
    # pic_array 为传入图片的array矩阵格式
    def pic_compress(k, pic_array):# 定义全局变量global u, sigma, vt, sig, new_picu, sigma, vt = np.linalg.svd(pic_array)  # 进行奇异值分解sig = np.eye(k) * sigma[: k]     # np.eye 用于生成一个单位对角矩阵# np.dot 用于矩阵的乘法运算 (计算:A=UΣV^T ——> 压缩后的图片矩阵)new_pic = np.dot(np.dot(u[:, :k], sig), vt[:k, :])  size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]  # 计算压缩后的图片大小return new_pic, size# 读取图片
    img = Image.open('lf.jpg')
    ori_img = np.array(img)  # 将图片转换成符合 np.linalg.svd() 参数要求的array矩阵格式
    # 调用奇异值分解函数
    new_img, size = pic_compress(100, ori_img)  # 压缩的维度为100 可设定不同的值查看不同效果# 分别打印出图片压缩前后的大小
    print("original size:" + str(ori_img.shape[0] * ori_img.shape[1]))
    print("compress size:" + str(size))# 创建画布,在同一张画布中显示压缩前后的两张图片
    fig, ax = plt.subplots(1, 2)
    ax[0].imshow(ori_img, cmap='gray')
    ax[0].set_title("before compress")
    ax[1].imshow(new_img, cmap='gray')
    ax[1].set_title("after compress")
    plt.show()
    
  • 结果如下:
    在这里插入图片描述
    在这里插入图片描述

  • 由结果可以看出图片的大小大约被压缩至原大小的60%,但是图片所呈现出来的效果没有太大的变化


http://www.ppmy.cn/ops/108703.html

相关文章

Spring Boot 部署(jar包)

目录 一、对jar包进行部署 1. 首先编写一个SpringBoot部署的项目 2. 将项目进行package(打包) 3. 将其打包出来的jar包进行运行 遇到没有主清单属性的问题 4. 在Linux上也可以如此部署 二、部署SpringBoot项目后无法通过正常访问的情况解决 一、对…

HTTP请求⽅法

HTTP请求⽅法 1. GET :申请获取资源,不对服务器产⽣影响 2. POST : POST 请求通常⽤于发送数据,例如提交表单数据、上传⽂件等,会影响服务器,服务器可能动态创建新的资源或更新原有资源。 3. HEAD &#…

贪心+构造,1924A - Did We Get Everything Covered?

目录 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 二、解题报告 1、思路分析 2、复杂度 3、代码详解 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 1924A - Did We Get Everything Covered? 二、解题报告 1、思路分析 我…

PPStructure核心源码研究(一)总论

通过系列文章,来记录PPStructure源代码研究过程中学习到的知识。 首在修身养性,若能兼济他人,则善莫大焉。 本文首先通过一个表格识别的应用场景,举例说明PPStructure的基本应用,然后分析其内部实现时序,介绍相关类,为PPStructure的源码研究形成一个总体印象。 目录 1…

富格林:严厉打破欺诈实现安全

富格林认为,“磨刀不误砍柴工”这话在现货黄金交易市场中同样也适用,特别是近年来市场的避险情绪逐渐升温,人们对现货黄金的投资需求加大的情况下,严厉打破欺诈是我们能否确保交易安全的关键。富格林将给大家总结打破欺诈套路的小…

python爬虫基础

python 文章目录 python变量变量类型 输出运行程序 ctrlshiftf10命名规范:字母,数字,下划线 开头不能是数字注释: ctrl?字典 键key:值value修改字典的信息字典添加一个键值对字典删除一个键值对 实操案例--…

【最新华为OD机试E卷-支持在线评测】通过软盘拷贝文件(200分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-E/D卷的三语言AC题解 💻 ACM金牌🏅️团队| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试E卷,全、新、准,题目覆盖率达 95% 以上,支持…

美国洛杉矶ip有哪些独特优势

美国洛杉矶的IP地址独特优势主要体现在以下几个方面,rak小编为您整理发布美国洛杉矶的IP地址独特优势,希望 对您选择服务器有帮助。 1. 丰富的IP资源:美国洛杉矶多IP服务器提供的IP数量从几十到几百不等,最多可提供多达511个独立I…