pytorch中transform库中常用的函数有哪些及其用法?

news/2025/3/14 0:52:07/

在PyTorch的torchvision.transforms库中,有许多常用的图像变换函数可用于数据增强和预处理。下面列举了一些常用的函数及其用法:

  1. Resize(size): 调整图像大小为给定的尺寸。

    transform = transforms.Resize((256, 256))
    
  2. RandomCrop(size, padding=None): 随机裁剪图像到给定尺寸。

    transform = transforms.RandomCrop(224)
    
  3. CenterCrop(size): 从图像中心进行裁剪到给定尺寸。

    transform = transforms.CenterCrop(224)
    
  4. RandomHorizontalFlip(p=0.5): 随机水平翻转图像,翻转概率为 p。

    transform = transforms.RandomHorizontalFlip()
    
  5. ToTensor(): 将图像转换为张量。

    transform = transforms.ToTensor()
    
  6. Normalize(mean, std): 标准化图像张量。

    transform = transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
    
  7. RandomRotation(degrees, resample=False, expand=False, center=None): 随机旋转图像给定角度。

    transform = transforms.RandomRotation(30)
    
  8. ColorJitter(brightness=0, contrast=0, saturation=0, hue=0): 随机调整亮度、对比度、饱和度和色调。

    transform = transforms.ColorJitter(0.2, 0.2, 0.2, 0.2)
    
  9. RandomGrayscale(p=0.1): 随机将图像转换为灰度图像,转换概率为 p。

    transform = transforms.RandomGrayscale()
    
  10. RandomResizedCrop(size, scale=(0.08, 1.0), ratio=(0.75, 1.3333333333333333), interpolation=<InterpolationMode.BILINEAR: 'bilinear'>): 随机裁剪并调整图像大小。

    transform = transforms.RandomResizedCrop(224)
    
  11. Grayscale(num_output_channels=1): 将图像转换为灰度图像。

    transform = transforms.Grayscale()
    

这些函数只是torchvision.transforms库中的一部分。您可以根据需要选择适当的图像变换函数,并按照上述示例将它们组合在一起使用,以实现数据增强和预处理。


http://www.ppmy.cn/news/1140807.html

相关文章

微信小程序 table表格 固定表头和首列 右侧表格可以左右滚动

(一) 1.左侧一列固定不动 2.右侧表格内容可以左右滚动 3.单元格内容平均分配 4.每一行行高可以由内容撑开 通过 js 设置左侧一列行高与右侧表格内容行高保持一致 1.1 效果图 1.2 tabble.wxml <view classtable><!-- 左侧固定 --><view classtable_left_colum…

解决:使用WileyNJDv5_Template模板时,无法生成pdf文件。

目录 问题&#xff1a; 解决办法&#xff1a; 检查过程&#xff1a; WileyNJDv5-Template模板链接&#xff1a;New Journal Design LaTeX template (wiley.com) 问题&#xff1a; 使用wileyNJDv5_Template模板时候&#xff0c;无法生成pdf文件。无论是使用texlivetexmaker还…

记录本地部署Stable-diffusion所依赖的repositories和一些插件

今天按照其他文章的步骤拉取好了https://github.com/AUTOMATIC1111/stable-diffusion-webui后&#xff0c;点击webui-user.bat后发现&#xff0c;repositories和models还得慢慢拉取&#xff0c;好吧&#xff0c;GitHub Desktop&#xff0c;启动&#xff01; BLIP: https://git…

PL/SQL拉链表

练习:-- 拉链表练习: 维度表源表 ID M_NAME REST UP_DATE 1 车贷 0.01 2022/12/1 2 房贷 0.03 2022/12/1 3 经营贷 0.015 2022/12/1 维度表拉链表 ID M_NAME REST BEGIN_DATE END_DATE 1 车贷 …

美容美甲小程序商城的作用是什么

美容院往往有很高需求&#xff0c;女性悦己经济崛起&#xff0c;加之爱美化程度提升&#xff0c;无论线下环境还是线上互联网信息冲击&#xff0c;美容服务、化妆产品等市场规格一直稳增不减。 通过【雨科】平台制作美容美甲商城&#xff0c;售卖相关服务/产品&#xff0c;模块…

【audio】alsa pcm音频路径

文章目录 AML方案音频路径分析dump alsa pcm各个音频路径的原始音频流数据 AML方案音频路径分析 一个Audio Patch用来表示一个或多个source端到一个或多个sink端。这个是从代码的注释翻译来的&#xff0c;大家可以把它比作大坝&#xff0c;可以有好几个入水口和出水口&#xf…

小谈设计模式(14)—建造者模式

小谈设计模式&#xff08;14&#xff09;—建造者模式 专栏介绍专栏地址专栏介绍 建造者模式角色分类产品&#xff08;Product&#xff09;抽象建造者&#xff08;Builder&#xff09;具体建造者&#xff08;Concrete Builder&#xff09;指挥者&#xff08;Director&#xff0…

使用 html2canvas 和 jspdf 将页面转 pdf,同时解决当页面过长时,页面白屏问题

代码如下&#xff0c;直接粘贴复制即可&#xff0c;代码中 jspdf 是全局引入&#xff0c;你可以自己局部引入 别人使用标签的方式来显示 base64&#xff0c;但是当页面过长时&#xff0c;base64 大小过大会导致页面解析异常&#xff0c;显示白屏 import html2canvas from html2…