从零开始:OpenCV计算机视觉基础教程【图像基本操作】

embedded/2025/3/1 18:29:04/

一、视频读取-摄像头读取

cap.get(propId)访问视频的一些功能,propId是0-18之间的数字。

每个数字表示视频得到属性,cap.set(propId, value)可以进行修改,value是新值

例如:

cap.get(cv.CAP_PROP_FRAME_WIDTH))   #读取视频宽度 cap.get(cv.CAP_PROP_FRAME_HEIGHT) #读取视频的高度

ret = cap.set(cv.CAP_PROP_FRAME_WIDTH,320) # 修改视频宽度为320

ret = cap.set(cv.CAP_PROP_FRAME_HEIGHT,240) #修改视频高度为240

二、视频写入到文件

VideoWriter('output.avi', fourcc, 20.0, (640,  480))

5个参数:

1.文件路径,文件名称(默认路径情况下,也就是当前目录下)。

2.fourcc:四个字符用来表示压缩帧的codec,可选参数如下:

                     CV_FOURCC('P','I','M','1') = MPEG-1 codec

                     CV_FOURCC('M','J','P','G') = motion-jpeg codec

                     CV_FOURCC('M', 'P', '4', '2') = MPEG-4.2 codec

                     CV_FOURCC('D', 'I', 'V', '3') = MPEG-4.3 codec

                     CV_FOURCC('D', 'I', 'V', 'X') = MPEG-4 codec

                     CV_FOURCC('U', '2', '6', '3') = H263 codec

                     CV_FOURCC('I', '2', '6', '3') = H263I codec

                     CV_FOURCC('F', 'L', 'V', '1') = FLV1 codec

3.fps:被创建视频流的帧率

4.frame_size:视频流的大小

5.isColor:如果为True则每一帧为彩色图,否则为灰度图,默认为True

三、访问和修改像素值

>>> import numpy as np
>>> import cv2 as cv
>>> img = cv.imread('messi5.jpg')
>>> px = img[100,100]
>>> print( px )
[157 166 200]
# 仅访问蓝色像素
>>> blue = img[100,100,0]
>>> print( blue )
157
>>> img[100,100] = [255,255,255]
>>> print( img[100,100] )
[255 255 255]

可以通过行和列坐标来访问像素值。

对于 BGR 图像,它返回一个由蓝色、绿色和红色值组成的数组。

对于灰度图像,只返回相应的灰度。

>>> import numpy as np
>>> import cv2 as cv
>>> img = cv.imread('messi5.jpg')
# 访问 RED 值
>>> img.item(10,10,2)
59
# 修改 RED 值
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100

item(a,b)函数的功能是索引出要访问的图像的某个像素点。函数返回要索引的像素点的值。函数有两个参数,第一个参数是像素点的行,第二个参数是像素点的列。

itemset((a,b),c) 函数用来修改指定像素点的像素值。本函数直接在原图像上修改,不返回任何值。 函数有两个参数,第一个参数是要修改的像素点,第二个参数是要修改的像素的值。

四、访问图像属性

>>> import numpy as np
>>> import cv2 as cv
>>> img = cv.imread('messi5.jpg')
>>> print( img.shape )   #行,列,通道数的元祖
(342, 548, 3)
>>> print( img.size )      #像素总数
562248
>>> print( img.dtype )    #图像数据类型
uint8

图像属性包括行数,列数和通道数,图像数据类型,像素数等。

五、图像感兴趣的区域ROI(region of interest)

选择球并将其复制到图像中的另一个区域:

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball

就像下面的图一样

六、拆分和合并图像通道

有时你需要分别处理图像的B,G,R通道。在这种情况下,你需要将BGR图像拆分为单个通道。你可能需要将这些单独的频道加入BGR图片。你可以通过以下方式简单地做到这一点:

>>> b,g,r = cv.split(img) 

或者

>>> b = img [:, :, 0]

>>> img = cv.merge((b,g,r))  # 切分完之后可进行组合

七、边界填充-为图像设置边框

目的:在图像的周围创建边框,使用cv.copyMakeBorder()函数。在卷积运算,零填充等方面有很多应用。此函数参数如下:

src - 输入图像

top,bottom,left,right 边界宽度(以相应方向上的像素数为单位)

borderType - 定义要添加哪种边框的标志。它可以是以下类型:

cv.BORDER_CONSTANT - 添加恒定的彩色边框。该值应作为下一个参数给出。

cv.BORDER_REFLECT - 边框将是边框元素的镜像,如下所示: fedcba | abcdefgh | hgfedcb

**cv.BORDER_REFLECT_101**或 **cv.BORDER_DEFAULT**与上述相同,但略有变化,例如: gfedcb | abcdefgh | gfedcba

**cv.BORDER_REPLICATE**最后一个元素被复制,像这样: aaaaaa | abcdefgh | hhhhhhh

**cv.BORDER_WRAP**难以解释,它看起来像这样: cdefgh | abcdefgh | abcdefg

value -边框的颜色,如果边框类型为**cv.BORDER_CONSTANT**

如下代码:

top_size,bottom_size,left_size,right_size = (50,50,50,50)replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)

可视化展示:

import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')
plt.show()

是这样的效果:

简单来说:
- BORDER_REPLICATE:复制法,也就是复制最边缘像素。
- BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb   
- BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
- BORDER_WRAP:外包装法abcdefgh|abcdefgh|abcdefgh  
- BORDER_CONSTANT:常量法,常数值填充。


有趣有趣~


http://www.ppmy.cn/embedded/169121.html

相关文章

自然语言处理NLP入门 -- 第六节命名实体识别

1 什么是命名实体识别? 在日常生活中,我们经常会遇到这样的情景:希望从一大段文本中,快速找出所有的人名、地名、组织机构名称、日期、时间等关键信息。举个例子,如果你在阅读一篇关于历史事件的新闻报道时&#xff0…

智能家居遥控革命!昂瑞微HS6621EM:用「芯」定义AIoT时代的语音交互标杆

AIoT爆发期,遥控器为何成为智能家居的「隐形战场」? 随着Meta、苹果等巨头加速布局空间计算,智能家居生态正从「单一设备联网」向「全场景无感交互」跃迁。作为高频使用的入口设备,语音遥控器的性能直接决定用户体验天花板。昂瑞微…

【Python pro】函数

1、函数的定义及调用 1.1 为什么需要函数 提高代码复用性——封装将复杂问题分而治之——模块化利于代码的维护和管理 1.1.1 顺序式 n 5 res 1 for i in range(1, n1):res * i print(res) # 输出:1201.1.2 抽象成函数 def factorial(n):res 1for i in range(1…

网络安全(黑客技术)一2025年自学入门手册_合天网安-零基础系统学习网络安全教程下载

前言 作为一个合格的网络安全工程师,应该做到攻守兼备,毕竟知己知彼,才能百战百胜。 一、什么是网络安全 网络安全可以基于攻击和防御视角来分类,我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术,而“蓝队…

第三方应用程序接入DeepSeek服务的安全策略与实践

摘要 本文探讨了如何安全地通过第三方应用程序接入DeepSeek服务。对于追求企业级安全和无缝IDE体验的开发者及团队,QodoGen是理想选择;而对于希望快速访问DeepSeek-R1解决方案的用户,Perplexity AI提供的基于Web的应用无需安装即可使用&#…

TikTok矩阵:一人管理多账号,突破增长极限

随着短视频平台的蓬勃发展,TikTok(抖音)已经成为了全球最具活力和潜力的社交平台之一。无论是内容创作者、品牌商还是营销人员,如何在TikTok上获得更多曝光、粉丝和流量,已经成为了大家都在思考的问题。 在这种背景下…

物联网综合实训室建设方案的探讨(职业院校物联网综合实训室建设方案)

随着物联网技术的迅猛发展,社会对物联网人才的需求日益增加。为了满足这一需求,高校和职业院校纷纷开始建设物联网综合实训室,以培养具备实际操作能力和创新思维的高素质物联网人才。本文旨在探讨一种行之有效的物联网综合实训室建设方案&…

网络变压器的主要电性参数与测试方法(2)

Hqst盈盛(华强盛)电子导读:网络变压器的主要电性参数与测试方法(2).. 今天我们继续来看看网络变压器的2个主要电性参数与它的测试方法: 1. 线圈间分布电容Cp:线圈间杂散静电容 测试条件:100KHz/0.1…