实现了两种不同的图像处理和物体检测方法

ops/2024/11/20 5:49:40/

这段代码实现了两种不同的图像处理和物体检测方法:一种是基于Canny边缘检测与轮廓分析的方法,另一种是使用TensorFlow加载预训练SSD(Single Shot Multibox Detector)模型进行物体检测。

1. Canny边缘检测与轮廓分析:

首先,通过OpenCV进行图像处理,找到矩形物体并进行绘制:

image = cv2.imread('U:/1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 高斯模糊
blurred = cv2.GaussianBlur(gray, (5, 5), 0)# Canny边缘检测
edges = cv2.Canny(blurred, 50, 150)# 查找轮廓
contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)for contour in contours:# 逼近多边形epsilon = 0.04 * cv2.arcLength(contour, True)approx = cv2.approxPolyDP(contour, epsilon, True)# 如果轮廓有4个点且是矩形if len(approx) == 4:# 计算矩形的长宽比x, y, w, h = cv2.boundingRect(approx)aspect_ratio = float(w) / hif 0.8 < aspect_ratio < 1.2:  # 如果长宽比接近1,表示是矩形# 绘制矩形cv2.drawContours(image, [approx], -1, (0, 255, 0), 2)# 显示结果
cv2.imshow("Detected Rectangles", image)
cv2.waitKey(0)
cv2.destroyAllWindows()
  • 步骤:
    1. 灰度化:通过cv2.cvtColor()将图像转换为灰度图。
    2. 高斯模糊:使用cv2.GaussianBlur()进行模糊处理,减少噪声。
    3. Canny边缘检测:通过cv2.Canny()检测图像中的边缘。
    4. 查找轮廓:使用cv2.findContours()获取图像的外部轮廓。
    5. 轮廓逼近:通过cv2.approxPolyDP()简化轮廓形状,逼近为多边形。
    6. 筛选矩形:通过检测轮廓点数为4的多边形,计算长宽比并判断其是否接近正方形(长宽比介于0.8和1.2之间)。
    7. 绘制矩形:如果符合条件,使用cv2.drawContours()绘制绿色矩形框。

2. SSD模型物体检测:

接下来,使用TensorFlow加载预训练的SSD模型,并在图像上进行物体检测,最后绘制检测框:

# 加载预训练的SSD模型
model = tf.saved_model.load('ssd_mobilenet_v2_coco/saved_model')# 读取图片
img = cv2.imread('image_path')
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
input_tensor = tf.convert_to_tensor(img_rgb)
input_tensor = input_tensor[tf.newaxis, ...]  # 扩展维度# 执行推理
model_fn = model.signatures['serving_default']
output_dict = model_fn(input_tensor)# 获取检测结果
boxes = output_dict['detection_boxes'].numpy()[0]  # 边界框
scores = output_dict['detection_scores'].numpy()[0]  # 置信度
classes = output_dict['detection_classes'].numpy()[0]  # 标签# 筛选出矩形
threshold = 0.5
for i in range(len(scores)):if scores[i] > threshold:y1, x1, y2, x2 = boxes[i]x1, y1, x2, y2 = int(x1 * img.shape[1]), int(y1 * img.shape[0]), int(x2 * img.shape[1]), int(y2 * img.shape[0])cv2.rectangle(img, (x1, y1), (x2, y2), (0, 255, 0), 2)# 显示图像
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb)
plt.axis('off')
plt.show()
  • 步骤:
    1. 加载SSD模型:通过tf.saved_model.load()加载一个预训练的SSD模型(ssd_mobilenet_v2_coco)。
    2. 读取图像:使用cv2.imread()加载图像,并将其转换为RGB格式。
    3. 图像处理:将图像转换为TensorFlow的张量格式,并扩展为批处理维度。
    4. 推理过程:通过模型的signatures['serving_default']执行推理,获得检测的边界框、置信度和标签。
    5. 筛选结果:根据置信度(scores)大于设定的阈值(0.5)进行筛选。
    6. 绘制边界框:使用cv2.rectangle()绘制绿色矩形框,将检测到的物体框出。
    7. 显示图像:使用matplotlib.pyplot显示处理后的图像。

总结:

  • Canny边缘检测与轮廓分析:通过对图像边缘进行检测,使用轮廓分析找出矩形,并通过长宽比进一步筛选目标。
  • SSD物体检测:利用TensorFlow预训练的SSD模型进行物体检测,并在图像中绘制检测到的物体框。

这两种方法可以结合使用,在某些应用中,如检测特定形状(矩形)和使用深度学习检测物体时,互为补充。


http://www.ppmy.cn/ops/135161.html

相关文章

湘潭大学软件工程算法设计与分析考试复习笔记(三)

回顾 湘潭大学软件工程算法设计与分析考试复习笔记&#xff08;一&#xff09;湘潭大学软件工程算法设计与分析考试复习笔记&#xff08;二&#xff09; 前言 现在继续开始复习。每天复习一点点&#xff0c;嘿嘿。今天本来准备写一个动态规划的题的&#xff0c;感觉半懂不懂…

进入 RPG Prime:第六周游戏指南

进入 RPG Prime&#xff0c;在这里&#xff0c;每一个任务都是一个等待展开的史诗故事。选择你的等级&#xff0c;召集你的队伍&#xff0c;开始融合策略、魔法和神话的冒险&#xff01; 本系列共有 10 篇攻略&#xff0c;贯穿 Alpha 第 4 季&#xff0c;每周都有新攻略&#…

论文的科技查新报告是什么?有什么用途?

一、论文的科技查新报告是什么 论文的科技查新与一般科技查新有一些不同之处。 在论文的科技查新中&#xff0c;主要是针对特定的研究课题进行查新&#xff0c;以获取与该课题相关的最新研究成果和文献。 与一般科技查新相比&#xff0c;论文的科技查新更加注重对学术界的研究…

AIGC学习笔记(5)——AI大模型开发工程师

文章目录 AI大模型开发工程师004 垂直领域的智能在线搜索平台1 智能在线搜索平台需求分析大模型不够“聪明”增强大模型的方式需求分析2 智能在线搜索平台方案设计方案设计技术选型大模型版本GLM-4大模型注册使用Google Cloud平台注册创建可编程的搜索引擎3 智能在线搜索平台代…

go的接口详解

接口的定义和格式 接口(interface)是一种类型&#xff0c;用来定义行为(方法)。这句话有两个重点&#xff0c;类型和定义行为。 首先解释定义行为&#xff1a; 接口即一组方法定义的集合&#xff0c;定义了对象的一组行为&#xff0c;就是定义了一些函数&#xff0c;由具体的…

SpringBoot开发——整合AJ-Captcha实现安全高效的滑动验证码

文章目录 一、什么是AJ-Captcha二、项目配置1、Maven依赖配置2、滑动验证码的基本原理3、 后端实现3.1 生成滑动验证码图片代码解释3.2 校验滑块位置代码解释4、前端部分代码解释5、Redis 缓存滑动验证码信息5.1 Redis配置5.2使用Redis缓存验证码数据5.3 校验时从Redis获取总结…

在阿里云快速启动Appsmith搭建前端页面

什么是Appsmith Appsmith是一个开源的低代码开发平台&#xff0c;它使得开发者能够快速地构建内部工具、业务管理系统、CRM系统等。Appsmith通过提供一系列预建的UI组件&#xff08;如表格、图表、表单等&#xff09;&#xff0c;以及对数据库、API调用的直接支持&#xff0c;…

机器学习2

三、特征工程 接机器学习1 4、特征降维 4.2、主成分分析PCA 从原始特征空间中找到一个新的坐标系统&#xff0c;使得数据在新坐标轴上的投影能够最大程度地保留数据的方差&#xff0c;同时减少数据的维度。 保留信息/丢失信息信息保留的比例 from sklearn.decomposition imp…