AI计算机视觉是人工智能的一个领域,它使用机器学习和深度学习使计算机能够以与人类相同的方式查看、识别和分析照片和视频中的事物。计算视觉在自动化 AI 视觉检测、远程监控和自动化方面正迅速普及,AI机器视觉识别如何在行业中应用,小编将和大家一起探讨。
我们专业AI视觉识别10年,开发 +V (ivyquyi)电话:15017915479 非项目咨询勿扰
计算机视觉对各行各业的公司产生了巨大影响,从零售到安全、医疗保健、汽车、制造、物流和农业。
使用Viso Suite构建的计算机视觉应用程
(1) 相机获取视觉数据,(2) 用于处理图像的机器学习模型,以及 (3) 条件逻辑来自动化特定应用程序的用例。将人工智能部署到边缘设备,即所谓的边缘智能,有助于实现计算机视觉的可扩展、高效、稳健、安全和私有的实现。
制造业中的计算机视觉
在制造业中,图像识别应用于人工智能视觉检测、质量控制、远程监控和系统自动化。
生产力分析
生产力分析跟踪工作场所变化的影响,员工如何花费时间和资源,并实施各种工具。这些数据可以为时间管理、工作场所协作和员工生产力提供有价值的见解。计算机视觉精益管理策略旨在使用基于相机的视觉系统客观地量化和评估流程。
工业制造中的隐私保护计算机视觉
设备外观检查
用于视觉检测的计算机视觉是智能制造的关键策略。基于视觉的检测系统在个人防护设备 (PPE)的自动检测中也越来越受欢迎,例如面罩检测或头盔检测。计算视觉有助于监控建筑工地或智能工厂对安全协议的遵守情况。
质量管理
智能相机应用程序提供了一种可扩展的方法来实现智能工厂中生产过程和装配线的自动化视觉检查和质量控制。因此,与费力的人工检查相比,深度学习使用实时对象检测来提供更好的结果(检测精度、速度、客观性、可靠性)。
与传统的机器视觉系统相比,人工智能视觉检测使用的机器学习方法非常稳健,不需要昂贵的特殊相机和不灵活的设置。因此,人工智能视觉方法在多个地点和工厂之间具有很强的可扩展性。
技能培训
视觉系统的另一个应用领域是优化工业生产和人机交互中的装配线操作。对人类行为的评估可以帮助构建与不同操作步骤相关的标准化行为模型,并评估受过训练的工人的表现。
通过提高工作绩效、提高生产效率(精益优化)以及更重要的是发现危险行为以降低事故率,自动评估工人的行为质量可能是有益的。
癌症检测
机器学习被纳入医疗行业,用于乳腺癌和皮肤癌检测等目的。例如,图像识别允许科学家检测癌性和非癌性图像之间的细微差异,并诊断来自磁共振成像 (MRI) 扫描和输入照片的恶性或良性数据。
COVID-19 诊断
计算机视觉可用于冠状病毒控制。多种深度学习计算机视觉模型可用于基于 X 射线的 COVID-19 诊断。使用数字胸部 X 射线摄影 (CXR) 图像检测 COVID-19 病例的最流行的一种称为COVID-Net,由加拿大达尔文 AI 开发。
细胞分类
医疗用例中的机器学习用于对 T 淋巴细胞与结肠癌上皮细胞进行高精度分类。因此,ML 有望显着加速结肠癌疾病识别过程,并且在创建后几乎没有成本。
运动分析
即使没有医生分析,也可以使用深度学习模型和计算机视觉检测神经和肌肉骨骼疾病,例如即将到来的中风、平衡和步态问题。分析患者运动的姿势估计计算机视觉应用程序可帮助医生轻松诊断患者并提高准确性。
口罩检测
蒙面人脸识别用于检测口罩和防护设备的使用情况,以限制冠状病毒的传播。同样,计算机视觉系统帮助各国实施口罩作为控制冠状病毒疾病传播的控制策略。
出于这个原因,优步等私营公司已经创建了计算机视觉功能,例如面部检测,并在其移动应用程序中实施,以检测乘客是否戴口罩。此类计划使公共交通在冠状病毒大流行期间更加安全。
肿瘤检测
脑肿瘤可以在 MRI 扫描中看到,并且经常使用深度神经网络检测到。利用深度学习的肿瘤检测软件对医疗行业至关重要,因为它可以高精度检测肿瘤以帮助医生做出诊断。
疾病进展评分
计算机视觉可用于识别重症患者以指导医疗护理(重症患者筛查)。发现感染 COVID-19 的人呼吸更快。
带有深度摄像头的深度学习可用于识别异常的呼吸模式,以对感染 COVID-19 病毒的人进行准确且不显眼的大规模筛查。
医疗保健和康复
物理治疗对于中风幸存者和运动损伤患者的恢复训练很重要。主要挑战与医疗专业人员、医院或机构的监督成本有关。
带有基于视觉的康复应用的家庭训练是首选,因为它允许人们在私人和经济的情况下进行运动训练。在计算机辅助治疗或康复中,可以应用人体动作评估来帮助患者在家训练,指导他们正确执行动作,并防止进一步受伤。探索更多运动和健身应用。
医疗技能培训
计算机视觉应用程序用于评估自学平台上专家学习者的技能水平。例如,已经为外科教育开发了基于模拟的外科培训平台。
此外,动作质量评估技术使得开发自动评估外科学生表现的计算方法成为可能。因此,可以向个人提供有意义的反馈信息,并指导他们提高技能水平。
农业中的计算机视觉
动物监测
利用计算机视觉进行动物监测是智能农业的关键策略。机器学习使用摄像头流来监控特定牲畜(例如猪、牛或家禽)的健康状况。智能视觉系统旨在分析动物行为以提高动物的生产力、健康和福利,从而影响该行业的产量和经济效益。
农场自动化
诸如收获、播种和除草机器人、自动拖拉机和用于监控远程农场的视觉系统等技术,用于视觉检查的无人机可以在劳动力短缺的情况下最大限度地提高生产力。通过使用 AI 视觉自动化人工检查、减少生态足迹和改进决策流程,可以显着提高盈利能力。
用于动物监测的农业计算机视觉应用
作物监测
水稻、小麦等重要农作物的产量和品质决定了粮食安全的稳定性。传统上,作物生长监测主要依靠人的主观判断,不及时也不准确。计算机视觉应用程序允许持续且非破坏性地监测植物生长和对营养需求的反应。
与人工操作相比,应用计算机视觉技术对作物生长情况进行实时监测,可以更早地发现作物因营养不良引起的细微变化,为及时调控提供可靠、准确的依据。
此外,计算机视觉应用程序可用于测量植物生长指标或确定生长阶段。
开花检测
小麦抽穗期是小麦作物最重要的参数之一。可以使用自动计算机视觉观察系统来确定小麦抽穗期。
计算机视觉技术具有成本低、误差小、效率高、鲁棒性好、可动态连续分析等优点。
种植园监测
在智能农业中,无人机图像的图像处理可用于远程监控棕榈油种植园。借助地理空间正射影像,可以确定种植园的哪一部分肥沃,可种植农作物。
还可以确定在生长方面不太肥沃的区域和完全没有生长的种植园部分。OpenCV是用于此类图像处理任务的流行工具。
昆虫检测
飞虫的快速准确识别和计数非常重要,特别是对于害虫防治。然而,传统的飞行昆虫的人工识别和计数效率低且劳动强度大。基于视觉的系统允许对飞行昆虫进行计数和识别(基于You Only Look Once (YOLO)对象检测和分类)。
植物病害检测
疾病严重程度的自动和准确估计对于粮食安全、疾病管理和产量损失预测至关重要。深度学习方法避免了劳动密集型的特征工程和基于阈值的图像分割。
开发了使用深度卷积神经网络 (CNN) 应用程序的基于图像的自动植物病害严重程度估计,例如,用于识别苹果黑腐病。
自动除草
杂草在农学中被认为是有害植物,因为它们与农作物竞争获取土壤中的水、矿物质和其他养分。仅在杂草的确切位置喷洒杀虫剂可大大降低污染农作物、人类、动物和水资源的风险。
智能检测和清除杂草对农业发展至关重要。基于神经网络的计算机视觉系统可用于识别马铃薯植物和三种不同的杂草以进行现场特定喷洒。
自动收获
传统农业依赖机械作业,以人工收割为主,成本高、效率低。但近年来,随着计算机视觉技术的不断应用,基于计算机视觉技术的收割机械、采摘机器人等高端智能农业收割机在农业生产中应运而生,在农业生产中迈出了新的一步。自动收割庄稼。
收获作业的主要重点是确保收获过程中的产品质量,以最大限度地提高市场价值。计算机视觉驱动的应用包括在温室环境中自动采摘黄瓜或在自然环境中自动识别樱桃。
农产品质量检测
农产品质量是影响市场价格和顾客满意度的重要因素之一。与手动检查相比,计算机视觉提供了一种执行外部质量检查的方法。
AI视觉系统能够以相对较低的成本和高精度实现高度的灵活性和可重复性。例如,基于机器视觉和计算机视觉的系统被用于快速测试甜柠檬损害或马铃薯的无损质量评估。
灌溉管理
基于利用技术通过耕作、施肥或灌溉提高土壤生产力的土壤管理对现代农业生产具有显着影响。通过图像获取有关园艺作物生长的有用信息,可以准确估算土壤水分平衡,实现精准灌溉规划。
计算机视觉应用程序提供有关灌溉管理水平衡的宝贵信息。基于视觉的系统可以处理无人机(UAV)拍摄的多光谱图像并获得植被指数(VI),为灌溉管理提供决策支持。
无人机农田监测
实时农田信息和对该信息的准确理解在精准农业中发挥着基础性作用。近年来,无人机(UAV)作为一种快速发展的技术,已经允许获取具有高分辨率、低成本和快速解决方案的农业信息。
此外,配备图像传感器的无人机平台可提供有关农业经济和作物状况的详细信息(例如,连续作物监测)。因此,无人机遥感有助于农业生产的增加和农业成本的降低。
产量评估
通过计算机视觉技术的应用,实现了农田土壤管理、成熟度检测、产量估算等功能。此外,现有技术可以很好地应用于光谱分析和深度学习等方法。
这些方法大多具有精度高、成本低、可移植性好、集成性好、可扩展性好等优点,可为管理决策提供可靠支持。一个例子是使用计算机视觉通过水果检测和计数来估计柑橘类作物的产量。
此外,可以通过处理使用无人机获得的图像来预测甘蔗田的产量。
交通运输中的计算机视觉
车辆分类
用于自动车辆分类的计算机视觉应用具有悠久的历史。几十年来,用于车辆计数的自动车辆分类技术一直在发展。深度学习方法使使用普通、廉价的安全摄像头实现大规模交通分析系统成为可能。
借助快速增长的廉价传感器,例如闭路电视 (CCTV) 摄像机、光探测和测距 (LiDAR),甚至热成像设备,可以同时在多个车道上检测、跟踪和分类车辆。通过将热成像、LiDAR 成像等多个传感器与 RGB 摄像头(普通监控、IP 摄像头)相结合,可以提高车辆分类的准确性。
此外,还有多个专业;例如,用于工程车辆检测的基于深度学习的计算机视觉解决方案已被用于安全监控、生产力评估和管理决策等目的。
使用对象检测和分类的车辆检测和计数
移动违规检测
执法机构和市政当局正在增加基于摄像头的道路监控系统的部署,以减少不安全的驾驶行为。可能最关键的应用是在危险区域检测停止的车辆。
此外,在智慧城市中越来越多地使用计算机视觉技术,这些技术涉及自动检测违规行为,例如超速、闯红灯或停车标志、错误驾驶和非法转弯。
流量分析
交通流分析已被广泛研究用于智能交通系统 (ITS),使用侵入性方法(标签、路面下线圈等)和非侵入性方法(如摄像头)。
随着计算机视觉和人工智能的兴起,视频分析现在可以应用于无处不在的交通摄像头,这可以在 ITS 和智慧城市中产生巨大的影响。可以使用计算机视觉手段观察交通流量,并测量交通工程师所需的一些变量。
停车占用检测
视觉停车位监控用于停车场占用检测。特别是在智慧城市中,计算机视觉应用为基于深度卷积神经网络 (CNN) 的视觉停车场占用检测提供分散且高效的解决方案。
存在多个用于停车场检测的数据集,例如PKLot 和 CNRPark-EXT。此外,基于视频的停车管理系统已经使用立体成像 (3D) 或热像仪实施。基于摄像头的停车场检测的优势在于大规模使用的可扩展性、廉价的维护和安装,特别是因为可以重复使用安全摄像头。
基于视觉的停车场占用检测
自动车牌识别 (ALPR)
许多现代交通和公共安全系统依赖于从静止图像或视频中识别和提取车牌信息。自动车牌识别 (ALPR)在许多方面改变了公共安全和交通行业。
这种车牌识别系统可实现现代收费道路解决方案,通过自动化节省大量运营成本,甚至在市场上启用全新的功能(例如警用巡洋舰安装的车牌读取装置)。
OpenALPR是一个流行的自动车牌识别库,基于对车辆牌照的图像或视频输入的光学字符识别 (OCR)。
车辆重新识别
随着人员重新识别的改进,智能交通和监控系统旨在为使用基于视觉的车辆重新识别的车辆复制这种方法。提供唯一车辆 ID 的传统方法通常是侵入式的(车载标签、蜂窝电话或 GPS)。
对于收费站等受控环境,自动车牌识别 (ANPR)可能是准确识别单个车辆的最合适技术。但是,车牌可能会更改和伪造,并且 ALPR 不能反映车辆的显着特征,例如标记或凹痕。
基于图像的识别等非侵入式方法具有很大的潜力和需求,但在实际应用中还远未成熟。大多数现有的基于视觉的车辆重新识别技术都是基于车辆外观,例如颜色、纹理和形状。
今天,识别汽车品牌或年份型号等细微的、独特的特征仍然是一个未解决的挑战。
行人检测
行人的检测对于智能交通系统 (ITS) 至关重要。用例范围从自动驾驶到基础设施监控、交通管理、交通安全和效率以及执法。
行人检测涉及多种类型的传感器,例如传统的闭路电视或 IP 摄像头、热成像设备、近红外成像设备和车载 RGB 摄像头。人检测算法或人检测器可以基于红外签名、形状特征、梯度特征、机器学习或运动特征。
依靠深度卷积神经网络 ( CNN ) 的行人检测取得了重大进展,即使是在检测严重遮挡的行人时也是如此。
基于深度学习进行行人检测
交通标志检测
计算机视觉应用程序用于交通标志检测和识别。视觉技术用于从不同的交通场景中分割交通标志(使用图像分割),并采用深度学习算法来识别和分类交通标志。
防撞系统
车辆检测和车道检测是最先进的驾驶员辅助系统 (ADAS) 不可或缺的一部分。深度神经网络最近被用于研究深度学习及其在自主防撞系统中的应用。
路况监测
开发了基于计算机视觉的缺陷检测和状况评估来监控混凝土和沥青土木基础设施。路面状况评估提供了信息,以使有关路面网络管理的更具成本效益和一致的决策。
通常,路面遇险检查是使用复杂的数据收集车辆和/或地面测量进行的。开发了一种用于开发沥青路面状况指数的深度机器学习方法,以通过计算机视觉提供一种独立于人类、廉价、高效和安全的自动路面故障检测方法。
计算机视觉的另一个应用是对道路进行视觉检查,以检测道路坑洼并分配道路维护,以减少相关车辆事故的数量。
基础设施状况评估
为确保民用基础设施的安全性和可用性,目视检查和评估其物理和功能状况至关重要。基于计算机视觉的民用基础设施检查和监控系统自动将图像和视频数据转换为可操作的信息。
计算机视觉检测应用程序用于识别结构部件、表征局部和全局可见损伤,并检测参考图像的变化。这种监测应用包括应变和位移的静态测量以及模态分析的位移动态测量。
驾驶员注意力检测
分心驾驶检测——例如做白日梦、使用手机和看车外的东西——占全球道路交通死亡人数的很大一部分。人工智能用于了解驾驶行为,找到减轻道路交通事故的解决方案。
道路监控技术用于观察乘客车厢违规行为,例如,在道路监控中基于深度学习的安全带检测中。车载驾驶员监控技术侧重于视觉传感、分析和反馈。
驾驶员行为既可以直接从面向驾驶员的内部摄像头推断,也可以从外部面向场景的摄像头或传感器间接推断。基于面向驾驶员的视频分析技术通过凝视方向、头部姿势估计和面部表情监测算法来检测面部和眼睛。
人脸检测算法已经能够检测出注意力集中和注意力不集中的面孔。深度学习算法可以检测聚焦和不聚焦的眼睛之间的差异,以及在影响下驾驶的迹象。
用于实时分心驾驶员姿势分类的多个基于视觉的应用程序与多种深度学习方法(RNN 和 CNN)用于实时分心检测。
用于车辆计数的计算机视觉应用
零售业的计算机视觉
客户跟踪
深度学习算法可以实时处理视频流,以分析零售店的客流量。基于摄像头的方法允许重复使用普通、廉价的安全监控摄像头的视频流。机器学习算法以匿名和非接触方式检测人员,以分析在不同区域花费的时间、等待时间、排队时间,并评估服务质量。
客户行为分析有助于改善零售店布局、提高客户满意度并客观量化多个地点的关键指标。
计算机视觉生成热图来分析客户行为和人
人数统计
计算机视觉算法使用数据示例进行训练,以检测人类并在检测到人类时对其进行计数。这种人数统计技术对于商店收集有关其商店成功的数据很有用,也可以应用于有关 COVID-19 的情况,即一次允许有限数量的人进入商店。
盗窃检测
零售商可以使用自动分析场景的计算机视觉算法检测可疑行为,例如游荡或进入禁区。
等待时间分析
为了防止不耐烦的顾客和无休止的等候队伍,零售商正在实施排队检测技术。队列检测使用摄像头来跟踪和统计排队的购物者人数。一旦达到客户的门槛,系统就会发出警报,要求店员打开新的结账。
社交隔离
为了确保遵守安全预防措施,公司正在使用距离探测器。摄像头跟踪员工或客户的移动,并使用深度传感器来评估他们之间的距离。然后,根据他们的位置,系统会在人周围画一个红色或绿色的圆圈。通过深度学习了解更多关于社交距离监控的信息。
使用计算机视觉进行社交距离检测
运动中的计算机视觉
玩家姿势追踪
AI 视觉可以识别视频片段或实时视频流中的多帧人体运动和姿势之间的模式。例如,人体姿势估计已应用于游泳者的真实世界视频,其中单个固定摄像机在水面上方和下方拍摄。这些视频记录可用于定量评估运动员的表现,而无需手动注释每个视频帧中的身体部位。因此,卷积神经网络用于自动推断所需的姿势信息并检测运动员的游泳方式。
无标记动作捕捉
相机使用深度学习的姿势估计来跟踪人体骨骼的运动,而无需使用传统的光学标记和专用相机。这在运动捕捉中至关重要,在这种情况下,玩家不会被额外的表演捕捉服装或设备所累。
在医疗保健应用中使用深度学习进行姿势
绩效评估
运动特定动作的自动检测和识别克服了与手动性能分析方法相关的限制(主观性、量化、可重复性)。计算机视觉数据输入可与穿戴式传感器和可穿戴设备的数据结合使用。流行的用例是游泳分析、高尔夫挥杆分析、地面跑步分析、高山滑雪以及板球保龄球的检测和评估。
足球计算机视觉球和运动中的球员检测
多人姿势跟踪
使用计算机视觉算法,可以从单目(单摄像头镜头)和多视角(多个摄像头镜头)运动视频数据集计算多个团队成员的人体姿势和身体运动。估计运动中多名运动员的 2D 或 3D 姿势的潜在用途是广泛的,包括性能分析、动作捕捉以及广播和沉浸式媒体中的新应用。
中风识别
计算机视觉应用程序能够检测和分类击球(例如, 乒乓球中的击球分类)。运动识别或分类涉及对已识别实例的进一步解释和标记预测(例如,将网球击球区分为正手或反手)。
中风识别旨在为教师、教练员和运动员提供工具来分析乒乓球比赛并更有效地提高运动技能。
基于深度学习的姿势估计进行玩家跟踪
实时辅导
基于计算机视觉的体育视频分析有助于提高资源效率并减少时间限制任务的反馈时间。参与时间密集型符号任务的教练和运动员,包括游泳赛后分析,可以在赛事计划的下一场比赛之前从快速、客观的反馈中受益。
运动锻炼的自我训练系统是最近出现的一个类似的计算机视觉研究课题。虽然自我训练在体育锻炼中必不可少,但练习者可能在没有教练指导的情况下取得有限的进步。
例如,一个瑜伽自我训练应用程序旨在指导练习者正确执行瑜伽姿势,帮助纠正不良姿势并防止受伤。此外,基于视觉的自我训练系统可用于指导如何调整身体姿势。
运动队分析
专业团队运动的分析师定期进行分析,以获得对球员和团队行为的战略和战术洞察力(识别弱点、评估表现和提高潜力)。然而,手动视频分析通常很耗时,分析师需要记住和注释场景。
计算机视觉技术可用于从视频材料中提取轨迹数据,并应用运动分析技术为区域、团队形成、事件和球员分析(例如,在足球团队运动分析中)得出相关的团队运动分析措施。
球追踪
实时对象跟踪用于检测和捕获对象的运动模式。球的轨迹数据是评估球员表现和分析比赛策略的最基本和最有用的信息之一。因此,球运动的跟踪是深度学习和机器学习的一种应用,用于检测并跟踪视频帧中的球。
例如,球跟踪在大范围运动(例如足球)中很重要,可以帮助新闻播音员和分析师更快地解释和分析体育比赛和战术。
球门线技术
基于摄像头的系统可用于确定是否进球,以支持裁判的决策。与传感器不同,基于 AI 视觉的方法是非侵入性的,不需要对典型的足球设备进行更改。
这种球门线技术系统基于高速摄像机,其图像用于对球的位置进行三角测量。一种球检测算法,它分析候选球区域以识别球图案。
运动中的事件检测
深度学习可用于检测非结构化视频中的复杂事件,例如在足球比赛中进球、未遂事件或比赛中其他不得分的激动人心的部分。该技术可用于体育转播中的实时事件检测,适用于广泛的野外运动。
亮点生成
制作体育赛事集锦是一项劳动密集型工作,需要一定程度的专业化,尤其是在具有一套复杂规则且需要长时间比赛的体育项目中(例如,板球)。一个应用示例是使用事件驱动和基于兴奋的功能自动生成板球比赛亮点,以识别和剪辑板球比赛中的重要事件。
另一个应用是使用具有计算机视觉的多模型兴奋功能自动管理高尔夫亮点。
体育活动评分
深度学习方法可用于体育活动评分,以评估运动员的动作质量(Deep Features for Sports Activity Scoring)。例如,自动体育活动评分可用于跳水、花样滑冰或跳马(ScoringNet是用于体育活动评分的 3D CNN 网络应用程序)。
例如,潜水评分应用程序通过评估运动员潜水表现的质量得分来工作:在整个潜水过程中,运动员的双脚是否并拢以及脚趾是否笔直都很重要。