OpenMMLab-AI实战营第二期-课程笔记-Class 1:开营仪式OpenMMLab概述

news/2024/11/3 1:30:16/

Class 1:开营仪式&OpenMMLab概述

文章目录

  • Class 1:开营仪式&OpenMMLab概述
    • 开营仪式
      • OpenMMLab 简介
        • why?
        • when?
        • what?
        • for who?
        • OpenMMLab 总体框架
    • 二十分钟入门计算机视觉开源神器OpenMMLab
      • OpenMMLab概述
      • OpenMMLab各开源算法库详细介绍
        • 明星算法库:MMDetection
        • MMYOLO
      • MMOCR
        • MMDetection3D
        • MMRotate
        • MMSegmentation
        • MMpretrain
        • MMpose
        • MMHuman3D
        • MMAction2
        • MMagic
        • MMDeploy
        • Playground
      • OpenMMLab开源生态

开营仪式

OpenMMLab 简介

why?

随着深度学习、计算机视觉等学科的发展,各大研究机构和公司陆续开源自己的深度学习框架,论文发表同时开源代码也成了行业内的习惯。

when?

OpenMMLab诞生于2018年,是一个由中国开发者主导,有国际影响力的人工智能·计算机视觉开源算法体系。

image-20230601105943949

相比之下,OpenMMLab是开源社区的后起之秀。

官网:https://openmmlab.com

Github:https://github.com/open-mmlab

公众号:OpenMMLab

what?

那么OpenMMLab中都有些什么呢?

image-20230601110213824

OpenMMLab累计开源超过30个算法库、2400个预训练模型,涵盖图像识别分类、目标检测、图像分割、姿态估计、视频理解、OCR、3D目标检测、3D人体姿态估计、模型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机视觉任务,在Github上累计获得十万颗star,超过了Pytorch。

for who?

无论是巨头公司做商业产品,研究机构发顶会论文,各行各业做AI应用,大学生做毕业设计,中小学生参加科创竞赛,都可以站在OpenMMLab巨人肩膀上,开箱即用,开发自己的人工智能项目。 也许大家的下一个课程作业,下一场kaggle竞赛,下一篇毕业论文,下一家入职的公司,就能用到OpenMMLab。

image-20230601110809806

OpenMMLab 总体框架

万丈高楼平地起

image-20230601110515797

OpenMMLab所有算法库都在Github上免费开源,并且有专人维护,我们可以进入每个算法库的Github主页,点star或者提issue、提PR,下载所有的源代码和模型文件。

二十分钟入门计算机视觉开源神器OpenMMLab

课程回放链接:二十分钟入门计算机视觉开源神器OpenMMLab

By:同济子豪兄

OpenMMLab概述

无论身处什么领域,都可以站在OpenMMLab巨人肩膀上,使用开箱即用的模型开发自己的人工智能项目~

image-20230601112828096

OpenMMLab各开源算法库详细介绍

明星算法库:MMDetection

image-20230601113044896

首推的就是目标检测算法库MMDetection,它可以解决目标检测实例分割全景分割和目标追踪任务
这是OpenMMLab在业界最有影响力的算法库,在github上有2万多star~

image-20230601113309171

OpenMMLab是开源算法体系,它已经提供了各个计算机视觉方向的大量开箱即用的预训练模型和算法。也就是说
OpenMMLab的算法研究员已经帮我们把这些cv任务的常见算法都现好了!

MMDetection被广泛用于学术界和工业界,很多顶会论文,很多比赛的冠军,很多商业落地的产品都是基于MMDetection实现的!

image-20230601114208100

MMYOLO

还有一个做目标检测的算法库叫做MMYOLO,它是专门用来解决YOLO目标检测问题的,它的特点就是特别快!!!

image-20230601114326674

很多同学做毕业设计,其实就是标注一个自己的目标检测数据集,然后用MMYOLO去跑一下,训练一个模型,然后实时的去预测!

MMOCR

OpenMMLab还有一个文字检测识别的算法库,叫做MMOCR,那这也是计算机视觉很古老的一个经典问题了,它主要解决三类问题,文本检测就是把图像上的文本区域抠出来,或者说画出来,文本识别呢是把文字的内容识别出来,关键信息提取呢是对一些结构化的票据,证件牌照来进行信息的提取。

image-20230601144619650

MMDetection3D

MMDetection3D是专门做3D目标检测的算法库,这个在无人驾驶中用的特别多,要通过激光雷达和毫米波雷达,感知无人驾驶车周围的3d点云数据,来进行3d目标检测,很多无人驾驶的初创公司都使用MMDetection3D来实现自己的无人驾驶算法。

image-20230601144912996

MMRotate

MMRotate是专门做旋转目标检测算法库,在传统的目标检测框是横平竖直的,但是在旋转目标检测框有方向,比如说不同方向的车,不同方向的船,那这是一个比较小众的研究领域,如果你的研究领域恰恰是旋转框目标检测,那MMRotate将是你最佳的学习资料!

image-20230601145137796

MMSegmentation

MMSegmentation是专门做图像分割,特别是语义分割的算法库,在街景,在无人驾驶遥感图像医疗领域,语义分割都是非常重要的算法,任务本质上就是给每一个像素进行分类。可以用它来识别医疗影像中的病灶区域,肿瘤的区域,遥感图像中河流山地农田的面积,街景数据里边的马路牙,交通标志和其他车的位置以及车道线,所以语义分割是一个非常常用的计算机视觉任务,MMSegmentation提供了600多个预训练模型,复现了40多篇的经典和前沿的语义分割的论文,那如果你想入门语义分割领域,MMSegmentation将是你最佳的学习资料!

image-20230601145441798

MMpretrain

MMpretrain呢是做图像分类,预训练和多模态的算法库,那图像分类也是计算机视觉解决的,基础任务之一,用MMpretrain可以实现图像分类,图像描述,视觉问答,视觉定位和视觉检索。

image-20230601145601267

MMpose

MMPose 是一款基于 PyTorch 的姿态分析的开源工具箱,所谓的姿态估计其实就是关键点检测,比如说把这么一个人各个的关节骨架的点识别出来,然后串成一个火柴人,那这就叫做姿态估计,通过姿态估计,我们就能定量的去衡量这个人的行为动作,比如说健身的打分~

image-20230601150044300

MMHuman3D

MMHuman3D 是一款基于 PyTorch 的人体参数化模型的开源工具箱。

所谓的三维人体姿态估计就是要用一个3d的模型去包络出人体,我们就可以用一个3d的数字人去拟合一个真人,特别是在动作捕捉领域和虚拟现实领域,有了一个3d的人,就能跟真实世界的人进行对应了,比如说在足球运动里,在交通事故的模拟中,甚至在很多的竞技类运动中,都可以用到这个算法。

image-20230601150436313

MMAction2

MMAction2 是一款基于 PyTorch 的视频理解开源工具箱,MMAction2 支持多种视频理解任务,包括动作识别,时序动作检测,时空动作检测以及基于人体姿态的动作识别。

image-20230601150539867

MMagic

MMagic 是基于 PyTorch 的图像&视频编辑和生成开源工具箱,MMagic 支持了流行的图像修复、图文生成、3D生成、图像修补、抠图、超分辨率和生成等任务的应用。特别是 MMagic 支持了 Stable Diffusion 的微调和许多激动人心的 diffusion 应用,例如 ControlNet 动画生成。MMagic 也支持了 GANs 的插值,投影,编辑和其他流行的应用。

image-20230601150752720

MMDeploy

MMDeploy 提供了一系列工具,帮助我们更轻松的将 OpenMMLab 下的算法部署到各种设备与平台上。

image-20230601151409946

Playground

OpenMMLab还有一个趣味应用的游乐场,叫做playground,在playground里有很多有趣的项目,其中一些项目也很前沿,比如说结合最新的这个SAM视觉大模型,你可以用它来辅助你标注,用它来做视频实例分割。这样。就可以结合我们其他的算法库,来开发出你自己的有趣又有用的好玩应用!

image-20230601151610721

OpenMMLab开源生态

全球有超过1800个开发者参与了OpenMMLab开源算法库的代码贡献;OpenMMLab的使用者涵盖了科研院所,高校和各行各业的商业公司;同时有一些大家耳熟能详的,影响力非常大的开源项目,也是基于OpenMMLab开发的!

image-20230601152028692

http://www.ppmy.cn/news/144066.html

相关文章

在spring容器启动后监听事件ApplicationReadyEvent

概述 经常会在业务中遇到需要在项目启动后刷新/预热一些数据的要求。 常见可以监听ApplicationReadyEvent和ContextRefreshedEvent. 但是因为常见的springboot项目都依赖的springmvc,所以实际上有2个容器,spring的ioc容器是springmvc的父容器。 而且C…

集权攻击系列:如何利用PAC新特性对抗黄金票据?

黄金票据简介 黄金票据是一种常见的域内权限维持手段,这种攻击主要是利用了Kerberos认证过程中TGT票据由KRBTGT用户的hash加密的特性,在掌握KRBTGT用户密码之后可以通过签发一张高权限用户的TGT票据,再利用这个TGT向KDC获取域内服务的ST来实…

dllreg解除服务器注册,最简单的修复IE浏览器的方法:注册表重新注册DLL

IE损坏,有修复技巧 我们在使用IE浏览器的过程中,有时候会遇到一些意想不到的事情,那就是突然IE失效了,或者明显不正常了。例如,点击链接但没有反应;在开始菜单的运行对话空中输入URL,但不能弹出…

ie浏览器怎么打开html,IE浏览器无法打开网页如何解决

在网络非常良好的情况下IE无法打开网页一定是让每个用户非常头痛,引起IE无法上网的原因是多种的,有可能是木马入侵绑架了IE浏览器,有可能是IE版本过旧,有可能是浏览器与插件不兼容,还有可能是网站的服务器压力过大也会…

手机浏览器服务器修复,手机IE浏览器怎么修复

手机已然成为我们生活中必备产品之一,自然手机浏览器的使用频率一样不低。很多时候,在我们手机有网络的情况下,我们可以通过手机浏览器帮助我们更方便的浏览一些网页。而导致我们手机浏览器打不开的原因有很多,我们可以通过以下方…

IE浏览器F12无法使用

原文链接https://zhhll.icu/2020/windows/IE浏览器F12无法使用/ 这是很久之前遇到的一个问题了,当初升级完IE浏览器之后出现的问题(当然现在我也好久没有用过IE浏览器了,现在应该只有那些老项目还在使用IE浏览器了) 错误的文字内容:Diagnos…

防劫持工具,介绍几款浏览器劫持修复工具

相信很多人都会自己设定浏览器的主页,但是有时候,我们会发现打开自己浏览器设置好的主页,结果被莫名其妙的跳转到其他的网址,这种情况大多是浏览器劫持。遇到这种情况,即使锁定主页也没法解决,我们可以借助…

ie浏览器经典设置

一、打不开二级链接,需要重新注册几个动态链接文件 单击"开始→运行",依次运行"regsvr32 actxprxy.dll"和"regsvr32 shdocvw.dll"将这两个DLL文件注册,然后重启系统。如果还不行,则可以将mshtml.dl…