Talk | 南洋理工大学博士后研究员李祥泰:基于Transformer的视觉分割模型总结、回顾与展望

news/2025/4/2 4:37:27/

图片

本期为TechBeat人工智能社区517线上Talk!

北京时间7月27(周四)20:00南洋理工大学博士后研究员—李祥泰的Talk已经准时在TechBeat人工智能社区开播了!

他与大家分享的主题是: 基于Transformer的视觉分割模型总结、回顾与展望,系统性地回顾与总结了Transformer模型。

Talk·信息

主题:基于Transformer的视觉分割模型总结、回顾与展望

嘉宾:南洋理工大学博士后研究员 李祥泰

时间:北京时间 7月27日(周四)20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

 点击下方链接,一键预约TALK!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=794

Talk·介绍

分割是一个基础性质的视觉任务,其目标是把输入的图像,视频,点云等划分成为带有语义性质的区域块。作为一个重要的场景理解任务,分割任务有着广泛的应用价值,包括自动驾驶,机器人导航,短视频分析。

在深度学习时代,分割领域采用以卷积神经网络为基础的全卷积网络,在各个子方向上取得了突破性的进展。近期,以Transformer为基础的一些方法在NLP以及CV领域各个方向上也取得了突破性的进展。相比于CNN模型,Transformer模型结构上更灵活,更适用于多模态,多任务的输入。

在分割与检测领域,基于Transformer的模型在各个基准上也取得了领先的效果。自从ViT和DETR出现后,在各个子方向上,最新的研究方法均建立在Transformer为骨干网络和解码器的基础框架上。鉴于目前这个领域近期快速进展,我们课题组对整个领域做了系统性地回顾与总结。整个Survey的内容包括基础知识与任务设置介绍,Transformer的基础内容介绍,CNN分割模型的系统性回顾,基于Transformer的分割模型回顾,相关基准数据集的评估与测试,以及未来可行的研究方向探索。

Talk大纲

1、近期3-4年内常见的分割方法系统回顾与探索。

2、基于Transformer 的分割与检测方法的系统性回顾,包含图像,视频,点云三个不同的领域。

3、本研究组以及近期相关研究组的Transformer-based Segmentation/Detection 方法的研究。

4、近期与分割大模型相关的研究回顾。

Talk·预习资料

图片

论文链接:

https://arxiv.org/abs/2304.09854

repo:

https://github.com/lxtGH/Awesome-Segmentation-With-Transformer

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

李祥泰

南洋理工大学博士后研究员

南洋理工大学S-lab博士后研究员,博士毕业于北京大学,研究方向包括计算机视觉和机器学习,图像视频分割与检测,多模态场景理解等。曾以第一作者身份在CVPR,ECCV,ICCV,PAMI顶级会议以及期刊上发表一些相关研究。

个人主页: 

https://www.techbeat.net/grzytrkj?id=6355


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区


http://www.ppmy.cn/news/985376.html

相关文章

ICLR 2023 | 用于分布外泛化的拓扑感知鲁棒优化

论文链接:https://openreview.net/pdf?idylMq8MBnAp 代码链接:GitHub - joffery/TRO: The Pytorch implementation for "Topology-aware Robust Optimization for Out-of-Distribution Generalization" (ICLR 2023) 01. 研究背景 近年来&…

Git 绑定账号 和clone

一:环境: 下载安装完成Git,在桌面或文件夹下(在你将要保存代码的位置)右击可以看到Git Bash Here,点击可以进入黑窗口 二:配置公钥 1.查看当前状态(如果已绑定,且知道密码可以登陆,可以直接获取SSH公钥并配置即可拉取代码) git config --list 2.配置全局git用户名和邮箱 …

SpringBoot整合WebService

SpringBoot整合WebService WebService是一个比较旧的远程调用通信框架,现在企业项目中用的比较少,因为它逐步被SpringCloud所取代,它的优势就是能够跨语言平台通信,所以还有点价值,下面来看看如何在SpringBoot项目中使…

scala 短文本相似度计算

simHash类的算法更适合长文本的相似度判断,而短文本可考虑一下几种方法: 一、编辑距离jacard距离 import com.hankcs.hanlp.HanLP import com.hankcs.hanlp.seg.common.Term import java.util.Properties import scala.collection.JavaConverters._obje…

Unity 性能优化三:动画模块、物理模块

目录 动画模块 Mecanim 模块 1.1 Animator active的数量 1.1.1 Culling Mode 1.1.2 Optimize Gameobject 1.1.3 Apply Root Motion 1.1.4 Compute Skinning 1.1.5 Animator Initialize 1.2 Legacy动画 物理模块 2.1 物理更新次数 2.1 减少不必要的Collision 2.5 A…

工具篇-Mysql 性能优化

文章目录 前言一、Mysql 性能问题:1.1 一条sql 的执行流程:1.2 MySQL 可能出现的性能问题: 二、优化:2.1 硬件层面:2.2 软件层面:2.2 .1 mysql 参数配置优化:2.2.1.1 mysql 服务端连接优化&…

结构型设计模式之装饰器模式【设计模式系列】

系列文章目录 C技能系列 Linux通信架构系列 C高性能优化编程系列 深入理解软件架构设计系列 高级C并发线程编程 设计模式系列 期待你的关注哦!!! 现在的一切都是为将来的梦想编织翅膀,让梦想在现实中展翅高飞。 Now everythi…

hive 全量表、增量表、快照表、切片表和拉链表

全量表:记录每天的所有的最新状态的数据,增量表:记录每天的新增数据,增量数据是上次导出之后的新数据。快照表:按日分区,记录截止数据日期的全量数据切片表:切片表根据基础表,往往只…