Language2Pose: Natural Language Grounded Pose Forecasting # 论文阅读

ops/2024/9/23 11:18:20/

URL

https://arxiv.org/pdf/1907.01108

TD;DR

19 年 7 月 cmu 的文章,提出一种基于 natural language 生成 3D 动作序列的方法。通过一个简单的 CNN 模型应该就可以实现

Model & Method

首先定义一下任务:

  • 输入:用户的自然语言,应该是通过词袋模型转换成 word vector
  • 输出:shape = [t, j, 3] 的 tensor,t 表示时间维度,j 表示身体的关节点个数,3 表示 3d 关键点的维度。
    训练过程是这样的:用两个 encoder 分别把 pose 和自然语言模型转换到 latent space,然后在 latent space 层面尝试完全对齐两者,这样就可以把对齐后的 latent 经过 pose decoder 还原到 pose 域内。

在这里插入图片描述

Dataset & Results

使用的训练数据集是一个开源的。

在这里插入图片描述

看起来训练时候文本的分布多样性还是可以的

在这里插入图片描述

Thought

  • 思路有点像 GAN
  • 时间比较老了,但是值得参考,可以用来快速复现 + 攒一个 ppl

http://www.ppmy.cn/ops/39370.html

相关文章

并查集刷题笔记

leetcode-1971:寻找图中是否存在路径 并查集可以解决的问题是:判断两个点是否在同一个集合之中 并查集模版: 最重要的两部:将两点连接以及对某一节点寻根。 一、初始化:{init()} 将每个节点的父节点初始化为自身。 二、寻根…

选择步入式高低温试验室价格除外还需要考虑哪些方面?

选择步入式高低温试验室时,价格是一个非常重要的考虑因素。但是,步入式高低温试验室价格不仅仅是主要决定因素,我们还需要考虑到设备的性能、质量、可靠性以及售后服务等多方面因素。接下来给大家具体介绍的关于选择步入式高低温试验室价格除…

IDEA中的常见注解

下面是对每个注解的详细解释: Override:这个注解用于标记一个方法覆盖或实现了父类或接口中的方法。如果一个方法标记为Override,但实际上没有覆盖或实现父类或接口中的方法,编译器会报错。 Deprecated:这个注解用于标…

常用的启发式算法:探索问题解决的智慧之道

启发式算法是一种通过启发式信息来引导搜索的算法,常用于解决那些在合理时间内难以找到最优解的问题。本文将介绍几种常用的启发式算法,包括贪心算法、遗传算法和模拟退火算法,并提供Java代码实现及测试,帮助读者深入理解这些算法…

用于计算Quartz中,下次触发时间距离当前时间的程序

在 .NET 中,一个 Tick 是100纳秒。所以,你可以将这个 Ticks 值转换为 DateTime,然后与当前时间进行比较,以确定下一次触发的时间。 using System; namespace HelloWorldApplication {class HelloWorld{static void Main(string[]…

《ElementUI 基础知识》el-tree 之“我的电脑”目录结构效果

前言 项目需求,Web 端获取服务器文件夹目录结构。目录数据是调接口获取,本篇略过,直接展现数据! 效果 实现 html 代码 8 - 15 行,自定义节点信息;代码 9 - 14 行,判断 icon 显示&#xff1b…

在IDEA中使用 Spring Initializr 新建 spring boots 项目

【在IDEA中使用 Spring Initializr 新建 spring boots 项目 - CSDN App

ios实现拍摄视频与显示在界面上

1、添加录音和拍摄权限 NSMicrophoneUsageDescription Privacy - Camera Usage Description 2、代码 #import "ViewController.h" #import <AVFoundation/AVFoundation.h> #import <MobileCoreServices/MobileCoreServices.h>// 接下来是你的 ViewCont…