GFCC

news/2025/3/20 4:36:57/

声学特征: GFCC

1. introduction

ASA
CASA

2. Auditory Features

input(signal) -> STFT -> Gammatone filters -> downsampling(改变采样频率到10KHz) -> loudness-compressed (减少 magnitude) -> output(TF decomposition(T-F decomposition是cochleagram图的一部分,cochleagram在低频有更高的频率分辨率,不同于频谱图的线性频率分辨率。))

input(Gammatone feature(cochleagram图的一帧))-> DCT(做这个operation的原因是解决GF的维度大,并且GFs之间相似度太高(帧和帧之间重复部分多))-> output(GFCC)

可以看到GFCC的过程和倒谱分析基本相同,但是没有取log的过程。

低30位几乎保存了所有信息,所以GFCC取30位就好。

GFCC_delta (动态特征)(比较简单的动态特征就是特征之间的微分,可以反应特征的走向)也取30位,加上GFCC一共60位。

3. Evaluation

在这里插入图片描述

参考论文:Shao Yang and De Liang Wang. “Robust speaker identification using auditory features and computational auditory scene analysis”. In: Proc. of ICASSP. 2008.


http://www.ppmy.cn/news/127467.html

相关文章

G1D54-CRF

一、CRF的输入X是什么?是构造的特征吗? 如此,CRF的x只用于状态函数吗? CRF的例子解释调用代码 机器之心 知乎忆榛 此处线性链条件随机场的特征函数形式被统一了? BilstmCRF,强烈推荐!&#x…

GFS架构

1.GFS是什么 全称是Google File System,Google早期研发的分布式文件系统。 画外音:与分布式文件系统对应的,是单机文件系统,Windows和Linux操作系统都有文件系统。 GFS的设计目标是什么 主要有四个目标: (1) 高可用…

5GC NEF网元功能介绍

IPLOOK 5GC满足3GPP标准,具有更高的速率、更低的时延、支持更高的移动性和更大的连接数等特性。 IPLOOK 5GC系统架构相比4G EPC整体网络架构具有大幅度变化,采用基于云的微服务架构,将传统的网元转换为网络功能(NF), 同时软硬件分…

5GC学习笔记之NF功能简介

参考:协议3GPP 23.501目录 1. AUSF 2. AMF 3. DN 4. UDM 5. UDR 6. UDSF 7. NEF 8. NRF 9. NSSAAF 10. NSSF 11. PCF 12. SMF 13. UPF 14. UCMF 15. AF 16. UE 17. 5G-EIR 18. NWDAF 19. CHF 20. SCP 21. SEPP 22. N3IWF 23. TNGF 24. W-AGF 25. TWIF 1. AUSF AUSF…

基于卷积神经网络的图像去噪(入门篇)

基于卷积神经网络的图像去噪(基础篇) 基础理论知识了解 基于深度学习的图像去噪,区别于传统去噪,但也有一定发展历程。从浅层模型到深度模型,从含噪图像映射去噪图像到含噪图像映射噪声图像(也就是残差学…

fgfd

题记: 每当看到那些触目惊心的画面和文字,内心都是无比的气愤,曾今想着自己是茫茫社会洪流中的一粒沙砾,不可能改变世界,唯有独善其身,改变自己,让自己适应社会,不想到正是这种在很…

GFS存储

文章目录 一.GFS1.特点2.工作流程3.常用卷分类3.1分布式卷3.2条带卷3.3复制卷3.4 分布条带卷3.5 分布复制卷 二.总结 一.GFS GFS(Gluster File System) 是一个可扩展、开源的分布式文件系统(可以很好的体现出弹性伸缩的特点)&…