【高维统计N1】绪论

news/2025/2/7 17:58:11/

随着数据量和数据特征数的增加,传统的统计方法无法满足模型和算法的分析。高维统计中的工具和方法对于分析模型和估计真值有着重要作用。

高维统计的notes主要分为两个部分:

  • partA:工具和方法
    • 向量:稀疏性
    • 矩阵:结构性
    • 无限维:结构性
  • partB:一些具体的模型和估计器

这篇notes的主要内容包括:

  • 高维统计的roadmap
  • 高维统计和传统统计的区别
  • 高维的困难(后续)
  • 处理高维的工具(partA)
  • 高维的实际应用

1. roadmap

在这里插入图片描述
partA部分是学习高维统计用到的基本工具和方法,比如基本不等式、concentration of measurement、大数定律、metric entropy

partB部分是具体的模型和估计器,比如协方差估计、稀疏模型、PCA、可分模型、带秩约束的矩阵估计、图模型、非参数模型

除此之外还有更高级的工具和方法,比如location and uniform laws、核方法、minmax lower bounds

2. 为什么要学习高维统计

研究高维的动机:

  • 实际中高维数据的普遍: d < < n d<<n d<<n,特征维度 d d d大于或者远大于样本数量 n n n
  • 模型分析中,“样本量 n n n大,特征维数 d d d固定”的假设不成立
  • 高维时,传统方法经常失效

传统渐进理论VS高维渐进理论VS非渐进界:

  • 传统渐进理论:“ n → ∞ , f i x d n\rightarrow \infty,fix\quad d n,fixd ”的假设,例如大数定理、中心极限定理
  • 高维渐进理论:“ ( n , d ) → ∞ , Φ ( n , d ) f i x o r Φ ( n , d ) → α ∈ [ 0 , ∞ ) (n,d)\rightarrow \infty,\Phi(n,d) \quad fix\quad or \quad \Phi(n,d)\rightarrow \alpha\in [0,\infty) (n,d),Φ(n,d)fixorΦ(n,d)α[0,)”的假设
  • 非渐进理论:“ ( n , d ) f i x e d (n,d)\quad fixed (n,d)fixed”的假设,结论是关于其的高概率陈述

3. 一些高维统计的应用

高维统计对向量到矩阵再到无限维模型的分析都有重要应用。

3.1 线性判别分析

考虑如下二分类问题

x ∈ R d x\in R^d xRd是从两个可能的分布 P 1 , P 2 \mathbb{P}_1,\mathbb{P}_2 P1,P2中抽样得到,若这两个分布已知,则根据对数似然率(log-likelihood ratio) l o g P 2 ( x ) P 1 ( x ) log \frac{\mathbb{P}_2 (x)}{\mathbb{P}_1(x)} logP1(x)P2(x)进行推断

P 1 , P 2 \mathbb{P}_1,\mathbb{P}_2 P1,P2为高斯分布 N ( μ 1 , Σ ) , N ( μ 2 , Σ ) N(\mu_1,\Sigma),N(\mu_2,\Sigma) N(μ1,Σ),N(μ2,Σ),此时对数似然率有:
在这里插入图片描述
误差:
在这里插入图片描述

  • 传统统计角度,即 d d d固定,样本量趋于无穷,由大数定律可知,以下估计量是误差的无偏估计在这里插入图片描述

  • 从高维渐进的角度,即 ( n 1 , n 2 , d ) → ∞ (n_1,n_2,d)\rightarrow \infty (n1,n2,d), d / n i → α > 0 d/n_i\rightarrow \alpha>0 d/niα>0
    在这里插入图片描述

3.2 方差估计

考虑如下方差估计问题

假设随机向量集合 { x 1 , . . . , x n } \{x_1,...,x_n\} {x1,...,xn},每个随机向量 x i x_i xi服从均值 μ = 0 \mu=0 μ=0,方差 Σ \Sigma Σ的iid分布,样本均差矩阵:
在这里插入图片描述

  • 传统统计角度,即 d d d固定,样本量趋于无穷
    在这里插入图片描述
  • 从高维渐进的角度,即 ( n 1 , n 2 , d ) → ∞ (n_1,n_2,d)\rightarrow \infty (n1,n2,d), d / n i → α > 0 d/n_i\rightarrow \alpha>0 d/niα>0
    在这里插入图片描述

3.3 非参数回归


http://www.ppmy.cn/news/152312.html

相关文章

N1_基本介绍

AI&#xff0c;ML&#xff0c;DL AI&#xff1a;目的 machine learning&#xff1a;方法 deep learning&#xff1a;机器学习其中的一部分 机器学习的定义 1. 写一个程序让机器获得学习的能力 2. 从数据中找一个function 步骤 1. 建立一个大的 function set&#xff0c…

【Ci24R1小尺寸 DFN8/2*2】2.4G双向系统超低成本之选

目录 DFN8和SOP8封装的区别 对比Si24R1-新增功能 产品介绍 Ci24R1产品特性 Ci24R1(DFN8) 典型应用原理图 Ci24R1小尺寸封装 DFN8/2*2*0.8mm已上市&#xff0c;并提供相应的demo板供客户测试。&#xff08;详询各销售网络&#xff09; DFN8和SOP8封装的区别 两个封装的端口…

2.4G双向系统超低成本之选--Ci24R1小尺寸 DFN8/2*2

产品介绍   Ci24R1是一颗专为低成本无线应用而设计的无线收发器芯片。工作在2.4G ISM频段&#xff0c;并集成了嵌入式ARQ 基带协议引擎。工作频率范围为2400MHz&#xff5e;2525MHz&#xff0c;共有126个带宽为1MHz的信道。   Ci24R1采用GFSK-FSK数字调制解调技术。数据传输…

N1盒子内置双系统最新 V3.9.9.5 默认1920x1080分辨率版发布

这一版默认分辨率设置为1920x1080&#xff0c;兼容大部分显示设备&#xff0c;新版CE使用19.4版&#xff0c;相对上一版有一些更新&#xff0c;修复一些bug。CE作为一个娱乐级全能播放器还是能满足大部分人的需求。双系统开发目标就是满足本地视频播放和在线视频播放的主要需求…

极米h6和坚果n1pro区别,4k版极米h6和坚果n1选哪个好

极米h6和坚果n1pro区别包括有外观款式、系统、画质、光机、音质、画质调校等&#xff0c;其它像存储、处理器是一样的。至于极米h6和坚果n1pro哪个好&#xff0c;如果考虑画质跟亮度&#xff0c;这两款不相上下&#xff0c;都是4k超清画质&#xff0c;不管是白天还是晚上都是清…

N1刷机指南

N1刷成盒子系统已经很久了&#xff0c;最近手机投屏很是流行&#xff0c;加上运营商plus业务送的视频APP vip券&#xff0c;投屏播放动画片体验非常棒&#xff0c;这样N1盒子基本没有用武之地了&#xff0c;挂在客厅电视后面默默吃灰。想着放弱电箱当软路由也算物尽其用。 刷机…

为全志D1/RISCV64设备移植openwrt-22.03系统

在东山派设备上运行openwrt-22.03 本文记录了笔者为全志D1/RISCV64芯片的东山派STU嵌入式设备编译openwrt-22.03-rc6的过程。截止目前&#xff0c;笔者仅解决了基本的构建的问题&#xff0c;并未深入地进行系统级的开发&#xff08;因此有很多问题&#xff0c;例如&#xff0c…

349元我们应该有什么样的期待-原道N12豪华版 RK2906入手初体验

话说国产平板电脑市场真是风云变幻&#xff0c;去年全志的加入迅速让国产平板电脑的竞争白热化。蓝魔和晶晨这对好基友的合作也渐入佳境&#xff0c;剩下的厂商基本上分为瑞芯微和全志两大阵营&#xff0c;各种版本的额平板电脑层出不穷。以RK2918和全志A10两款方案为代表的平板…