《统计学习方法》——朴素贝叶斯参数的极大似然估计

news/2024/12/2 9:50:27/

参考资料:

  • 《统计学习方法》李航
  • https://www.zhihu.com/question/33959624

Step1. 似然函数

在朴素贝叶斯模型中,我们需要通过训练集确定的参数为 θ k = P ( y = c k ) \theta_k=P(y=c_k) θk=P(y=ck) μ j l k = P ( x ( j ) = a j l ∣ y = c k ) \mu_{jlk}=P(x^{(j)}=a_{jl}|y=c_k) μjlk=P(x(j)=ajly=ck)

似然函数:
L ( θ , μ ) = ∏ i = 1 N P ( x i , y i ) = ∏ i = 1 N P ( y i ) P ( x i ∣ y i ) (乘法公式) = ∏ i = 1 N ( P ( y i ) ∏ j = 1 n P ( x i ( j ) ∣ y i ) ) (条件独立假设) = ∏ i = 1 N ∏ k = 1 K ( P ( y = c k ) ∏ j = 1 n P ( x i ( j ) ∣ y i = c k ) ) I ( y i = c k ) = ∏ i = 1 N ∏ k = 1 K ( θ k ∏ j = 1 n ∏ l = 1 L j P I ( x i ( j ) = a j l ) ( x ( j ) = a j l ∣ y i = c k ) ) I ( y i = c k ) = ∏ i = 1 N ∏ k = 1 K ( θ k ∏ j = 1 n ∏ l = 1 L j μ j l k I ( x i ( j ) = a j l ) ) I ( y i = c k ) \begin{align} L(\theta,\mu)&=\prod\limits_{i=1}^{N}P(x_i,y_i)\\ &=\prod\limits_{i=1}^{N}P(y_i)P(x_i|y_i)(乘法公式)\\ &=\prod\limits_{i=1}^{N}\Big(P(y_i)\prod\limits_{j=1}^{n}P(x^{(j)}_i|y_i)\Big)(条件独立假设)\\ &=\prod\limits_{i=1}^{N}\prod\limits_{k=1}^{K}\Big(P(y=c_k)\prod\limits_{j=1}^{n}P(x^{(j)}_i|y_i=c_k)\Big)^{I(y_i=c_k)}\\ &=\prod\limits_{i=1}^{N}\prod\limits_{k=1}^{K}\Big(\theta_k\prod\limits_{j=1}^{n}\prod\limits_{l=1}^{L_j}P^{I(x^{(j)}_i=a_{jl})}(x^{(j)}=a_{jl}|y_i=c_k)\Big)^{I(y_i=c_k)}\\ &=\prod\limits_{i=1}^{N}\prod\limits_{k=1}^{K}\Big(\theta_k\prod\limits_{j=1}^{n}\prod\limits_{l=1}^{L_j}\mu_{jlk}^{I(x^{(j)}_i=a_{jl})}\Big)^{I(y_i=c_k)}\\ \end{align} L(θ,μ)=i=1NP(xi,yi)=i=1NP(yi)P(xiyi)(乘法公式)=i=1N(P(yi)j=1nP(xi(j)yi))(条件独立假设)=i=1Nk=1K(P(y=ck)j=1nP(xi(j)yi=ck))I(yi=ck)=i=1Nk=1K(θkj=1nl=1LjPI(xi(j)=ajl)(x(j)=ajlyi=ck))I(yi=ck)=i=1Nk=1K(θkj=1nl=1LjμjlkI(xi(j)=ajl))I(yi=ck)
其中, N N N 为样本数, n n n X X X 的维数, L j L_j Lj X ( j ) X^{(j)} X(j) 可能的取值数量, K K K Y Y Y 可能的取值数量。

取对数:
l ( θ , μ ) = ∑ i = 1 N ∑ k = 1 K I ( y i = c k ) ( log ⁡ θ k + ∑ j = 1 n ∑ l = 1 L j I ( x i ( j ) = a j l ) log ⁡ μ j l k ) \begin{align} l(\theta,\mu)&=\sum\limits_{i=1}^{N}\sum\limits_{k=1}^{K}I(y_i=c_k)\Big(\log\theta_k+\sum\limits_{j=1}^{n}\sum\limits_{l=1}^{L_j}I(x^{(j)}_i=a_{jl})\log\mu_{jlk}\Big) \end{align} l(θ,μ)=i=1Nk=1KI(yi=ck)(logθk+j=1nl=1LjI(xi(j)=ajl)logμjlk)

Step2. 求 θ k \theta_k θk

利用拉格朗日乘数法引入约束条件 ∑ k = 1 K θ k = 1 \sum\limits_{k=1}^{K}\theta_k=1 k=1Kθk=1,得:
F ( θ , μ , λ ) = ∑ i = 1 N ∑ k = 1 K I ( y i = c k ) ( log ⁡ θ k + ∑ j = 1 n ∑ l = 1 L j I ( x i ( j ) = a j l ) log ⁡ μ j l k ) + λ ( ∑ k = 1 K θ k − 1 ) \begin{align} F(\theta,\mu,\lambda)=\sum\limits_{i=1}^{N}\sum\limits_{k=1}^{K}I(y_i=c_k)(\log\theta_k+\sum\limits_{j=1}^{n}\sum\limits_{l=1}^{L_j}I(x^{(j)}_i=a_{jl})\log\mu_{jlk})+\lambda(\sum\limits_{k=1}^{K}\theta_k-1) \end{align} F(θ,μ,λ)=i=1Nk=1KI(yi=ck)(logθk+j=1nl=1LjI(xi(j)=ajl)logμjlk)+λ(k=1Kθk1)

F F F 求偏导并令偏导数为 0 0 0 ,得:
θ k = − ∑ i = 1 N I ( y i = c k ) λ ∑ k = 1 K θ k = − N λ = 1 \begin{align} \theta_k&=-\frac{\sum\limits_{i=1}^{N}I(y_i=c_k)}{\lambda}\\ \sum\limits_{k=1}^{K}\theta_k&=-\frac{N}{\lambda}=1 \end{align} θkk=1Kθk=λi=1NI(yi=ck)=λN=1
其中, N k N_k Nk 为样本中 Y = c k Y=c_k Y=ck 的数量。联立上面的两个方程,得:
θ k = ∑ i = 1 N I ( y i = c k ) N \begin{align} \theta_k=\frac{\sum\limits_{i=1}^{N}I(y_i=c_k)}{N} \end{align} θk=Ni=1NI(yi=ck)

Step3. 求 μ l k \mu_{lk} μlk

利用拉格朗日乘数法引入约束条件 ∑ l = 1 L j μ l k = 1 \sum\limits_{l=1}^{L_j}\mu_{lk}=1 l=1Ljμlk=1,得:
F ( θ , μ , λ ) = ∑ i = 1 N ∑ k = 1 K I ( y i = c k ) ( log ⁡ θ k + ∑ j = 1 n ∑ l = 1 L j I ( x i ( j ) = a j l ) log ⁡ μ j l k ) + λ ( ∑ l = 1 L j μ l k − 1 ) \begin{align} F(\theta,\mu,\lambda)=\sum\limits_{i=1}^{N}\sum\limits_{k=1}^{K}I(y_i=c_k)\Big(\log\theta_k+\sum\limits_{j=1}^{n}\sum\limits_{l=1}^{L_j}I(x^{(j)}_i=a_{jl})\log\mu_{jlk})+\lambda(\sum\limits_{l=1}^{L_j}\mu_{lk}-1\Big) \end{align} F(θ,μ,λ)=i=1Nk=1KI(yi=ck)(logθk+j=1nl=1LjI(xi(j)=ajl)logμjlk)+λ(l=1Ljμlk1)

F F F 求偏导并令偏导数为 0 0 0 ,得:
μ j l k = − ∑ i = 1 N I ( y i = c k , x i ( j ) = a j l ) λ ∑ l = 1 L j μ l k = − ∑ i = 1 N I ( y i = c k ) λ = 1 \begin{align} \mu_{jlk}&=-\frac{\sum\limits_{i=1}^{N}I(y_i=c_k,x^{(j)}_i=a_{jl})}{\lambda}\\ \sum\limits_{l=1}^{L_j}\mu_{lk}&=-\frac{\sum\limits_{i=1}^{N}I(y_i=c_k)}{\lambda}=1 \end{align} μjlkl=1Ljμlk=λi=1NI(yi=ck,xi(j)=ajl)=λi=1NI(yi=ck)=1
联立上面两个方程,得:
μ j l k = ∑ i = 1 N I ( y i = c k , x i ( j ) = a j l ) ∑ i = 1 N I ( y i = c k ) \begin{align} \mu_{jlk}=\frac{\sum\limits_{i=1}^{N}I(y_i=c_k,x^{(j)}_i=a_{jl})}{\sum\limits_{i=1}^{N}I(y_i=c_k)} \end{align} μjlk=i=1NI(yi=ck)i=1NI(yi=ck,xi(j)=ajl)


http://www.ppmy.cn/news/638995.html

相关文章

android开发,魅蓝note2无法连接到os x 的解决办法

新弄了个魅蓝note2 ,开发的时候发现连接不上Mac电脑,在网上找了半天终于找到了,特此分享一下 1、打开USB调试(废话) 2、连上电脑,选择连接方式为媒体设备或相机(仅充电是无效的),提…

魅族flashfire_[FIRE]魅族魅蓝Note2公开版 解锁BL 刷入奇兔中文recovery教程

马上注册,玩转你的爱机。 您需要 登录 才可以下载或查看,没有帐号?立即注册 x 本帖最后由 残芯此生不换 于 2019-9-4 11:00 编辑 魅族魅蓝Note2公开版 解锁BL 刷入奇兔中文recovery教程,刷机必备 若手机已经解锁ROOT过,刷入了TWRP第三方recovery,可直接使用奇兔一键刷机! …

魅族魅蓝X幻影蓝/曜石黑版本1月23日首发上市

魅族科技(MEIZU)宣布魅蓝 X 幻影蓝、曜石黑版本将于 1 月 23 日 10:00 正式首发上市,3GB 运行内存32GB 存储版本售1699 元,4GB运行内存64GB 存储版本售 1999 元。用户可在魅族商城、京东商城、魅族天猫官方旗舰店、魅族专卖店进行购买。 魅蓝…

魅蓝X获取root权限

# adb shell am start -a android.intent.action.MAIN -n com.android.settings/com.meizu.settings.root.RootRequestActivity --ei uid 2000 --ei pid 4801 > /dev/null

最美手机 魅族魅蓝X幻影蓝/曜石黑上市

魅蓝X是目前魅族最“漂亮”魅族手机,自从发布以来就不断有用户呼唤幻影蓝/曜石黑尽快上市。然而由于这两种颜色上色工艺的复杂性,在产品发布一个多月后,这两个稀有颜色终于限量开售。 在外观上,魅蓝X正面搭载5.5 英寸屏幕。其最大…

魅蓝x android,魅蓝X怎么样?魅蓝X好用吗?

魅蓝X怎么样 魅蓝X采用5.5英寸夏普屏(全球量产最薄的Full InCell面板,支持TDDI像素隔离技术),拥有1500:1对比度,峰值亮度达到 500cd/㎡,在光线强烈的户外环境下屏幕上的内容依然清晰可见,full in cell全贴合技术的加入…

购魅族魅蓝X 《爱乐之城》电影票限量送

2.14情人节即将到来,魅族为广大用户准备一个浪漫的购机优惠活动:2月10日至2月14日,购买魅蓝X的用户有机会获赠限量《爱乐之城》电影票。如今购机赠票活动正在火热进行中。 活动期间,每天前40名在魅族指定线上电商渠道成功购买魅蓝…

魅蓝x android,魅蓝X的屏幕怎么样?魅蓝X屏幕材质是什么?

魅蓝X的屏幕怎么样 屏幕方面,魅蓝X采用5.5英寸夏普屏(全球量产最薄的Full InCell面板,支持TDDI像素隔离技术),拥有1500:1对比度,峰值亮度达到 500cd/㎡,在光线强烈的户外环境下屏幕上的内容依然清晰可见,fu…