模糊C均值(FCM)算法更新公式推导
目标函数
FCM的目标函数为:
J m = ∑ i = 1 n ∑ j = 1 k u i j m ∥ x i − c j ∥ 2 J_m = \sum_{i=1}^n \sum_{j=1}^k u_{ij}^m \|x_i - c_j\|^2 Jm=i=1∑nj=1∑kuijm∥xi−cj∥2
其中:
- x i x_i xi 是数据点, i = 1 , 2 , … , n i = 1, 2, \ldots, n i=1,2,…,n。
- c j c_j cj 是第 j j j 个簇的中心, j = 1 , 2 , … , k j = 1, 2, \ldots, k j=1,2,…,k。
- u i j u_{ij} uij 是数据点 x i x_i xi 属于第 j j j 个簇的隶属度。
- m m m 是模糊度参数,通常 m > 1 m > 1 m>1。
更新公式推导过程
1. 定义目标函数
J m = ∑ i = 1 n ∑ j = 1 k u i j m ∥ x i − c j ∥ 2 J_m = \sum_{i=1}^n \sum_{j=1}^k u_{ij}^m \|x_i - c_j\|^2 Jm=i=1∑nj=1∑kuijm∥xi−cj∥2
2. 引入约束条件
∑ j = 1 k u i j = 1 ∀ i \sum_{j=1}^k u_{ij} = 1 \quad \forall i j=1∑kuij=1∀i
使用拉格朗日乘数法,引入拉格朗日乘子 λ i \lambda_i λi,构造拉格朗日函数:
L = ∑ i = 1 n ∑ j = 1 k u i j m ∥ x i − c j ∥ 2 + ∑ i = 1 n λ i ( ∑ j = 1 k u i j − 1 ) \mathcal{L} = \sum_{i=1}^n \sum_{j=1}^k u_{ij}^m \|x_i - c_j\|^2 + \sum_{i=1}^n \lambda_i \left( \sum_{j=1}^k u_{ij} - 1 \right) L=i=1∑nj=1∑kuijm∥xi−cj∥2+i=1∑nλi(j=1∑kuij−1)
3. 对 u i j u_{ij} uij 求偏导数并设为零
对拉格朗日函数 L \mathcal{L} L 求 u i j u_{ij} uij 的偏导数并设为零:
∂ L ∂ u i j = m u i j m − 1 ∥ x i − c j ∥ 2 + λ i = 0 \frac{\partial \mathcal{L}}{\partial u_{ij}} = m u_{ij}^{m-1} \|x_i - c_j\|^2 + \lambda_i = 0 ∂uij∂L=muijm−1∥xi−cj∥2+λi=0
解这个方程得到:
u i j m − 1 = − λ i m ∥ x i − c j ∥ 2 u_{ij}^{m-1} = -\frac{\lambda_i}{m \|x_i - c_j\|^2} uijm−1=−m∥xi−cj∥2λi
为了保证 (u_{ij}) 非负,设 λ i = − m ζ \lambda_i = -m\zeta λi=−mζ,则:
u i j m − 1 = ζ ∥ x i − c j ∥ 2 u_{ij}^{m-1} = \frac{\zeta}{\|x_i - c_j\|^2} uijm−1=∥xi−cj∥2ζ
即:
u i j = ( ζ ∥ x i − c j ∥ 2 ) 1 m − 1 u_{ij} = \left( \frac{\zeta}{\|x_i - c_j\|^2} \right)^{\frac{1}{m-1}} uij=(∥xi−cj∥2ζ)m−11
4. 求解拉格朗日乘子 ζ \zeta ζ
利用约束条件 ∑ j = 1 k u i j = 1 \sum_{j=1}^k u_{ij} = 1 ∑j=1kuij=1:
∑ j = 1 k ( ζ ∥ x i − c j ∥ 2 ) 1 m − 1 = 1 \sum_{j=1}^k \left( \frac{\zeta}{\|x_i - c_j\|^2} \right)^{\frac{1}{m-1}} = 1 j=1∑k(∥xi−cj∥2ζ)m−11=1
解这个方程得到:
ζ = ( ∑ j = 1 k ( 1 ∥ x i − c j ∥ 2 ) 1 m − 1 ) 1 − m \zeta = \left( \sum_{j=1}^k \left( \frac{1}{\|x_i - c_j\|^2} \right)^{\frac{1}{m-1}} \right)^{1-m} ζ=(j=1∑k(∥xi−cj∥21)m−11)1−m
代入 u i j u_{ij} uij 的表达式,得到隶属度更新公式:
u i j = 1 ∑ l = 1 k ( ∥ x i − c j ∥ ∥ x i − c l ∥ ) 2 m − 1 u_{ij} = \frac{1}{\sum_{l=1}^k \left( \frac{\|x_i - c_j\|}{\|x_i - c_l\|} \right)^{\frac{2}{m-1}}} uij=∑l=1k(∥xi−cl∥∥xi−cj∥)m−121
5. 对簇中心 c j c_j cj 求偏导数并设为零
对目标函数 J m J_m Jm 对 c j c_j cj 求偏导数并设为零:
∂ J m ∂ c j = ∑ i = 1 n u i j m ( c j − x i ) = 0 \frac{\partial J_m}{\partial c_j} = \sum_{i=1}^n u_{ij}^m (c_j - x_i) = 0 ∂cj∂Jm=i=1∑nuijm(cj−xi)=0
解这个方程得到:
∑ i = 1 n u i j m c j = ∑ i = 1 n u i j m x i \sum_{i=1}^n u_{ij}^m c_j = \sum_{i=1}^n u_{ij}^m x_i i=1∑nuijmcj=i=1∑nuijmxi
c j = ∑ i = 1 n u i j m x i ∑ i = 1 n u i j m c_j = \frac{\sum_{i=1}^n u_{ij}^m x_i}{\sum_{i=1}^n u_{ij}^m} cj=∑i=1nuijm∑i=1nuijmxi
总结
通过上述推导过程,我们得到了FCM算法的更新公式:
- 隶属度更新公式:
u i j = 1 ∑ l = 1 k ( ∥ x i − c j ∥ ∥ x i − c l ∥ ) 2 m − 1 u_{ij} = \frac{1}{\sum_{l=1}^k \left(\frac{\|x_i - c_j\|}{\|x_i - c_l\|}\right)^{\frac{2}{m-1}}} uij=∑l=1k(∥xi−cl∥∥xi−cj∥)m−121
- 簇中心更新公式:
c j = ∑ i = 1 n u i j m x i ∑ i = 1 n u i j m c_j = \frac{\sum_{i=1}^n u_{ij}^m x_i}{\sum_{i=1}^n u_{ij}^m} cj=∑i=1nuijm∑i=1nuijmxi
这些公式在每次迭代中交替更新,直到目标函数收敛。