【数模学习笔记】TOPSIS优劣解距离法

声明：以下笔记中的图片均来自“数学建模学习交流”清风老师的课程ppt，仅用作学习交流使用

文章目录

TOPSIS
- 步骤
- - 第一步原始矩阵正向化
  - - 极小型指标-->极大型指标
    - 中间型指标-->极大型指标
    - 区间型指标-->极大型指标
  - 第二步正向化矩阵标准化
  - 第三步计算得分并归一化
- 带权重的TOPSIS
- - 层次分析法
  - 基于熵权法对于TOPSIS模型的修正
  - - 步骤
    - - 第一步正向化矩阵标准化
      - 第二步计算概率矩阵
      - 第三步计算每个指标的熵权

TOPSIS

全称 Technique for Order Preference by Similarity to Ideal Solution 逼近理想解排序法

topsis能充分利用原始数据的信息，精确地反映各评价方案之间的差距
可以解决层次分析法中决策层数据已知的情况，使评价结果更准确

步骤

第一步原始矩阵正向化

常见的四种指标：极大型（效益型）指标、极小型（成本型）指标、中间型指标、区间型指标
在这里插入图片描述

一般将其他三种指标化为极大型指标，这个过程被称之为指标正向化

极小型指标–>极大型指标

$x => ma x - x$
当所有指标均为正数时，也可以
$x=>\frac{1}{x}$

中间型指标–>极大型指标

$x_{best}$ 为最佳指标
$M=max{ \{|x_i-x_{best}|\} }$
$\tilde{x_i}=1-\frac{|x_i-x_{best}|}{M}$
例如
在这里插入图片描述

区间型指标–>极大型指标

$[a, b]$ 为最佳区间
$M=max\{a-min{x_i},max{x_i}-b\}$

$\tilde{x_i}=\left\{ \begin{array}{rcl} 1-\frac{a-x_i}{M} ,& & {x_i<a}\\ 1 ,& & {a \leq x_i < b}\\ 1-\frac{x_i-b}{M} ,& & {x_i>b}\\ \end{array} \right.$

例如
在这里插入图片描述

第二步正向化矩阵标准化

标准化以消除指标量纲不同的影响
在这里插入图片描述
此时标准化矩阵可能会存在负数，但是并不影响正常topsis的计算过程，但是当运用到熵权法时，则要求标准化矩阵都是正数，故需要将正向化矩阵进行另一种标准化方法，具体操作见后文。

第三步计算得分并归一化

在这里插入图片描述
补充：如果各项指标带权重的话，只需要在每个欧氏距离前乘上对应权重即可

最后按照得分排序即可

带权重的TOPSIS

层次分析法

有n个评价对象，m个指标，可以根据层次分析法对这m个指标赋权重，缺点是层次分析法主观性太强

基于熵权法对于TOPSIS模型的修正

熵权法依据的原理：指标的变异程度越小，所反映的信息量也越少，其对应的权值也应该越低。（客观 = 数据本身就可以告诉我们权重）
（一种极端的例子：对于所有的样本而言，这个指标都是相同的数值，那么我们可认为这个指标的权值为0，即这个指标对于我们的评价起不到任何帮助）
事情发生的概率越大，所包含的信息量越小；反之同理。
假设 $x$ 表示事件 $X$ 可能发生的某种情况， $p (x)$ 表示这种情况发生的概率，我们可以定义： $I (x) = - l n (p (x))$

且由于 $\leq p(x) \leq 1$ 故 $I(x)\geq0$
那么事件 $X$ 的信息熵为：
$H(X)=\sum_{i=1}^{n}{[p(x_i)I(x_i)]}=-\sum_{i=1}^{n}{[p(x_i)ln(p(x_i))]}$
可以证明当 $p(x_1)=p(x_2)=p(x_3)=...=p(x_n)=\frac{1}{n}$ 时， $H(X)_{max}=\ln n$

随机变量的信息熵越大，则它的值能够给当前信息所补充的信息量越大，而已有的信息量越小。熵权法所关注的是已有的信息量，所以信息熵越大，信息越小。

步骤

第一步正向化矩阵标准化

若 $X$ 中本身存在不负数，则执行TOPSIS第二步，即 $z_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^{n}{x_{ij}^{2}}}}$ ，从而得到标准化矩阵 $Z$ 。
若 $X$ 中本身存在负数，则需要对其执行另一种标准化方法，即 $\tilde{z_{ij}}=\frac{x_{ij}-min\{x_{1j},x_{2j},...,x_{nj}\}}{max\{x_{1j},x_{2j},...,x_{nj}\}-min\{x_{1j},x_{2j},...,x_{nj}\}}$

第二步计算概率矩阵

$p_{ij}=\frac{\tilde{z_{ij}}}{\sum^{n}_{i=1}{\tilde{z_{ij}}}}$
即每个数除以所在列和

容易验证 $\sum_{i=1}^{n}p_{ij}=1$ 即保证各列和为1，即每个指标的概率和为1

第三步计算每个指标的熵权

计算信息熵： $e_j=-\frac{1}{\ln n} \sum_{i=1}^{n}{p_{ij}\ln (p_{ij})} , (j=1,2,...,m)$
与前面的 $H (X)$ 相比多除以了一个常数，是为了使信息熵和信息效用值落在 $[0, 1]$
计算信息效用值： $d_j=1-e_j$
可以理解为是将信息熵正向化，这样信息效用值就和信息量以及权重成正比了
计算熵权： $W_j=\frac{d_{j}}{\sum_{j=1}^{m}d_j}$
即实现信息效用值归一化

最后利用熵权计算得分即可