评价类——熵权法(Entropy Weight Method, EWM),完全客观评价

ops/2024/9/22 23:56:06/

目录

  • 一、 熵权法赋权代码说明
    • 1.1 介绍
  • 二、 手把手教你运行代码
    • 2.1 数据示例
    • 2.2 ==可直接运行代码,代码(完整代码关注底部微信公众号获取)==
    • 2.3 shangquanfa_eg_Sheet1.csv数据可视化
    • 2.4 代码运行过程截屏
    • 2.5 代码运行结果截屏
    • 2.6 对熵权法的结果分析
  • 三、 提供的代码如何修改?
  • 四、 为什么确定极小化指标?
    • 4.1 极小化和极大化的归一化原理
      • 1. 极大化指标的归一化
        • 归一化公式解释
      • 2. 极小化指标的归一化
        • 归一化公式解释
      • 3. 归一化的目的和意义
  • 四、熵权法的原理
    • 4.1 熵权法简介
    • 4.2 熵权法的原理
      • 4.2.1 信息熵的计算公式

一、 熵权法赋权代码说明

完整代码关注博客底部微信公众号获得!

1.1 介绍

熵权法(Entropy Weight Method, EWM)是一种客观赋权的方法,用于多指标决策分析。

我知道大家对原理不感兴趣,原理我放在最后,写论文的同学可以复制,但是记得改一改,否则查重率过不去。
代码可以直接运行,大家参考我的教程。

二、 手把手教你运行代码

接下来,我给大家提供一个示例数据,以这个数据教大家如何使用下述代码。

2.1 数据示例

假设你的数据存储在 data.csv 文件中,格式如下:

编号影响因素1影响因素2影响因素3
A70800030
B90700050
C60750040

首先将你的数据整理为这种格式,然后查看影响因素,对某个值越大约好的不用管,只需要找出影响因素越小越好的值(因为两者归一化的方法不一样),假如影响因素1和2 是越小越好,那么记住,影响因素在除了第一列以外,从0开始编号属于第1和2列,记住``和2

接下来给你提供代码,教你如何操作代码。

2.2 可直接运行代码,代码(完整代码关注底部微信公众号获取)

python">import pandas as pd
import numpy as npdef entropy_weight_method(csv_file, minimize_cols=None):scores = np.dot(normalized_data, weights)# 将结果保存到 CSV 文件result = pd.DataFrame({'Sample': samples,'Score': scores})result.to_csv('weighted_scores.csv', index=False, encoding='utf-8')return weights, scores# 用法
csv_file = 'shangquanfa_eg_Sheet1.csv'  # 假设数据存储在 data.csv 文件中# 指定极小化的指标列索引(从0开始计数,假设第二列和第三列是极小化指标)
minimize_cols = [0, 1]  # 比如这里的列索引根据你的数据来设置
# minimize_cols = []  # 无极小化因素则启用这行代码
weights, scores = entropy_weight_method(csv_file, minimize_cols)print("权重:", weights)
print("综合得分:", scores)

**首先注意的有3点,
1.你的数据文件必须经过我的转换,参考我的这篇播客:文件格式转换:EXCEL和CSV文件格式互相转换
对需要使用熵权法的数据进行转换,并且转换以后对csv文件不可以在进行操作,否则会报错字符编码错误。

2.找到这行代码minimize_cols = [0, 1] ,在里面填入1,2(注意英文半角)(原因我前文有说明,仔细看)
修改后minimize_cols = [1, 2](如果没有极小化,就是全部的影响因素越大越好,你就改为minimize_cols = []空列表)
3.csv_file = ‘shangquanfa_eg_Sheet1.csv’ 中,shangquanfa_eg_Sheet1.csv是你的csv文件的路径及名字,最终按顺序输出权重和综合得分。

运行代码:

2.3 shangquanfa_eg_Sheet1.csv数据可视化

在这里插入图片描述

2.4 代码运行过程截屏

在这里插入图片描述

2.5 代码运行结果截屏

在这里插入图片描述

2.6 对熵权法的结果分析

从结果:
权重: [0.36719405 0.31640297 0.31640297]
综合得分: [0.43880099 0.68359703 0.31640297]
可以看出:影响因素1、影响因素2、影响因素3的权重分别是:0.36719405 、0.31640297、 0.31640297,最终计算得出A、B、C三地的得分依次为:0.43880099 、0.68359703、 0.31640297,可知B地最佳。

三、 提供的代码如何修改?

**首先注意的有3点,
1.你的数据文件必须经过我的转换,参考我的这篇播客:文件格式转换:EXCEL和CSV文件格式互相转换
对需要使用熵权法的数据进行转换,并且转换以后对csv文件不可以在进行操作,否则会报错字符编码错误。

2.找到这行代码minimize_cols = [0, 1] ,在里面填入1,2(注意英文半角)(原因我前文有说明,仔细看)
修改后minimize_cols = [1, 2](如果没有极小化,就是全部的影响因素越大越好,你就改为minimize_cols = []空列表)
3.csv_file = ‘shangquanfa_eg_Sheet1.csv’ 中,shangquanfa_eg_Sheet1.csv是你的csv文件的路径及名字,最终按顺序输出权重和综合得分。

四、 为什么确定极小化指标?

看极小化和极大化的归一化过程你就懂了,过程如下:

4.1 极小化和极大化的归一化原理

在多指标决策分析中,不同的指标对决策的影响方向可能不同,有些指标是极大化指标(即指标值越大越好),而有些指标是极小化指标(即指标值越小越好)。为了将不同量纲和方向的指标转化到一个可比的尺度上,需要进行归一化处理,即将不同指标的值转换到相同的范围(通常为 [0, 1] 区间)。这样就可以在同一尺度上进行比较和计算。

1. 极大化指标的归一化

极大化指标是指指标的值越大越好,例如利润、效率、得分等。在归一化时,希望将指标值较大的样本归一化到更高的数值。归一化公式如下:

r i j = x i j − x min ⁡ ( j ) x max ⁡ ( j ) − x min ⁡ ( j ) r_{ij} = \frac{x_{ij} - x_{\min(j)}}{x_{\max(j)} - x_{\min(j)}} rij=xmax(j)xmin(j)xijxmin(j)

其中:

  • r i j r_{ij} rij 是第 i i i 个样本在第 j j j 个指标下的归一化值。
  • x i j x_{ij} xij 是第 i i i 个样本在第 j j j 个指标下的原始值。
  • x min ⁡ ( j ) x_{\min(j)} xmin(j) 是第 j j j 个指标的最小值。
  • x max ⁡ ( j ) x_{\max(j)} xmax(j) 是第 j j j 个指标的最大值。
归一化公式解释
  • x i j = x max ⁡ ( j ) x_{ij} = x_{\max(j)} xij=xmax(j) 时, r i j = 1 r_{ij} = 1 rij=1,表示该样本在该指标下的表现最好。
  • x i j = x min ⁡ ( j ) x_{ij} = x_{\min(j)} xij=xmin(j) 时, r i j = 0 r_{ij} = 0 rij=0,表示该样本在该指标下的表现最差。
  • 如果 x i j x_{ij} xij 介于 x min ⁡ ( j ) x_{\min(j)} xmin(j) x max ⁡ ( j ) x_{\max(j)} xmax(j) 之间, r i j r_{ij} rij 的值位于 0 和 1 之间。

2. 极小化指标的归一化

极小化指标是指指标的值越小越好,例如成本、污染物排放量、损失等。在归一化时,希望将指标值较小的样本归一化到更高的数值。归一化公式如下:

r i j = x max ⁡ ( j ) − x i j x max ⁡ ( j ) − x min ⁡ ( j ) r_{ij} = \frac{x_{\max(j)} - x_{ij}}{x_{\max(j)} - x_{\min(j)}} rij=xmax(j)xmin(j)xmax(j)xij

其中:

  • r i j r_{ij} rij 是第 i i i 个样本在第 j j j 个指标下的归一化值。
  • x i j x_{ij} xij 是第 i i i 个样本在第 j j j 个指标下的原始值。
  • x min ⁡ ( j ) x_{\min(j)} xmin(j) 是第 j j j 个指标的最小值。
  • x max ⁡ ( j ) x_{\max(j)} xmax(j) 是第 j j j 个指标的最大值。
归一化公式解释
  • x i j = x min ⁡ ( j ) x_{ij} = x_{\min(j)} xij=xmin(j) 时, r i j = 1 r_{ij} = 1 rij=1,表示该样本在该指标下的表现最好。
  • x i j = x max ⁡ ( j ) x_{ij} = x_{\max(j)} xij=xmax(j) 时, r i j = 0 r_{ij} = 0 rij=0,表示该样本在该指标下的表现最差。
  • 如果 x i j x_{ij} xij 介于 x min ⁡ ( j ) x_{\min(j)} xmin(j) x max ⁡ ( j ) x_{\max(j)} xmax(j) 之间, r i j r_{ij} rij的值位于 0 和 1 之间。

3. 归一化的目的和意义

  • 统一量纲:将不同量纲的指标统一到同一数值范围(通常为 [0, 1]),便于综合计算和比较。
  • 消除单位影响:通过归一化处理,消除不同单位对分析结果的影响。
  • 明确方向:根据指标的性质(极大化或极小化)调整数据方向,使得所有指标的优化目标一致(即越大越好)。

四、熵权法的原理

4.1 熵权法简介

熵权法(Entropy Weight Method, EWM)是一种客观赋权的方法,常用于多指标决策分析中。熵权法的基本思想是通过计算各指标的信息熵来衡量其在决策中的不确定性程度。指标的信息熵越大,说明该指标的信息越分散,差异性越小,对决策的影响程度越低;相反,信息熵越小,说明该指标的信息越集中,差异性越大,对决策的影响程度越高。

熵权法的优势在于它可以根据数据本身的分布情况,客观地确定各指标的权重,避免了人为主观赋权的干扰。

4.2 熵权法的原理

熵(Entropy)是信息论中的一个重要概念,用于度量系统的不确定性程度。在决策分析中,熵被用来表示指标值的离散程度。具体来说,信息熵越大,表明该指标的分布越均匀,对决策的贡献程度越小。因此,熵权法通过计算各指标的信息熵来确定其在决策中的权重。

4.2.1 信息熵的计算公式

给定一个指标 j j j,其在 n n n 个样本上的值为 x i j x_{ij} xij,熵权法的计算步骤如下:

  1. 标准化处理

    对原始数据进行标准化,消除量纲的影响。常用的标准化方法为极小化和极大化处理:

    r i j = x i j − x min ⁡ ( j ) x max ⁡ ( j ) − x min ⁡ ( j ) r_{ij} = \frac{x_{ij} - x_{\min(j)}}{x_{\max(j)} - x_{\min(j)}} rij=xmax(j)xmin(j)xijxmin(j)

    其中:

    • x i j x_{ij} xij是第 i i i个样本在第 j j j个指标上的值。
    • x min ⁡ ( j ) x_{\min(j)} xmin(j) 是第 j j j 个指标的最小值。
    • x max ⁡ ( j ) x_{\max(j)} xmax(j) 是第 j j j个指标的最大值。

    经过标准化后,所有数据都被归一化到 [0, 1] 区间。

  2. 计算各指标的比重

    计算每个样本在每个指标下的比重(比例系数):

    p i j = r i j ∑ i = 1 n r i j p_{ij} = \frac{r_{ij}}{\sum_{i=1}^{n} r_{ij}} pij=i=1nrijrij

    其中,$ p i j p_{ij} pij 表示第 i i i 个样本在第 j j j 个指标下的比重。

  3. 计算信息熵
    利用信息熵公式计算每个指标的信息熵:

    e j = − k ∑ i = 1 n p i j ln ⁡ ( p i j ) e_j = -k \sum_{i=1}^{n} p_{ij} \ln(p_{ij}) ej=ki=1npijln(pij)

    其中:

    • e j e_j ej 是第 j j j 个指标的信息熵。
    • k = 1 ln ⁡ ( n ) k = \frac{1}{\ln(n)} k=ln(n)1 是一个常数,用于标准化熵值。
    • n n n是样本的数量。
    • p i j = 0 p_{ij} = 0 pij=0 时,定义 p i j ln ⁡ ( p i j ) = 0 p_{ij} \ln(p_{ij}) = 0 pijln(pij)=0
  4. 计算熵权

    根据信息熵计算每个指标的权重:

    w j = 1 − e j m − ∑ j = 1 m e j w_j = \frac{1 - e_j}{m - \sum_{j=1}^{m} e_j} wj=mj=1mej1ej

    其中:

    • w j w_j wj 是第 j j j 个指标的权重。
    • m m m 是指标的数量。
  5. 计算综合得分

    使用计算出的权重,计算每个样本的综合得分:

    S i = ∑ j = 1 m w j ⋅ r i j S_i = \sum_{j=1}^{m} w_j \cdot r_{ij} Si=j=1mwjrij

    其中:

    • S i S_i Si 是第 i i i 个样本的综合得分。
    • r i j r_{ij} rij 是第 i i i 个样本在第 j j j 个指标下的标准化值。

http://www.ppmy.cn/ops/114002.html

相关文章

音视频入门基础:AAC专题(7)——FFmpeg源码中计算AAC裸流每个packet的size值的实现

音视频入门基础:AAC专题系列文章: 音视频入门基础:AAC专题(1)——AAC官方文档下载 音视频入门基础:AAC专题(2)——使用FFmpeg命令生成AAC裸流文件 音视频入门基础:AAC…

PHP 实现 redis 分布式锁

分布式锁 如果是强一致性保证,在获取锁或者失败后引入数据库存储扫表、mq 等方式进行补偿 如果可以容忍少量异常就不需要考虑了 像这里的代码,没吃建立一个链接铺货,性能损耗时间延迟也是很大的,也可在一块代码中进行服务&…

求1000以内所有恰好能分解成10组两个素数之和

要求 根据哥德巴赫猜想,任意一个大偶数都可以分解为两个素数之和。但许多偶数分解为两个素数之和并不是唯一的。 请编写函数fun,其功能是:求1000(不包括1000)以内的所有恰好能分解成10组两个素数之和(5109和1095被认为是同一组)的偶并依次存入数组a中并…

基于SpringBoot+Vue的剧本杀管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于JavaSpringBootVueMySQL的…

二叉树算法

1. 几种二叉树的概念 1.1. 满二叉树 所有节点都长满了叶子。 1.2. 完全二叉树 倒数第二层是满的,最后一层完全堆在左边。 1.3. 平衡二叉树(AVL树) 任意两个子树高度差不超过1的二叉树。 2. 表示树的底层结构 可以用数组或链表(有多个指针…

LeetCode118:杨辉三角

题目链接&#xff1a;118. 杨辉三角 - 力扣&#xff08;LeetCode&#xff09; 代码如下 class Solution {public:vector<vector<int>> generate(int numRows) {vector<vector<int>> dp(numRows);vector<int> temp(numRows);for (int i 0; i &…

FEAD:fNIRS-EEG情感数据库(视频刺激)

摘要 本文提出了一种可用于训练情绪识别模型的fNIRS-EEG情感数据库——FEAD。研究共记录了37名被试的脑电活动和脑血流动力学反应&#xff0c;以及被试对24种情绪视听刺激的分类和维度评分。探讨了神经生理信号与主观评分之间的关系&#xff0c;并在前额叶皮层区域发现了显著的…

2024年9月python二级易错题和难题大全(附详细解析)(五)

2024年9月python二级易错题和难题大全(附详细解析)(五) 第1题第2题第3题第4题第5题第1题 1、关于函数的返回值,以下选项中描述错误的是() A、函数可以返回0个或多个结果 B、函数必须有返回值 C、函数可以有return,也可以没有 D、return可以传递0个返回值,也可以传递任…