（2）评价算法-TOPSIS算法

标签：TOPSIS min max list 算法 np 评价 data datas

文章目录

1、TOPSIS算法
2、TOPSIS算法流程

2.1、极大型转化
2.1.1 极大型
2.1.2 中间型
2.1.3 极小型
2.1.4 区间型

2.2 计算每项指标的权重
2.3 正向矩阵标准化
2.4 计算得分
3、实例
4、参考资料

1、TOPSIS算法

TOPSIS方法是基于数据对样本进行排序的一种方法，其基本思想是根据样本数据构造一个理想化的目标。主要找到每一列（指标）的最大值让它们构成一个向量 $（2）评价算法-TOPSIS算法_算法$ 和每一列（指标）的最小值构成一个向量 $（2）评价算法-TOPSIS算法_参考资料_02$ 。只要找到这两个向量，后面的事情就好办了。

2、TOPSIS算法流程

2.1、极大型转化

将不同指标转化为极大型指标，指标常见四种类型，极大型，中间型，极小型，范围型。

（2）评价算法-TOPSIS算法_权重_03

四种类型的指标处理方法如下

2.1.1 极大型

无需处理

2.1.2 中间型

（2）评价算法-TOPSIS算法_最小值_04

2.1.3 极小型

（2）评价算法-TOPSIS算法_参考资料_05

2.1.4 区间型

（2）评价算法-TOPSIS算法_参考资料_06

2.2 计算每项指标的权重

本文采用的是熵权法，在我之前的文章有讲，点击这里

2.3 正向矩阵标准化

（2）评价算法-TOPSIS算法_最小值_07

将标准化以后的矩阵每列都乘以W[i]（上一步已经把每一列的权重都算出来了）。

2.4 计算得分

（2）评价算法-TOPSIS算法_最小值_08

3、实例

注：这里使用的是2021年华数杯C题附件一数据

import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
import math

# 极小型指标 -> 极大型指标
def dataDirection_1(datas):
    return np.max(datas) - datas  # 套公式


# 中间型指标 -> 极大型指标
def dataDirection_2(datas, x_best):
    temp_datas = datas - x_best
    M = np.max(abs(temp_datas))
    answer_datas = 1 - abs(datas - x_best) / M  # 套公式
    return answer_datas


# 区间型指标 -> 极大型指标
def dataDirection_3(datas, x_min, x_max):
    M = max(x_min - np.min(datas), np.max(datas) - x_max)
    answer_list = []
    for i in datas:
        if (i < x_min):
            answer_list.append(1 - (x_min - i) / M)  # 套公式
        elif (x_min <= i <= x_max):
            answer_list.append(1)
        else:
            answer_list.append(1 - (i - x_max) / M)
    return np.array(answer_list)

# 正向化矩阵标准化
def Scaler(datas,weight):
    K = pow(np.sum(pow(datas,2),axis=1),0.5)
    print(K)
    for i in range(datas.shape[1]):
        for j in range(0, datas[i].size):
            datas[i, j] = datas[i, j] / K[i]  # 套用矩阵标准化的公式
    for i in range(datas.shape[1]):
        datas[i] = datas[i]*weight[i]
    return datas


def Score(datas):
    list_max = []
    for i in range(datas.shape[1]):
        list_max.append(np.max(datas[:,i]))

    list_min = []
    for i in range(datas.shape[1]):
        list_min.append(np.min(datas[:, i]))

    max_list = []  # 存放第i个评价对象与最大值的距离
    min_list = []  # 存放第i个评价对象与最小值的距离
    answer_list = []  # 存放评价对象的得分

    for k in range(datas.shape[0]):
        max_sum = 0
        min_sum = 0
        for q in range(datas.shape[1]):
            max_sum += pow(datas[k,q]-list_max[q], 2)
            min_sum += pow(datas[k,q]-list_min[q], 2)
        max_list.append(pow(max_sum, 0.5))
        min_list.append(pow(min_sum, 0.5))
        answer_list.append(min_list[k] / (min_list[k] + max_list[k]))

    result = np.array(answer_list)
    return result

def main():
    data = pd.read_excel('2.xlsx')
    data = data.iloc[:,2:10]

    """
    for i in range(data.shape[1]):
        
        if 极大型
        data[i] = data[i]  #或者continue
        elif 中间型
        data[i] = dataDirection_2(data[i],mid)
        elif 极小型
        data[i] = dataDirection_1(data[i])
        else 范围型
        data[i] = dataDirection_3(data[i],min,max)
    """


    After_Large = np.array(data)
    # 计算每个元素的权重
    weight = cal_weight(data)
    After_Scaler = Scaler(After_Large,weight)

    Final_Score = Score(After_Scaler)
    data = pd.DataFrame(Final_Score)


    writer = pd.ExcelWriter('34.xlsx')
    data.to_excel(writer,float_format='%.5f')
    writer.save()
    writer.close()


def cal_weight(x):
    x = MinMaxScaler().fit_transform(x)
    # 求k
    rows = x.shape[0]  # 行
    cols = x.shape[1]  # 列
    k = 1.0 / math.log(rows)

    # 矩阵计算--
    # 信息熵
    # p=array(p)
    x = np.array(x)
    lnf = [[None] * cols for i in range(rows)]
    lnf = np.array(lnf)
    for i in range( rows):
        for j in range(cols):
            if x[i][j] == 0:
                lnfij = 0.0
            else:
                p = x[i][j] / x.sum(axis=0)[j]
                lnfij = math.log(p) * p * (-k)
            lnf[i][j] = lnfij
    lnf = pd.DataFrame(lnf)
    E = lnf

    # 计算冗余度
    d = 1 - E.sum(axis=0)

    # 计算各指标的权重
    w = np.zeros((x.shape[1]))
    for j in range(cols):
        wj = d[j] / sum(d)
        w[j] = wj
        # 计算各样本的综合得分,用最原始的数据

    return np.array(w)



if __name__ == '__main__':
    main()

注：TOPSIS对异常值比较敏感，使用TOPSIS算法之前一定要去除异常值

标签：TOPSIS,min,max,list,算法,np,评价,data,datas
From： https://blog.51cto.com/u_14597003/5989164