首页 > 其他分享 >评价类模型——TOPSIS(优劣解距离法) 清风建模笔记

评价类模型——TOPSIS(优劣解距离法) 清风建模笔记

时间:2024-04-07 16:30:02浏览次数:24  
标签:disp end TOPSIS 优劣 矩阵 建模 指标 posit 正向

清风建模TOPSIS

说明:

优劣解距离法 就是求这个数据和最优解的距离、求这个数据和最劣的距离,做比

基本过程为先将原始数据矩阵统一指标类型(一般正向化处理)得到正向化的矩阵,再对正向化的矩阵进行标准化处理以消除各指标量纲的影响,并找到有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行,

适用范围:样本很大,指标数多

同一指标类型:要将所有的指标转化为极大性指标(越大越好)。指标正向化+标准化处理

例一(单一数据):

排名是越小越好,评分却是越大越好,这就出现了矛盾,所以会出现修正后排名。(同一指标类型:正向化)

但是他存在着不合理之处:如果小王考了10分,他的评分还是不变,所以不能只靠排名,排名不能反映全部信息。排名只是和评分有着正相关性。

那现在为了和具体成绩有关,又提出了下图的想法。这样尝试之后,发现有的数据可能会相差太大,就统一把他们的取值范围归到[0,1]上,即在归一化。(相加和为一)

此时这个方法只是和成绩挂钩,但是如果小王考十分(保证他是最后一名)还是一样的结果。所以有缺陷,要在数据数量大、指标多的时候用。

那为什么不用卷面最高分和卷面最低分呢?答案参照下面的第(3)点

那为什么用这个方法呢?

(1)比较的对象一般要远大于两个。最高分和最低分始终是0和1,就只有这两个人受这个比较方法的影响,只要数量多起来,这两个人可以忽略不计。(例如比较一个班级的成绩)(2)比较的指标也往往不只是一个方面的,例如成绩、工时数、课外竞赛得分等。一个指标得了0分别的指标会对他进行弥补,影响不是很大。(3)有很多指标不存在理论上的最大值和最小值,例如衡量经济增长水平的指标:GDP增速。

只有一个指标时

例二:

成绩是越高(大)越好,这样的指标称为极大型指标(效益型指标)。

与他人争吵的次数越少(越小)越好,这样的指标称为极小型指标(成本型指标)。

这两个直接评判有问题(一个是极大型指标,一个极小型指标),要进行处理

同一指标类型:指标正向化:max-x(写论文里面)

但是这两个指标不能直接相加再按上一步来处理:量纲(单位)不同,一个是分一个是次,要对已经正向化的矩阵进行标准化处理

消除量纲影响:标准化处理

每个元素除以他们的平方和。不会影响他们的相对大小。

如何计算得分?就要对这个方法进行理解。式子拆分成x与最小值的距离和x与最小值的距离加x与最大值的距离的比,意即各评价对象与最优方案的相对接近程度。所以:

现在来算这四个人的各项分数,注意数据的对应性。

之后归一化,在排名

OK啦。

正式总结步骤(3):

第一步:将原始矩阵正向化(三种)

1.极小型转化为极大型(推荐:max-x)或(1/x,x不为0)

2.中间型转化为极大型

先找距离最优值最大的距离

3.区间型转化为极大

数据小的和区间左边比较,数据大的和区间右边比较。

第二步:正向化矩阵标准化

消除量纲(单位)的影响

第三步:计算得分并归一化

模型拓展

1.计算成绩的时候默认权重相同(成绩和争吵次数)

如何取权重:

更改:

练习题(Matlab)对照上文步骤来看

分析:含氧量是极大型,PH是中间型,细菌总数极小型,植物性营养物量区间型。

知识点:基础部分在另一篇:Matlab知识点中。

step1:将原始矩阵正向化

%%  第一步:把数据复制到工作区,并将这个矩阵命名为X
% (1)在工作区右键,点击新建(Ctrl+N),输入变量名称为X,双击X进入表格
% (2)在Excel中复制数据,再回到Matlab中右键,点击粘贴Excel数据(Ctrl+Shift+V)
% (3)关掉这个窗口,点击X变量,右键另存为,保存为mat文件(下次就不用复制粘贴了,只需使用load命令即可加载数据)
% (4)注意,代码和数据要放在同一个目录下哦,且Matlab的当前文件夹也要是这个目录。
clear;clc
load data_water_quality.mat

三种指标正向化   使用自己定义的positivization函数,这个函数里面又有三个自己定义的函数。

%%  第二步:判断是否需要正向化
[n,m] = size(X);%获得数据份数和指标个数
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) 
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0:  ']);
%字符串的拼接,两种方法,此处选择第二种,注意字符串之间有空格
%judge判断是否运行正向化的代码

if Judge == 1  %判断相等是双等号
    Position = input('请输入需要正向化处理的指标所在的列,例如第2、3、6三列需要处理,那么你需要输入[2,3,6]: '); %[2,3,4]
    disp('请输入需要处理的这些列的指标类型(1:极小型, 2:中间型, 3:区间型) ')
    Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]:  '); %[2,1,3]
    % 注意,Position和Type是两个同维度的行向量
    for i = 1 : size(Position,2)  %这里需要对这些列分别处理,因此我们需要知道一共要处理的次数,即循环的次数
        X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
    % Positivization是我们自己定义的函数,其作用是进行正向化,其一共接收三个参数
    % 第一个参数是要正向化处理的那一列向量 X(:,Position(i))   回顾上一讲的知识,X(:,n)表示取第n列的全部元素
    % 第二个参数是对应的这一列的指标类型(1:极小型, 2:中间型, 3:区间型)
    % 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
    % 该函数有一个返回值,它返回正向化之后的指标,我们可以将其直接赋值给我们原始要处理的那一列向量
    end
    disp('正向化后的矩阵 X =  ')
    disp(X)

end
%if end结尾

 Positivization是自己定义的函数:要单独放在一个m文件里面,且要和主函数在一个文件夹里面

% function [输出变量] = 函数名称(输入变量)  
% 函数的中间部分都是函数体
% 函数的最后要用end结尾
% 输出变量和输入变量可以有多个,用逗号隔开
% function [a,b,c]=test(d,e,f)
%     a=d+e;
%     b=e+f;
%     c=f+d;
% end
% 自定义的函数要单独放在一个m文件中,不可以直接放在主函数里面(和其他大多数语言不同)

function [posit_x] = Positivization(x,type,i)
% 输入变量有三个:
% x:需要正向化处理的指标对应的原始列向量
% type: 指标的类型(1:极小型, 2:中间型, 3:区间型)
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示:正向化后的列向量
    if type == 1  %极小型
        disp(['第' num2str(i) '列是极小型,正在正向化'] )
        posit_x = Min2Max(x);  %调用Min2Max函数来正向化
        disp(['第' num2str(i) '列极小型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 2  %中间型
        disp(['第' num2str(i) '列是中间型'] )
        best = input('请输入最佳的那一个值: ');
        posit_x = Mid2Max(x,best);
        disp(['第' num2str(i) '列中间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 3  %区间型
        disp(['第' num2str(i) '列是区间型'] )
        a = input('请输入区间的下界: ');
        b = input('请输入区间的上界: '); 
        posit_x = Inter2Max(x,a,b);
        disp(['第' num2str(i) '列区间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    else
        disp('没有这种类型的指标,请检查Type向量中是否有除了1、2、3之外的其他值')
    end
end

 Min2Max函数:

function [posit_x] = Min2Max(x)
    posit_x = max(x) - x;
     %posit_x = 1 ./ x;    %如果x全部都大于0,也可以这样正向化
end

Mid2Max函数:

function [posit_x] = Mid2Max(x,best)
    M = max(abs(x-best));
    posit_x = 1 - abs(x-best) / M;
end

 Inter2Max函数:

function [posit_x] = Inter2Max(x,a,b)
    r_x = size(x,1);  % row of x 有多少个评价对象
    M = max([a-min(x),max(x)-b]);
    posit_x = zeros(r_x,1);   %zeros函数用法: zeros(3) 3*3的0方阵, zeros(3,1) 3*1的0矩阵。 ones(3) 3*3的1矩阵。和0同。
    % 初始化posit_x全为0  初始化的目的是节省处理时间
    for i = 1: r_x
        if x(i) < a
           posit_x(i) = 1-(a-x(i))/M;
        elseif x(i) > b
           posit_x(i) = 1-(x(i)-b)/M;
        else
           posit_x(i) = 1;
        end
    end
end

step2:正向化矩阵标准化

%% 第二步:对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)
% x除以每个元素的平方和,先平方X.*X,后求和,对列求和sum(  ,1),1可以省略不写,开根号就是0.5次方。再用repmat对他进行扩展,直至和X一样大

step3:计算得分并归一化

即求与最大值最小值的距离

%% 第三步:计算与最大值的距离和最小值的距离,并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ],2) .^ 0.5;  
% D+:与最大值的距离向量,max(z)就是每一列最大的元素。第i个评价对象的分数就是这一行每个数减去对应列最大值的平方的和开根号。其中求和是按行求和,不要忘了2.
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ],2) .^ 0.5;   % D-:与最小值的距离向量
S = D_N ./ (D_P+D_N);    
% 未归一化的得分,一定是点除./。这个就是那个公式,x到最小值的距离除以到最大值与最小值距离的和(也就是最大值减去最小值)
disp('最后的得分为:')
stand_S = S / sum(S)
%归一化的S
[sorted_S,index] = sort(stand_S ,'descend')
%数据多的时候,分不清谁最大,所以用sort 进行排序,index用以知道最大值所在的位置

练习题:

有时间写:(在正向化的Judge那里更改)

标签:disp,end,TOPSIS,优劣,矩阵,建模,指标,posit,正向
From: https://blog.csdn.net/q15623588795/article/details/137187820

相关文章

  • IAB201建模技术用于信息系统
    评估2IAB201建模技术用于信息系统2024年第1学期名称评估2——概念系统模型的设计由于4月26日星期五晚上11:59重量40%类型个人提交通过Canvas的单个PDF文档原理和描述解决业务问题的基础是了解核心概念、原则和理解、设计和管理复杂的现实世界信息系统所需的技能。这意味着对用于建......
  • 数仓建模—建模方法论之Data Vault 建模
    数仓建模方法论—DataVault建模除了Kimball的维度建模理论,DataVault也是数据仓库建模的一种方法,最早由DanLinstedt在20世纪90年代提出,主要应用于企业级数据仓库建模。不同于三范式数据仓库模型、维度模型,DataVault模型主要用于存储来自多个业务系统的完整的历史......
  • 【MATLAB 仿真】Model Predictive Control (1)、简单建模 【新加坡南洋理工大学 Nanyang
    一、1个简单的连续时间模型ASimpleContinuous-timeModel:1个简单的连续时间系统,使用状态空间模型进行表示:和标准型进行对比,得到模型参数二、MATLAB仿真代码MatlabSimulationCode:Ac=[010;301;010];Bc=[1;1;3];Cc=[010];Dc=zeros(1,1);......
  • 数据结构篇:跳跃表与B+树的对比与优劣分析
       本文旨在探讨跳跃表的特性及其在实际应用场景中的作用,同时对其与B+树进行比较,以帮助更好地理解和运用这两种数据结构。跳跃表什么是跳跃表(skiplist)        跳跃表是一种基于跳跃链表的有序数据结构,它是一种多层链表,每一层都是一个有序的链表。表的每一层......
  • 【安全技术系列】-- 威胁建模①
    在数字威胁不断演变的时代,了解和降低网络安全风险对各种规模的组织都至关重要。威胁建模作为安全领域的一个关键流程,提供了一种识别、评估和应对潜在安全威胁的结构化方法。本文将深入探讨威胁建模的复杂性,探索其机制、方法、实际应用、优势和挑战。一、什么是威胁建模,为什么......
  • 【六 (2)机器学习-机器学习建模步骤/kaggle房价回归实战】
    一、确定问题和目标:1、业务需求分析:与业务团队或相关利益方进行深入沟通,了解他们的需求和期望。分析业务流程,找出可能的瓶颈、机会或挑战。思考机器学习如何帮助解决这些问题或实现业务目标。2、问题定义:将业务需求转化为一个或多个具体的机器学习问题,例如分类、回归......
  • 数学建模-------MATLAB分支循环&&断点调试
    1.if语句(1)分段函数的引入(这里的数据表示的是分数的不同区间对应的等级)(1)这个就是一个十分简单的if语句,无论是if还是elseif后面都是不能添加任何分号的,这个例子就是一个分段的函数,在不同的区间赋予不同的等级,这里划分了1,2,3,4一共4个等级,只有前面的三个全部都不满足的时候,才......
  • 【数学建模】基于matlab模拟单摆运动
     ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • 2023数学建模国赛训练以及比赛感想
    去年写的感想今年才想起来发半个月的训练,五场几乎没有间断的练习赛,每天闭眼就能睡着。最终还是差了一点,因为一句不完整的话,一段写好却没有粘贴的句子,半个多月的努力最终只成了遗憾。其实只要我们其中一人能做好删改、校对、记录的任意一个细节,这篇论文完全可以以最好的状态呈现......
  • JINGWHALE ABCDE 概念模型系统设计建模法,帮你规范系统产品设计,打造全链路的产品体验!
    《一种基于概念模型思想的ABCDE系统设计建模法的研究与应用》张云龙(JINGWHALE数字科学艺术创新中心,浙江杭州,310008)国作登字-2023-A-00087399摘要:本文基于概念模型思想提出了一种归纳设计纲领、梳理业务模型、抽象概念模型、具象设计模型、评估改进模型的ABCDE概......