清风建模TOPSIS
说明:
优劣解距离法 就是求这个数据和最优解的距离、求这个数据和最劣的距离,做比
基本过程为先将原始数据矩阵统一指标类型(一般正向化处理)得到正向化的矩阵,再对正向化的矩阵进行标准化处理以消除各指标量纲的影响,并找到有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行,
适用范围:样本很大,指标数多
同一指标类型:要将所有的指标转化为极大性指标(越大越好)。指标正向化+标准化处理
例一(单一数据):
排名是越小越好,评分却是越大越好,这就出现了矛盾,所以会出现修正后排名。(同一指标类型:正向化)
但是他存在着不合理之处:如果小王考了10分,他的评分还是不变,所以不能只靠排名,排名不能反映全部信息。排名只是和评分有着正相关性。
那现在为了和具体成绩有关,又提出了下图的想法。这样尝试之后,发现有的数据可能会相差太大,就统一把他们的取值范围归到[0,1]上,即在归一化。(相加和为一)
此时这个方法只是和成绩挂钩,但是如果小王考十分(保证他是最后一名)还是一样的结果。所以有缺陷,要在数据数量大、指标多的时候用。
那为什么不用卷面最高分和卷面最低分呢?答案参照下面的第(3)点
那为什么用这个方法呢?
(1)比较的对象一般要远大于两个。最高分和最低分始终是0和1,就只有这两个人受这个比较方法的影响,只要数量多起来,这两个人可以忽略不计。(例如比较一个班级的成绩)(2)比较的指标也往往不只是一个方面的,例如成绩、工时数、课外竞赛得分等。一个指标得了0分别的指标会对他进行弥补,影响不是很大。(3)有很多指标不存在理论上的最大值和最小值,例如衡量经济增长水平的指标:GDP增速。
只有一个指标时
例二:
成绩是越高(大)越好,这样的指标称为极大型指标(效益型指标)。
与他人争吵的次数越少(越小)越好,这样的指标称为极小型指标(成本型指标)。
这两个直接评判有问题(一个是极大型指标,一个极小型指标),要进行处理
同一指标类型:指标正向化:max-x(写论文里面)
但是这两个指标不能直接相加再按上一步来处理:量纲(单位)不同,一个是分一个是次,要对已经正向化的矩阵进行标准化处理
消除量纲影响:标准化处理
每个元素除以他们的平方和。不会影响他们的相对大小。
如何计算得分?就要对这个方法进行理解。式子拆分成x与最小值的距离和x与最小值的距离加x与最大值的距离的比,意即各评价对象与最优方案的相对接近程度。所以:
现在来算这四个人的各项分数,注意数据的对应性。
之后归一化,在排名
OK啦。
正式总结步骤(3):
第一步:将原始矩阵正向化(三种)
1.极小型转化为极大型(推荐:max-x)或(1/x,x不为0)
2.中间型转化为极大型
先找距离最优值最大的距离
3.区间型转化为极大
数据小的和区间左边比较,数据大的和区间右边比较。
第二步:正向化矩阵标准化
消除量纲(单位)的影响
第三步:计算得分并归一化
模型拓展
1.计算成绩的时候默认权重相同(成绩和争吵次数)
如何取权重:
更改:
练习题(Matlab)对照上文步骤来看
分析:含氧量是极大型,PH是中间型,细菌总数极小型,植物性营养物量区间型。
知识点:基础部分在另一篇:Matlab知识点中。
step1:将原始矩阵正向化
%% 第一步:把数据复制到工作区,并将这个矩阵命名为X
% (1)在工作区右键,点击新建(Ctrl+N),输入变量名称为X,双击X进入表格
% (2)在Excel中复制数据,再回到Matlab中右键,点击粘贴Excel数据(Ctrl+Shift+V)
% (3)关掉这个窗口,点击X变量,右键另存为,保存为mat文件(下次就不用复制粘贴了,只需使用load命令即可加载数据)
% (4)注意,代码和数据要放在同一个目录下哦,且Matlab的当前文件夹也要是这个目录。
clear;clc
load data_water_quality.mat
三种指标正向化 使用自己定义的positivization函数,这个函数里面又有三个自己定义的函数。
%% 第二步:判断是否需要正向化
[n,m] = size(X);%获得数据份数和指标个数
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标'])
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0: ']);
%字符串的拼接,两种方法,此处选择第二种,注意字符串之间有空格
%judge判断是否运行正向化的代码
if Judge == 1 %判断相等是双等号
Position = input('请输入需要正向化处理的指标所在的列,例如第2、3、6三列需要处理,那么你需要输入[2,3,6]: '); %[2,3,4]
disp('请输入需要处理的这些列的指标类型(1:极小型, 2:中间型, 3:区间型) ')
Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]: '); %[2,1,3]
% 注意,Position和Type是两个同维度的行向量
for i = 1 : size(Position,2) %这里需要对这些列分别处理,因此我们需要知道一共要处理的次数,即循环的次数
X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
% Positivization是我们自己定义的函数,其作用是进行正向化,其一共接收三个参数
% 第一个参数是要正向化处理的那一列向量 X(:,Position(i)) 回顾上一讲的知识,X(:,n)表示取第n列的全部元素
% 第二个参数是对应的这一列的指标类型(1:极小型, 2:中间型, 3:区间型)
% 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
% 该函数有一个返回值,它返回正向化之后的指标,我们可以将其直接赋值给我们原始要处理的那一列向量
end
disp('正向化后的矩阵 X = ')
disp(X)
end
%if end结尾
Positivization是自己定义的函数:要单独放在一个m文件里面,且要和主函数在一个文件夹里面
% function [输出变量] = 函数名称(输入变量)
% 函数的中间部分都是函数体
% 函数的最后要用end结尾
% 输出变量和输入变量可以有多个,用逗号隔开
% function [a,b,c]=test(d,e,f)
% a=d+e;
% b=e+f;
% c=f+d;
% end
% 自定义的函数要单独放在一个m文件中,不可以直接放在主函数里面(和其他大多数语言不同)
function [posit_x] = Positivization(x,type,i)
% 输入变量有三个:
% x:需要正向化处理的指标对应的原始列向量
% type: 指标的类型(1:极小型, 2:中间型, 3:区间型)
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示:正向化后的列向量
if type == 1 %极小型
disp(['第' num2str(i) '列是极小型,正在正向化'] )
posit_x = Min2Max(x); %调用Min2Max函数来正向化
disp(['第' num2str(i) '列极小型正向化处理完成'] )
disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
elseif type == 2 %中间型
disp(['第' num2str(i) '列是中间型'] )
best = input('请输入最佳的那一个值: ');
posit_x = Mid2Max(x,best);
disp(['第' num2str(i) '列中间型正向化处理完成'] )
disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
elseif type == 3 %区间型
disp(['第' num2str(i) '列是区间型'] )
a = input('请输入区间的下界: ');
b = input('请输入区间的上界: ');
posit_x = Inter2Max(x,a,b);
disp(['第' num2str(i) '列区间型正向化处理完成'] )
disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
else
disp('没有这种类型的指标,请检查Type向量中是否有除了1、2、3之外的其他值')
end
end
Min2Max函数:
function [posit_x] = Min2Max(x)
posit_x = max(x) - x;
%posit_x = 1 ./ x; %如果x全部都大于0,也可以这样正向化
end
Mid2Max函数:
function [posit_x] = Mid2Max(x,best)
M = max(abs(x-best));
posit_x = 1 - abs(x-best) / M;
end
Inter2Max函数:
function [posit_x] = Inter2Max(x,a,b)
r_x = size(x,1); % row of x 有多少个评价对象
M = max([a-min(x),max(x)-b]);
posit_x = zeros(r_x,1); %zeros函数用法: zeros(3) 3*3的0方阵, zeros(3,1) 3*1的0矩阵。 ones(3) 3*3的1矩阵。和0同。
% 初始化posit_x全为0 初始化的目的是节省处理时间
for i = 1: r_x
if x(i) < a
posit_x(i) = 1-(a-x(i))/M;
elseif x(i) > b
posit_x(i) = 1-(x(i)-b)/M;
else
posit_x(i) = 1;
end
end
end
step2:正向化矩阵标准化
%% 第二步:对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)
% x除以每个元素的平方和,先平方X.*X,后求和,对列求和sum( ,1),1可以省略不写,开根号就是0.5次方。再用repmat对他进行扩展,直至和X一样大
step3:计算得分并归一化
即求与最大值最小值的距离
%% 第三步:计算与最大值的距离和最小值的距离,并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ],2) .^ 0.5;
% D+:与最大值的距离向量,max(z)就是每一列最大的元素。第i个评价对象的分数就是这一行每个数减去对应列最大值的平方的和开根号。其中求和是按行求和,不要忘了2.
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ],2) .^ 0.5; % D-:与最小值的距离向量
S = D_N ./ (D_P+D_N);
% 未归一化的得分,一定是点除./。这个就是那个公式,x到最小值的距离除以到最大值与最小值距离的和(也就是最大值减去最小值)
disp('最后的得分为:')
stand_S = S / sum(S)
%归一化的S
[sorted_S,index] = sort(stand_S ,'descend')
%数据多的时候,分不清谁最大,所以用sort 进行排序,index用以知道最大值所在的位置
练习题:
有时间写:(在正向化的Judge那里更改)
标签:disp,end,TOPSIS,优劣,矩阵,建模,指标,posit,正向 From: https://blog.csdn.net/q15623588795/article/details/137187820