熵是热力学的一个物理概念,是体系混乱度或无序度的度量,熵越大表示系统越乱(即携带的信息越少),熵越小表示系统越有序(即携带的信息越多)。
信息熵借鉴了热力学中熵的概念,香农把信源所含有的信息量称为信息熵,用于描述平均而言事件信息量的大小,所以在数学上,信息熵是事件所包含的信息量的期望(mean,或称均值,或称期望,是试验中每次可能结果的概率乘以其结果的总和),根据期望的定义,可以设想信息熵的公式大概是:
其中H是信息熵,q是信源消息个数,是消息 出现的概率。
可以将熵的大小认为是权重,具体见代码。
matlab代码
%% 极小型转极大型,传入参数为待正向化的向量,返回为正向化后的结果
function [res] = Min2Max(X)
res = max(X) - X;
end
%% 区间型转极大型,传入参数为待正向化的向量,返回为正向化后的结果
function [res] = Int2Max(X, a, b)
M = max(a - min(X), max(X) - b);
for i = 1 : size(X)
if(X(i) < a)
X(i) = 1 - (a - X(i))/M;
elseif (X(i) >= a && X(i) <= b)
X(i) = 1;
elseif (X(i) > b)
X(i) = 1 - (X(i) - b)/M;
end
end
res = X;
end
%% 中间型转极大型,传入参数为待正向化的向量,返回为正向化后的结果
function [res] = Mid2Max(X, best)
M = max(abs(X - best));
res = 1 - abs(X - best)/M;
end
%% 画图
x = rand(100,1);
y = x .* log(x);
plot(x,y);
%% main函数
% clear;clc;
% X=[]
% X = [35.2;35.8;36.5;37.2;38.0]
% X = [0.6;0.75;0.89;0.95]
% X = [180;175;170;185;190]
% X = [60;90;95;81;79]
X = xlsread('date.xlsx');
%% 正向化
disp('***************正在进行正向化...***************');
vec = input('请输入要正向化的向量组,请以数组的形式输入,如[1 2 3]表示1,2,3列需要正向化,不需要正向化请输入-1\n') %注意输入函数这里是单引号
if (vec ~= -1)
for i = 1 : size(vec,2)
flag = input(['第' num2str(vec(i)) '列是哪类数据(【1】:极小型 【2】:中间型 【3】:区间型),请输入序号:\n']);
if(flag == 1)%极小型
X(:,vec(i)) = Min2Max(X(:,vec(i)));
elseif (flag == 2) % 注意这里的else和if是连在一起的
best = input('请输入中间型的最好值:\n');
temp = X(:,vec(i));
X(:,vec(i)) = Mid2Max(X(:,vec(i)), best);
elseif (flag == 3)
arr = input('请输入最佳区间,按照“[a,b]”的形式输入:\n');
X(:,vec(i)) = Int2Max(X(:,vec(i)), arr(1), arr(2));
end
end
disp('所有的数据均已完成正向化!')
end
%% 标准化
disp('***************正在进行标准化...***************');
[n,m] = size(X);
% 先检查有没有负数元素
isNeg = 0;
for i = 1 : n
for j = 1 : m
if(X(i,j) < 0)
isNeg = 1;
break;
end
end
end
if (isNeg == 0)
squere_X = (X.*X);
sum_X = sum(squere_X,1).^0.5; %按列求和,再开方
stand_X = X./repmat(sum_X, n, 1);
else
max_X = max(X,[],1); %按照列找出最大元素
min_X = min(X,[],1); %按照列找出最小元素
stand_X = X - repmat(min_X,n,1) ./ (repmat(max_X,n,1) - repmat(min_X,n,1));
end
disp('标准化完成!')
%% 计算样本概率、信息熵和熵权
disp('***************正在用熵权法确定权值...***************');
P = stand_X ./ repmat(sum(stand_X),n,1);
% 由于ln(0)没有定义,所以我们需要人为的把概率为0的手动指定为一个接近与0的数
for i = 1 : n
for j = 1 : m
if(P(i,j) == 0)
P(i,j) = 0.00001;
end
end
end
H_x = sum(-P .* log(P)); %注意在MATLAB中,想要算ln(x)应该输入log(x);想要算lg(x)则应该输入log10(x)
e_j = H_x ./ log(n);
d_j = 1 - e_j;
%进行归一化,获得熵权
disp('熵权完成,权值为:');
w = d_j ./ sum(d_j)
总代码
%% 初始化和数据读取
% clear;clc;
X = readmatrix('date.xlsx'); % 读取Excel数据
%% 正向化处理
disp('***************正在进行正向化...***************');
vec = input('请输入要正向化的向量组,请以数组的形式输入,如[1 2 3]表示1,2,3列需要正向化,不需要正向化请输入-1\n');
if vec ~= -1
for i = 1 : length(vec)
flag = input(['第' num2str(vec(i)) '列是哪类数据(【1】:极小型 【2】:中间型 【3】:区间型),请输入序号:\n']);
if flag == 1 % 极小型
X(:, vec(i)) = max(X(:, vec(i))) - X(:, vec(i));
elseif flag == 2 % 中间型
best = input('请输入中间型的最好值:\n');
X(:, vec(i)) = 1 - abs(X(:, vec(i)) - best) / max(abs(X(:, vec(i)) - best));
elseif flag == 3 % 区间型
arr = input('请输入最佳区间,按照“[a,b]”的形式输入:\n');
M = max(abs(X(:, vec(i)) - arr(1)), abs(X(:, vec(i)) - arr(2)));
X(:, vec(i)) = 1 - (abs(X(:, vec(i)) - arr(1)) + abs(X(:, vec(i)) - arr(2))) / (2 * M);
end
end
disp('所有的数据均已完成正向化!');
end
%% 标准化处理
disp('***************正在进行标准化...***************');
[n, m] = size(X);
squere_X = X .^ 2;
sum_X = sqrt(sum(squere_X, 1)); % 按列求和,再开方
stand_X = X ./ sum_X; % 使用广播操作
%% 计算样本概率、信息熵和熵权
disp('***************正在用熵权法确定权值...***************');
P = stand_X ./ sum(stand_X, 1); % 使用广播操作
P(P == 0) = 1e-10; % 避免log(0)的问题
H_x = sum(-P .* log(P), 1); % 信息熵
e_j = H_x ./ log(n); % 熵权
d_j = 1 - e_j; % 归一化后的权重
w = d_j ./ sum(d_j); % 熵权向量
disp('熵权完成,权值为:');
disp(w);
标签:disp,end,%%,sum,vec,正向,权法
From: https://www.cnblogs.com/cxy1114blog/p/18459131