解答:
合并验证集与训练集,计算合并之和的数据集在训练集中出现的次数:
张三 | 喜欢 | 外出 | 旅行 | 李四 | 登山 | 王五 | 不喜欢 |
---|---|---|---|---|---|---|---|
1 | 2 | 2 | 1 | 1 | 1 | 0 | 0 |
那么:
r | 0 | 1 | 2 |
---|---|---|---|
N(r) | 2 | 4 | 2 |
根据公式计算可以得到:
r* | r(0)=2 | r(1)=1 | r(2)=2 |
---|---|---|---|
N(r*) | 2 | 4 | 2(最高次数的N(r*)不变的) |
那么,得到N=2*2+4*1+2*2=12
现在开始求概率,概率公式:
P(0)=2/12=1/6
P(1)=1/12
P(2)=2/12=1/6
验证归一性:P(0)*N(0)+P(1)*N(1)+P(2)*N(2)=1/6*2+1/12*4+1/6*2=1,为1因此正确
s1=“王五 不喜欢 登山"
P(s1)=P(王五)*P(不喜欢)*P(登山)=P(0)*P(0)*P(1)=1/6*1/6*1/12=0.00231481
s2=“王五 喜欢 外出 旅行”
P(s2)=P(王五)*P(喜欢)*P(外出)*P(旅行)=P(0)*P(2)*P(2)*P(1)=1/6*1/6*1/6*1/12=0.0003858