20230228:mzR,Norm,Regression
-
mzR:
mzML格式读取是使用proteowizard C++库.
常用函数:读入数据的openMSfile
,提取数据矩阵的header
以及提取峰图谱的peaks
-
Norm范数
L0 Norm:c(0,0)的L0 Norm等于0,c(1,0)的L0 Norm等于1, c(1,2)等于2
L1 Norm:用于Manhattan Distance or Taxicab norm这些距离计算,比如说c(3,4):
L2 Norm:这就是著名的欧式距离计算公式了
L-infinity norm: 给出这个向量中绝对值最大的,比如c(-6,4,2). L-infinity norm=6
-
Ridge Regression and Lasso Regression
原理都差不多,但是惩罚项不一样Ridge Regression:
Lasso Regression:
他们的惩罚项一个是平方和,一个是绝对值的和.
一个是L2正则化,一个是L1正则化.
正因如此,Lasso回归不仅有助于减少过拟合还能帮助我们进行特征选择。