系列文章目录
文章目录
一、抽象理解
一篇论文A:西红柿炒鸡蛋
一篇论文B:芹菜炒肉
你就可以:西红柿炒肉
二、具体做法
1、什么是Baseline(基础实验)
有些人的Baseline写得很隐秘,让人以为是他自己创造的,但这篇论文不一样,他表明了
一篇论文A:BERT 17年
一篇论文B:ESIM+BERT(基准模型baseline是BERT,水刊的baseline往往来源于顶刊),模块是ESIM。 18年
一篇论文C:Bi-LSTM+Attention+BERT(基准模型是BERT) 19年
上图中论文的作者:Bi-LSTM+Attention+BERT+QE(基准模型是BERT+QE),模块是Bi-LSTM+Attention。20年
结论:顶刊(baseline)+模块(来处不明) ===》四区(50%),三区(写得好),二区以上(看运气)。模块数越来越多,但是创新的贡献度不大。
期刊排序:sci,顶刊(一区top),一区,二区,三区。但是还是有四区,ei期刊,核心,ei会议,大学学报,普刊,不入流的会议。
2、怎么和导师说
“老师啊,我发现了几个模块,挺好的,我准备把他们拼在一起,找个基准型,放上去。” 这样导师一定会说你在拼凑论文,毫无贡献意义,只能放在毕业论文上,不能放在期刊论文上。
既然我们发现了几个模块,我们需要有逆向思维。
研究的本质是发现问题并且解决问题。我们现在发现了问题(几个模块),解决问题(合并这几个模块)。但这样没有针对期刊论文贡献意义。
我们要转换成研究的本质:发现问题(发现了现实意义上的问题)解决问题(合并这几个模块)。比如我发现我们这个领域,有问题1、2、3,我想到了一个办法可以同时解决这三个问题,使用的是这三个模块的合并。
3、怎么做
一篇顶刊一个Baseline,1000,一篇水文3个模块,1000,一共3000个模块
我们假设我们加3个模块,总共有多少种水论文的方法:10001000999*998。
找一个baseline(最好能跑通的开源的代码)A,然后先找模块a,拼上去,有用,去一个问题,没用,滚蛋,换一个
找一个baseline(最好能跑通的开源的代码)A+a,然后先找模块b,拼上去,有用,去一个问题,没用,滚蛋,换一个
然后,再去给a和b找问题,找故事,A+a+b+c,同时解决了3个问题。
压低baseline
不同的模型可以使用不同的参数,参数套数是无穷的。
A的性能可能固定了,但是我加了模块之后可以改参数变化性能。
A+a,用第一套参数(用差一点的,我脑子就这么大,我没想到,还可以用这一套参数),效果差一点。
A+a+b,用第二套参数(用好一点的),效果就好了。
随机数种子:我A+a用差一点的随机数种子,A+a+b用好一点的随机数种子。装作不知道可以用随机数种子来固定模型的性能。其实一旦开源全是扯犊子和美化(美化即学术造假:一个指标跑了50,我写51,我把随机数种子去掉,评职称一定不能用这种方法)。
4、怎么写
一定要引用,在不起眼的角落(红色的关闭,换成灰色的,然后巴不得比蚊子还要小)。
a是别人的模块,随便换点东西啦得到a’。a’就不是他的拉。
一切的一切的,都归根于,你知道的(睁眼瞎(针对参数,比如A我用的这套参数,但是A+a用的那套参数),当做自己没看过),审稿人不一定知道即使他知道了,那么我就换个期刊投。
注意:不讲(你自己也不知道),不叫学术造假。你讲了的,一定要是真的!!!通过不讲,把假的营造出真的那种感觉。