首页 > 其他分享 >第一篇论文投稿的收获与总结

第一篇论文投稿的收获与总结

时间:2023-01-01 10:33:40浏览次数:40  
标签:loss 投稿 论文 第一篇 王老师 收获 small noisy

posted @ 2020-02-01 15:21

前段时间总算是向 IJCAI-20 会议投出了人生的第一篇论文。这篇投稿个人看来还是有很多漏洞和不足之处,但也算是完成了个人前进的一小步吧,后续还得继续加油努力,争取有更高质量的投稿。先来对上学期的科研经历做一下总结。

大四及研一两年一直把时间都浪费在了 Crowdsourcing 上。事实证明,选择了一个错误的课题,科研过程事倍功半。Crowdsourcing 领域要数据集没有数据集,又没有统一的对比算法,全是往上堆一些新的东西,根本不太好做。在读完了大量的 Crowdsourcing 领域的文献后,却没有一点头绪,确实感觉做不出来。

从2019年5月份起,大概就开始准备做 noisy label 方面的科研,于是读了大量的文章,暑假一直在尝试把 (ICML-18)Learning to reweighting for robust deep learning 的 idea 用来修改 noisy label,但发现似乎模型会严重地过拟合于一个小的 unbiased dataset,导致效果无法提升上去。
然后大概在 9月初,读 (ICML-19)Unsupervised Loss model 发现确实有 clean example 具有 small-loss 这一个特性,然后在结合半监督学习 MixMatch 技术发现有不小的提升。于是就兴致冲冲地准备就此写一个论文投 CVPR-20.

最初的第一个版本:

  1. 使用双峰间的距离作为 early-stopping 的准则来挑选一个 epoch 的loss values
  2. 构造了一个方法来估计 noisy rates

但后续试验发现:

  1. 在 structured 和 pair 下 loss distribution 根本不形成双峰分布
  2. 估计noisy rates 的方法在structured 以及 pairwise下也不太准确

因此,在后续版本中,

  1. 采用了 mean loss,从而避免了没有一个合理的准则来挑选某一轮的 loss 以及单轮 loss 存在波动的情形。
  2. 把估计 noise rate 的那部分给去掉了。

当时是准备投稿 CVPR-20 11.15号左右,但我当时没有做得特别好,并且实验也没有跑完。
后来王老师建议投 IJCAI 或者 ICML,然后让我加一个关于 small-loss 的理论分析上去。但其实最终关于 small-loss 的理论分析,王老师的贡献更大。

写论文是在是一个技术活,从 11月15号一直到1月22号,整整两个月一直在改论文,改来改去,改了好几版,最后仍然没有写到令自己满意的程度。
可能是我之前一直确定好这个工作的主要贡献,我先前一直认为主要贡献是修改了 small-loss trick, 但是王老师观察点和我并不一样。
最终我仍然觉得摘要写的平平无奇,理论部分的贡献似乎并不太够,不应该被强调,但王老师的写法还是强调了。
并且我先前费脑子想的写法,发现远远没有王老师帮忙修改后来得简洁精炼。我自己写得是真的烂,没有王老师帮忙改,根本投不出去。啥时候我要是能把写作功底练好,就好了。王老师帮我改到了1月22号凌晨2点多。然后说第二天还有其他事,确实是辛苦王老师了。

自己未来还有很长的路要走,加油。吸取目前一年来的经验和教训
1.做实验千万不要拖拉,赶紧做,是否 work 必须要有感觉
2.即使实验结果不好,不要沮丧失望,也要继续尝试,千万不要停下来
3.快,再快一点,一定要快,科研千万不要拖延,越拖延,内心越乱
4.认真科研,认真学习,认真生活
5.注意学习领悟导师的教导,多向他人学习。
6.做得差说明还有很大的提升空间,这未尝不是一件好事

标签:loss,投稿,论文,第一篇,王老师,收获,small,noisy
From: https://www.cnblogs.com/Gelthin2017/p/17017783.html

相关文章

  • 2022年总结--文化接口人的收获
     2022年我还接了个新活儿,那就是担任室内的文化活动接口人,并有另外三个小组的组接口人配合我开展工作,这其实是一个虚拟小组,纯属在完成日常测试工作过程中兼职。......
  • 新年第一篇---算法浅谈
    一、前述2020是不平凡的一年。展望2021,希望大家都能有所收获。在此谈下算法方面的工作。二、工作类别目前算法工作的话,第一类是数据挖掘,它包含的知识,跟机器学习相关度会更大......
  • 第一篇博客随笔
    前言初次接触,博客园还是网上搜程序报错,从一开始羡慕大牛写的博客,慢慢开始自己尝试通过这种方式,记录自己的学习。其实想法非常简单,仅仅是想把自己学习中学到的知识及解决......
  • 第一篇 MarkDown语法
    一级标题前面加一个井号后空格二级两个井号三级三个井号字体效果(*~不加空格)helloword两边加两个**加粗,helloword两边各加一个星号变斜体helloword两边......
  • 第一篇blog,水一下。
    洛谷P1001A+BProblem对我来说,非常的困难简单,思路就是,新建两个变量,然后输入,接着输出它们的和。。。#include<iostream>usingnamespacestd;intmain(){in......
  • 老男孩教育 | 27岁转行做运维,收获月薪14K Offer,用实力证明自己!
    不得不说,赚钱对于普通人来说真的是一件很难的事情,因为我们习惯了上班,习惯了每天的两点一线,习惯了每月领取那点微薄的收入。尤其是在X情时代,很多人不敢做出改变,选择了安于现......
  • 这是我在51CTO博客的第一篇博文
    普通本科2022毕业生,在一个初创小企业工作学习日记,不定期分享一些网管小知识。欢迎大家一起探讨问题。最近有在研究虚拟机的使用,也是才刚刚开始学习。分享一个虚拟机如何在其......
  • 我的第一篇随笔
    C++核心编程本阶段主要针对C++面向对象编程技术做详细讲解,探讨C++中的核心和精髓。1内存分区模型C++程序在执行时,将内存大方向划分为4个区域代码区:存放函数体的二进......
  • 什么是数据管理?看完这篇你一定有收获
    如今的大数据成为一切生产经营活动的主要驱动因素。由于每天都会产生大量数据,因此我们需要有更好的数据管理解决方案是理所当然的。任何想要在今天取得成功的企业或企业都需......
  • 读书之《程序员修炼之道:从小工到专家》十二月第一篇
    设计文档里的圆圈和箭头用来解释他们指代的作用,但这还有可能是推翻我们原先设定的证据。感觉这个是承接上一节的内容,不要被以前的假设和设计所限制,留有一定的弹性空间。我......