Skip to content

论文阅读

深度学习领域中,算法往往是与时俱进,当我们想要进行具体的科研的时候,往往需要聚焦于当前发表的最新算法,而与它们进行比较并且凸显自己算法的优胜性。在这一过程中不可避免的,大量的论文阅读是必须的,一方面,大多数的工作都是基于前人的改进而完成的,而从最新工作上进行的改进往往是距离先进性能最近的。在另一方面,频繁地了解领域内的最新动向也可以帮助你抓住这一领域的发展趋势,并且增加自己对于这些领域中任务的见解。

首先,对于英语能力不强的同学来说,使用合理的翻译软件永远是第一位的。事实上,不擅长英语并不意味着难以阅读学术论文,虽然一时间是用翻译软件,但是并没有必要因此而焦虑,例如”使用翻译软件是否意味着我的基础不牢,专门练习英语是否是必要的?”。尽管人工智能领域的论文中确实经常充斥着大量的专业词汇,但是一方面专业词汇意味着其本身的定义就在论文中,获得一个中文上信达雅的翻译往往不是必须的(也很好的解释了科研领域的大家为何经常中英文混杂),而另一方面,在长期的阅读之后,至少对于某一细分领域中的常见的专业词汇,读者也会比较眼熟,从而可以慢慢摆脱翻译工具。对于翻译工具的选择,一般来说选择可以划译的软件或者插件是最为优雅的方法,将不懂的词汇或者句子复制到翻译软件中是一件麻烦的事情,而且会破坏你的workflow。同时,假如说需要更加贴合领域中的内容的翻译,选择一些更加强大的翻译工具(e.g., DeepL/ChatGPT)也是可以的,假如说对于插件的配置不太了解,在这种场景下使用复制粘贴的方法也是可以接受的。

接下来便是论文的内容部分,在这里有必要先了解一下人工智能领域的学术论文的格式,同时在这部分中慢慢了解重点:

摘要(Abstract)

全文的摘要,也就是全文的内容的提炼,对于常见的解决任务的论文来说,大概内容为:在XX任务中,存在XX问题,我们提出了XX,效果是XX,获得了XX性能。通常来说,摘要可以让你对于全文的内容存在一个基本的了解,但是基本上也只是存在于一些故事下的名词以及一些故事之中,在接下里的阅读之中,有必要格外关注这些名词。

引言(Introduction)

全文的引言,也是重中之重。我们常说,当今的人工智能领域中充斥着大量的“讲故事”行为,也就是通过一种没有经过数学严格论证(但是确实可以通过实验证明性能提升或者展示某现象来进行佐证)的对于自身提出的方法为何可以work的解释,而往往阅读一篇论文,第一步就是了解其故事线。

  • 故事线:尽管我们称之为故事,但是既然可以中稿(一般我们选择阅读已经中稿的论文,也只有这些论文的SOTA通常具有效力),证明至少审稿人已经认可了其解释的合理性,那么了解作者如何看待这个任务中的问题,已经认为如何解决,自己的方法为什么可以解决,是很重要的一部分。同时,相同领域的论文中,method的motivation也是很值得参考的一部分。
  • 一般来说,在引言的最后也会存在一次的概括,这种概括类似于摘要,总结了自己的contribution,这是很重要的理解论文的内容的途径。
  • 通过了解引言,一般来说已经可以知道了这篇论文在这个任务中解决的是什么问题,以及是通过什么方法解决的这个问题,这种方法的合理性是什么。事实上,Method部分通常是对于方法的详细说明,而并不存在有效性的证明,也就是说通常读到这一部分就可以决定这篇论文对你来说是否具有启发性了,假如说是对于论文的速读的话,甚至说这篇论文的阅读已经可以到此为止了。
  • Pipeline图:通常来说,论文的引言部分会跟随着几张插图,其中Figure 1大概率是关于论文的motivation的直观展示(为什么要使用自己提出的方法,进行可视化),而Figure 2或者Figure 3则是论文中提出的方法的Pipeline图。所谓Pipeline图,也就是把论文中提出的方法通过流程图的方式表述出来。**有一种说法说,一篇好的论文,只看文字可以读懂,而只看插图也可以读懂。**一般来说Pipeline图中的信息量是很大的,也可以对论文中使用文字描述的method产生一种直观的理解。最后,不得不说的是,在自己进行科研产出的过程中,作图一直是考验审美的一环,遇到做工精细的Pipeline图可以进行保存,将来加以借鉴。

对于绝大多数的文章,相关工作这部分的内容均是阅读营养较低的,除了以下的两种情况:

  • 读者作为该领域的初学者,不了解该领域中的发展脉络。在这种情况之下,阅读相关工作可以帮助你从当今的SOTA的角度来审视这一领域的发展脉络。
  • 作者在文章中引入了本不属于该领域常用的其他方法。人工智能领域中的不同方法,尤其是不同的下游任务之间,方法是具有泛化性的,因此引入来自其他领域的方法也就不足为奇了,假如说读者对这些方法并不了解,相应的阅读还是有必要的,一方面可以了解作者的故事线,而另一方面也可以开拓自己的思路。

方法(Method)

方法部分,看上去是整篇论文的精华所在,但是事实上其阅读价值也是有待商榷的。

正如上文说到

Released under the MIT License.