#今日论文推荐# 陈天奇、王威廉等人推荐:ACL最佳论文奖得主给新入行研究者的一点建议
#今日论文推荐# 陈天奇、王威廉等人推荐:ACL最佳论文奖得主给新入行研究者的一点建议
#今日论文推荐# 陈天奇、王威廉等人推荐:ACL最佳论文奖得主给新入行研究者的一点建议
本文将对两篇篇博客的中心思想进行了编译整理(以第一人称转述),内容如下:
前提:扩展你的相邻可能
想法往往出现在你当前知识的相邻可能(adjacent possible)中。你知道的越多,就越容易提出新的想法。我认为一个好的经验是努力对自己的很多相邻领域进行广泛的概述,然后在自己的领域真正地深入研究,或者根据需要解决项目中的一个子问题。更具体地,课程和调研论文非常适合获得广泛的概述,这是因为其他人已经以连贯的思路编译、组织和呈现重要信息,省去了你的诸多麻烦。
对于课程来说,很快就会过时或者没有涵盖你想要获得详细概述的子领域,比如你很容易找到一门 NLP 课程,但很难找到 NLP 中关于可解释性的课程。最近的论文或演讲可能更新,但也可能很快就会过时。关键在于了解整体研究趋势,而不陷入细枝末节中,除非你想深耕某一领域。我就会特别关注人们正在解决哪些问题、哪些技术最先进以及如何完成评估。
与此同时,我还有意识地在日程安排上留出一些学习的时间,但在弄清楚读什么或者学习什么方面并不是非常系统,有时随机性可能也挺好的。
比如,如果我在不同的论文中看到了自己不熟悉的问题或技术,通常会下功夫学习它们。我还请求合作者给我发一些他们最近非常喜欢的论文。我喜欢使用的另一种启发式方法是阅读在 ML 和 NLP 顶会中获奖的论文,即使与我的研究无关。最后,我强烈建议在 poster 环节四处走动并与作者多多交流,以便为未来的学习努力积累素材。
提出想法的启发式方法
除了努力扩展相邻可能之外,我还喜欢如下几条启发式方法。需要注意,这些方法是相互重叠的,虽然不甚详尽,但我认为它们非常有用。
启发 1:在重要问题上设置「过滤器」
美国数学家 Richard Hamming 曾提出过一条著名的建议:你应该了解自己所在领域的最重要问题是什么,并努力解决它们。这条建议还有一个鲜为人知的附录,对伟大的科学家进行了描述:
他们通常有 10 到 20 个想要解决的重要问题。当他们看到一个新想法出现时,人们会听到他们说「这个想法与这些问题中的某一个相关。」
我认为这里发挥作用的原则是,当我们有意识地优先考虑某件事时,往往注意到其他事情与它的关联,却看轻任何其他的一切。列出重要问题的清单是一种有目的地设置过滤器的方法,能够帮你在阅读论文、观看演讲或处理其他事情时注意到关联。换言之,这是一种确保你始终检查自己获得的新知识是否可以在某些问题上展开相邻可能的方法。
我认为,设置过滤器通常是一种极好的做法,而做到这点的一种方式就是一一列出你想要提出想法的事情。我的问题清单当然由自己的兴趣和偏好决定,但也发现向自己尊重的研究者询问他们最重要问题的清单并咨询自己清单中应该推迟的项目很有用。
启发 2:调研失败 / 烦恼
在进行研究(或课程项目)的过程中,大多数人常常会遭遇失败,也就是尝试了一些没有效果的事情。当你觉得一些技术应该可以解决自己的问题但未能如愿时,尤其令人恼火。
不过,这样的失败和烦恼是培养新想法的沃土,但前提是你需要花时间弄明白问题在哪里以及什么导致了问题的发生。由于这些失败往往与你当时实际做的任何事情关系不大,因此当你找到应对方法或放弃时,很容易会忽略到它们。相反,我建议记下并做出一个我搞不懂的失败清单,以便之后继续调研。
我非常喜欢这种方法,因为在无意中搞定了自己的博士论文题目。我曾经在谷歌实习,训练的一个模型在现实世界中表现糟糕,尽管它具有很好的交叉验证准确率。我花了很多时间获得新数据、进行输入扰动和观察预测结果。这真的让我很烦,毕竟花了这么长的时间才搞清楚自己的模型实际表现怎么样。我的导师让我就这个实习项目做一个展示,而我最终只谈了自己的烦恼,而不是在实习期间具体做了什么。
之后,导师问我是否想要解决这个问题。当时我正在进行一个不相关的课题(分布式系统和机器学习),但还是转向了该问题并写出了下面的论文,并为我余下的博士研究定下了基调。我的很多其他论文也都以类似的方式写出来,这都与我倾向于研究让自己烦恼的事情相关。
论文题目:"Why Should I Trust You?": Explaining the Predictions of Any Classifier.
详细解读:://www.aminer.cn/research_report/62d666e07cb68b460feec619
AMiner链接:/?f=cs
- 计算机中的位,字节,字,字长的概念
- jkd1.8 list.stream()练习
- Linux JKD1.8 安装及配置
- 亲测Linux服务器安装JKD操作流程
- SQLite Expert 5.X 通用注册版
- CStdioFile 一些基本用法
- 帕累托最优解集
- chromium 37 chrome Native messaging 本地消息机制
- nginx 做均衡负载
- 高并发部署策略 多副本服务+nginx均衡负载
- 【Jmeter 简单使用】
- CDQ分治 模板
- http状态码(204,304, 404, 504,502)
- EM+GMM
- 【分布式微服务】消息中心初步搭建
- Hadoop安装与部署
- 为什么调用Dao层会报空指针异常