137 数据科学团队养成:电话面试指南

眼下,数据科学或者人工智能团队已经成了很多数据驱动公司的标准配置团队,数据科学家或者人工智能工程师也成为了最“性感”的职业。不少公司都在想办法建立或者扩展自己的数据科学团队。那么,对于一个公司来说,究竟需要什么样的数据科学团队呢?这就成了很多公司在发展过程中都会遇到的棘手的问题。

我们在之前的一篇分享里已经剖析过,作为一个工程团队的负责人,你该如何招聘自己的数据科学家团队。在那篇分享里,我们探讨了目前人才市场上大致有两类数据科学家,一类偏数据分析,一类偏算法模型。并且我们详细探聊了聊这两类数据科学家所需的技能和在不同团队(比如大团队和小团队)中起到的作用。

今天,我们来聊一聊组建数据科学家团队所必不可少的一个步骤:电话面试。

筛选简历

在电话面试之前,有一个步骤是必不可少的,那就是筛选简历。因为人工智能和数据科学家的职业背景的原因,我来分享一下如何筛选具有博士学历,特别是计算机专业相关毕业生的简历。筛选简历的过程需要很细心,对于普通的博士毕业生,我们会快速看以下两个方面的信息。

第一,候选人是否有高水平的论文发表。关于论文发表,首先需要看的是论文档次,也就是论文是否发表在高质量的会议上或者高水平的期刊上。对于计算机专业的博士生来说,会议一般比期刊更重要。其次,我们也要看候选人的论文是专注一个问题或者一个小领域还是很多领域都有涉猎。同时,对于这些论文,要关注候选人是第几作者。然后,我们需要关注的是论文发表频率,看论文工作是否都是一年做出来的。最后,我们可以去看一看这些论文的引用数。一般来说,博士刚毕业不会有很高的论文引用量,但也不乏水平比较高的候选人,论文会有惊人的引用量。

第二,我们需要看一看候选人是否有工业界实习经历,是研究实习还是工程实习。这里面,我们可能关注的是实习的公司。而且,我们可以关注是否是同一家公司还是多个公司。如果是研究实习的话,我们还需要去看一看候选人是否有相应的论文发表。

在看了这两个因素之后,我们心中对于这个候选人就有一个很基本的认识。在需要高标准的情况下,一个博士毕业生需要有3-4篇第一作者的高水平论文发表(在毕业的时候,引用数在70-100左右),然后有1-2次工业界实习经验

除了这两个硬指标以外,我们还会关注下面这些内容:

  • 简历里是否有一些信息不完整的部分。比如有一些明显断档的经历,没有本科学校,没有说明博士生导师;
  • 会什么编程语言和开发工具。是否只熟悉Matlab或者R,是否有开源项目贡献;
  • 是否已经有审稿经验;
  • 是否已经有组织会议的经验。

所有这些因素都没有明显问题之后,我们已经定位到了比较靠谱的候选人(通常,只有少数人能够通过上面这轮简历筛选)。我们可以根据实际情况来调整在筛选简历这里的标准线从而让候选人能够和我们直接交流证明自己的实力。

这里再说几个比较细的准则:

  • 博士生的论文中,非第一作者的一般不算数;
  • 已经发表的会议论文和同一内容的期刊文章算一篇;
  • 可以有非第一档次会议或者期刊的论文,但没有第一档次就很难说明问题;
  • 如果有单一作者的论文,是一个比较大的问题,电话面试的时候一定要问清楚原因;
  • 课程项目原则上也不算数(注意,这是对博士毕业生而言);
  • 简历是LaTex生成还是Word;
  • 毕业学校和GPA,一般不是很侧重要考虑的问题。

再说几个对于已经有工作经验的候选人的简历筛选要素:

  • 如果有教职经验或者博士后经验,原则上是一个大问题,需要电话面试问清楚;
  • 一两年左右频繁换公司是一个大问题,需要电话面试问清楚。

这里要多说一句的是,上面这些标准是对计算机相关专业比较适用的准则。而对于数学、应用数学、统计、物理等专业的人来说,可能有些标准需要重新设定(比如发表论文的标准需要降低)。总之,这里说的是一些比较大的方向,不过在把握了这些原则之后,我们就可以安排少量的候选人电话面试了。

这里我们简单说一下对于硕士阶段的候选人的简历筛选。一般来说,硕士和博士有不同的培养目标,因此上面所说的很多标准和原则对硕士毕业生并没有完全的指导意义。对于硕士毕业生来说,公司实习经验是很重要的。不排除一些优秀的硕士毕业生已经有论文发表,因此这方面也可以降低一些标准来衡量。对于硕士毕业生来说,学科项目可以作为一些参考,不过因为大多数学科项目都没有真正的应用性,我们只能从一个侧面了解这个候选人可能具备的一些技能。

电话面试

筛简历的过程之后,就是电话面试了。电话面试的目的是要验证这个候选人是不是像简历里所说的那样有相应的经历。当然,有一些公司在电话面试的时候也会考察候选人解决问题的能力,这个内容也会经常出现在电话面试的安排中。对于科学家的职位,我们一般需要1-3轮电话面试,来了解下面这些信息:

  • 了解候选人简历上的基本信息,如果对简历上的内容有疑点,需要在这个阶段问清楚;
  • 考察候选人是否具备基本的专业知识,并对相关领域有一定的见解,考察候选人是否有其他领域的知识;
  • 考察候选人是否有基本的专业相关的编写代码能力;
  • 初步感知候选人的表达能力。

在询问候选人简历信息的时候,以下这些内容是需要弄明白的:

  • 对于候选人是第一作者的论文,候选人是否能够很清晰地说出这些论文所解决的问题及解决思路。在进一步的沟通里,候选人是否能够讲清楚模型细节甚至是公式细节。候选人能否把实验的目的、数据、比较算法讲清楚。当然,这需要面试官提前做好准备。同时,询问候选人其他作者在这篇论文中的贡献;
  • 对于候选人是非第一作者的论文,询问候选人在这个工作中起到了什么作用。看候选人是否诚实可信,也可以看出候选人的学术道德水平;
  • 对于单一作者的文章,需要候选人解释为什么这个工作没有合作人,博士生导师为什么不是合作者,这个论文的研究时间如何而来;
  • 对于有博士后经验或者教职经验的候选人,要询问候选人是否了解工业界研究和学术界研究的区别,如果以后有机会,是否还考虑学术界教职;
  • 对于有工作经验的候选人,要询问候选人反复换工作的原因,询问清楚候选人在项目里的具体贡献,候选人的职业规划,看职业规划和简历经历是否相吻合。对于在某一个公司待了很长时间没有升职的候选人,也需要询问一下为何在原公司里没有其他机会。

在考察候选人专业知识的时候,需要弄明白以下这些内容:

  • 对于某一专业最基础的一些概念和知识,候选人是否能够清晰地讲解出来。这一条其实很多人很难做到,不少人能够做复杂的工作,却往往在最基础的内容上含混不清。而在一些跨领域的工作中,基础知识往往是一个科学家所能够依赖的,提供解决方案的最初的工具。所以,基础很重要;
  • 候选人是否能诚实地说明自己懂什么,不懂什么。在广泛的领域里,科学家应该有足够的自信说自己的专长是什么,自己的局限在哪里;
  • 候选人是否对跨领域知识一窍不通,还是略有知晓,界限在哪里;
  • 在考察编程水平方面,虽然很多公司已经有比较完备的方案考察软件工程师,但这些题目和考察目的其实不太适合科学家,这需要公司专门针对科学家制定一些考察题目。

在上述考察候选人各个方面的过程中,一个贯穿始终的主题就是要看候选人是不是能和面试人员进行有效的沟通。当然,也要考虑到,有人可能不太适应电话面试,而在面对面的交流时则毫无问题。

小结

今天我们分析了组建一个数据科学或者人工智能工程师团队,你需要招聘什么样的数据科学家。我们重点讲了讲如何筛选博士阶段候选人的简历以及电话面试的问题,我们是从招聘的角度来讲这个问题,那么从应聘的角度来看,也希望能给你一些启发和借鉴。

最后,给你留一个思考题,如果一个候选人并没有什么论文,但是有多年的企业经验,如何来衡量这样的候选人呢?