联系我们 联系我们 电话 021-63528192

数据科学和数据科学家的现状—美国篇

揭秘美国数据科学和数据科学家的现状

Related Posts/Categories
2022-02-10 3年前
前言: 
在过去十年中,数据科学和数据科学家已成为美国商界最热门的术语。其原因是数据科学被认为是商业中不可或缺的一部分,因此数据科学家成为了当下最具有吸引力的职业。 
 恕康将在本篇中介绍美国数据科学家的现状并探讨“什么是数据科学家”、“如何招聘数据科学家”。为了让大家能更好的理解,我们采访了一位在美国数据科学领域拥有近10年经验的高级数据工程师,并做出了以下总结。 
 
一、数据团队 
想要了解数据科学家,首先我们需要全面的了解数据团队。其实在一个数据团队中并非每个人都是数据科学家,团队角色一般被分为数据科学家、数据工程师和数据分析师。 如果是更复杂的项目,还会需要一名机器学习工程师或者人工智能工程师。数据工程师主要负责制作数据模型并构建数据管道, 其中最重要的是数据的“Extract(提取)、Transform(转换)和 Load(加载)",简称为“ETL”。 
 
 ETL是指把数据从混乱的原始数据中提取出来,汇集成计算机容易识别的数据,并将其数据传输到数据仓库的过程。这样可以让数据科学家使用干净、准确的数据来建立模型并改善预测模型。由于数据科学家也要做大量的分析工作,所以一般比较简单的分析任务会委托给数据分析师和业务分析师。最后的数据分析结果会由数据科学家展示给数据团队以外的人。此外,数据科学家还会根据预测模型的结果建立一个新的预测模型或改进现有的预测模型。
具体工作参考

一般数据工程师和数据科学家都是行业经验较高且技术熟练,在美国,他们的平均工资都在10万美元以上。相反,数据分析师往往技术和经验较少,平均工资在7万至8万美元之间。如前所述,数据团队中还有其他职位,但这些是最常见的。 
 
二、数据科学与数据科学家 
 
随着数据存储和处理能力不断提升,数据科学也在不断进步。 数据科学越精密越复杂,它就越难以被准确定义。 在美国,除了内行人以外,外行人并不了解数据科学家到底是干什么的,也不了解他们的工作内容。 为了解决这个问题,业内人士正在明确数据科学家的概念,让大家可以对数据科学家有一个基础的认知。 
 
例如,麻省理工学院(Massachusetts Institute of Technology,略称:MIT)数据科学部门的负责人提出了以下定义: 
从数据中提取出价值的过程,包含了多个步骤,这个复杂的过程被统称为数据科学。 
 
MIT指出,随着数据科学变的越来越复杂,数据科学家也会变的越来越难以区分。因为从业者会被知识、技能的高低而左右。而数据科学其实是建立在编程、计算机科学、线性代数、统计学、数学分析、机器学习、算法等基础之上。由于技能要求较高,团队中会出现拥有不同技能、不同经验的同事以此来互补。 因此,恕康认为明确概念之前首先需要先全面了解各个职位的作用,以及所需的技能再去定义。 
 
尽管在2012年数据科学被评为 "21世纪最热门的工作",美国仍然缺乏有经验的数据科学家来满足市场需求。虽然GAFMA(Google、Apple、Facebook、Microsoft、Amazon)为首的高科技巨头在持续招聘数据科学家,埃森哲、德勤、沃尔玛、耐克等公司也加入了招聘数据科学家的队列中。 
 
从领英的数据来看,数据科学家的招聘广告数量自2012年以来增加了650%。2016年,Glassdoor上数据科学家的招聘广告有1600条,2020年增长到了6500条。 
 
因为数据科学家需要具有较高的学历和技能,所以将数据分析师培养成为数据科学家其实并不简单。因此企业展开了“人才争夺战”。从雇佣条件中可以看出各个公司为招揽人才不惜“狠下血本”,提供高薪并推出了各种丰厚的福利。 
 
三、数据科学家的招聘模式 
 
恕康在美国各个热门的招聘网站(领英、 GlassDoor和 Indeed) 上调查了与数据科学家相关的岗位信息。以“数据科学家”关键词进行搜索,大约出现了23,000条招聘信息。 这个数字证实了数据科学家在美国市场中有大量需求。 在本节中,恕康将对数据科学家的常见工作地点、招聘企业、薪资和岗位要求进行进一步的介绍。 
 
1、工作地点 
大多数工作地点都是金融行业、IT行业和政府机构所在的大都市。其中,纽约的招聘岗位最多,其次是西雅图和旧金山。纽约金融行业非常强大,在IT行业的地位也越来越高。而西雅图是微软总部的所在地,旧金山是硅谷的所在地。虽然数据科学家在美国各地的需求都很高,但纽约、西雅图和旧金山这三个地区是年轻的数据科学家们非常向往的城市,也就是说在这三个地方拥有分支的企业与其他企业相比是非常有竞争优势的。 
 
2、招聘企业 
大部分的企业都不了解数据科学和数据科学家,所以一般会先聘用后了解,甚至不去了解岗位职能的企业也有很多。这样一来,整体需求虽高,但是人才流失率也会变得非常高。 
 
由于企业内部没有做好基础设施准备,不了解数据科学家的价值以及他们的作用。导致这些企业虽然招聘了数据科学家,但却期待数据科学家能做到数据工程师的工作。 2018年《金融时报》向64,000名有开发经验的人员为对象进行了调查,结果显示,在所有开发者中,机器学习专家和数据科学家在寻找新工作上所花费的时间最多。 
尽管需要数据科学家的行业呈上升趋势,但IT行业的招聘广告比其他行业都要多。 此外,除了IT行业,咨询公司、零售商、数字企业和金融机构等也在大量招人。 

3、薪资 
由于岗位的人才需求量较大,薪资也非常高,因此形成了所谓的卖方市场( Seller's market ),供给小于需求。根据美国的招聘网站上发布的职位信息,数据科学家的薪资大多都超过10万美元,其中领英上有40%企业支付的薪资在14万美元以上。 
4、数据科学家的岗位要求 
为了进一步的了解美国企业的招聘要求,恕康整理了美国招聘网站上最具有代表性的6家企业的招聘信息。信息里包含了工作所需的技能、教育程度、经验等。 
 
企业招聘信息对比

在上述数据中我们可以看出,最受企业青睐的是数学、统计学专业的本科学历的毕业生,并且要求至少有3年以上的工作经验。其中,最受欢迎的技能是Python和SQL。另外,虽然在表格中没有明确记载,一般还会要求数据科学家能够将晦涩难懂的技术方案以浅显易懂方式传达给一般人。另外,企业也非常看重协同工作的能力。 
以下两个图列举了2021年企业对数据科学家和数据工程师的技术要素统计。通过对比,我们可以看出两个职位之间的不同。 
 
四、意见与总结 
 
恕康认为,企业和数据科学家面临的问题有两个方面。  
首先,培养数据科学家需要很长的时间。大多数企业都希望聘请具有硕士或博士学位的并且有3年工作经验的数据科学家。但是获得硕士或博士学位至少需要花费6至9年的时间。 
 
其次,公众对于数据科学和数据科学家的认知引发了一些问题。  
例如,企业在没有具备合适的基础设施的情况下聘用数据科学家、没有充分实现数据科学家的价值、以及对数据科学家的知识技能要求过高等。 
 
但是,从数据科学和数据科学家的需求可以预测,数据行业未来还会持续发展,公众的认知度也会越来越高。现在麻省理工学院数据科学科的专家们,也在积极的解决现阶段所出现的问题,只有解决了问题才能使数据科学和数据科学家在社会中发挥最大的价值。 

image

专注数据

MAIL

用数据改变
与您共创大数据时代

咨询

CALL

如果您对我们的服务有什么疑问
欢迎来电咨询

电话
021-63528192 工作时间:9:00 ~ 18:00
top