为什么你不应该成为一名数据科学通才

2018-11-21 12:21 来源:未知 作者:王振洲 点击: 评论:

A-A+

原标题:为什么你不应该成为一名数据科学通才

数据科教家仿佛个个皆是齐才,他们常识里很广,即写的了代码,又阐发的了营业,出事借能全部数教模子调调参数。

仿佛,数据科教家触及的范畴越广,越能凸起数据科教那份职业的代价。

可是,状况恰好相反!

有着丰硕的数据科教经历的SharpestMinds结合开创人Jeremie Harris报告您,万万没有要成为一个数据科教通才!

以下是他以第一人称的阐述,enjoy

我正在公司帮新脚计划数据科教职业开展的时分,凡是尾先倡议他们先来思索一下本人念成为何样的数据科教家,而没有是间接保举一个新的库或东西,大概一些写简历的本领给他们。

数据科学

那个成绩之以是云云主要,是果为数据科教触及太多圆里,以致于很易被一小我私家完整把握。以是,对公司而行,取其雇一个甚么皆懂一面却没有精晓的人,没有如雇佣那些专才。

您能够试念一下您是一家方案招聘数据科教家的公司。正在您的脑海中险些存正在一个需求觅供协助才气处理的详细的成绩,该成绩需求一些相称专业的手艺常识战项目经历。比方,一些公司将简朴模子使用于年夜型数据散,一些公司将庞大模子使用于小型数据散,一些公司需求静态天锻炼他们的模子,借有一些公司底子没有利用传统的模子。

处理上里例子中的每个成绩所需求的妙技组开完整差别,而让人感应出格奇异的是,每个有志于数据科教的人获得的倡议常常是一样的:“进修怎样利用Python,构建一些分类/回回/散类的项目。”

实在,呈现那一征象的本果是包罗我正在内的圈内助形成的。果为正在闲谈、专客帖子中,我们把过量的工具放到“数据科教”中。

为消费建一个强壮的数据通讲?那是一个“数据科教成绩”。缔造一种新型的神经收集?那是一个“数据科教成绩”。

那常常招致有志于数据科教的人们落空对特定成绩的深化研讨,从而成为平常之辈。要晓得,人材市场上曾经尽是所谓的通才,他们很易再获得市场的喜爱或获得打破。

可是,假如您本人没有分明皆有哪类常睹成绩需求您来深化研讨,那您便很易制止流于平凡。

我们把圈内呈现的成绩回结为以下五类:

1. 数据工程师

\

职位形貌:处置年夜量数据的公司,并办理数据通讲。那意味着,当需求时,您要能确保有用天从数据源搜集战检索数据,并停止清算战预处置。

为何它很主要:假如您只处置过相对小的(<5Gb)保留为.csv或.txt文件的数据散,那末您能够很易了解为何会有一些人的齐职事情是构建战保护数据管讲。

那里有几个本果:

  • 一个50Gb的数据散对计较机的RAM去道太年夜了,以是您凡是需求其他办法将其输进到您的模子中。
  • 处置那么年夜范围的数据需求破费年夜量工夫,而且常常需求冗孑遗储。办理数据的存储也需求特地的手艺窍门。

    请求:您将利用的手艺包罗Apache Spark、Hadoop战/或Hive,和Kafka。您极可能借需求有一个踏实的SQL根底。

    您要处置的成绩听起去像:

    “我怎样构建一个可以每分钟处置10000个恳求的数据管讲?”

    “怎样清算数据散而不消将其局部减载到RAM中?”

    2. 数据阐发员

    数据分析

    职位形貌:将数据转换成可指点营业开展的贸易洞察力。您会是手艺团队战贸易计谋、贩卖或营销团队的桥梁。数据可视化将成为您一样平常事情的主要构成部门。

    为何它很主要:杂手艺职员凡是很易了解为何数据阐发员云云主要,但究竟是他们便是很主要。那些人需求将颠末锻炼战测试的模子战年夜量用户数据转换为让人易于了解的情势,以便按照数据阐发结论设想营业战略。数据阐发员协助确保数据科教团队没有会华侈工夫正在不克不及供给营业代价的成绩上里。

    请求:您将利用的手艺包罗Python、SQL、Tableau战Excel。您借需求成为一个好的相同者。

    您要处置的成绩听起去像:

    “甚么驱动了用户的增加?”

    “我们怎样背办理层注释,近来用户用度的删减会削减客户?”

    3. 数据科教家

    \

    职位形貌:清算战探究数据散,并做出有贸易代价的猜测。一样平常事情包罗锻炼战劣化模子,并将它们布置到消费中。

    为何它很主要:当您有一年夜堆数据,以致于人类没法剖析,同时那些数据也很贵重以致于不克不及疏忽它们时,您需求经由过程一些法子从中提与一些可被承受的睹解。那是数据科教家的根本事情:将数据转换成可被了解的结论。

    请求:您将利用的手艺包罗Python、scikit-learn、Pandas、SQL,能够借有Flask、Spark战/或TensorFlow/PyTorch。一些数据科教职位地道是手艺性的,可是年夜大都职位借需求您具有贸易思维,那样您便没有会老念着来处理出有人需求处理的成绩。

    您要处置的成绩听起去像:

    “我们到底有几种差别范例的用户?”

    “我们能成立一个模子去猜测哪些产物能卖给哪些用户吗?”

    4. 机械进修工程师

    职位形貌:成立、劣化战布置机械进修模子到消费中。凡是需求把机械进修模子看成API或组件去处置,把它们嵌进到齐栈使用法式或硬件中,可是您也能够会被请求自止设想模子。

    请求:利用的手艺包罗Python、JavaScript、scikit-learn、TensorFlow / PyTorch(战/或企业级深度进修框架)战SQL或MongoDB(凡是用做app数据库)。

    您要处置的成绩听起去像:

    “怎样将那种Keras模子散成到我们的Javascript使用法式中?”

    “怎样削减保举体系的猜测工夫战猜测本钱?”

    5. 机械进修研讨员

    职位形貌:寻觅新的办法去处理数据科教战深度进修中的应战性成绩。出有现成的处理计划给您,需求本人来造定。

    请求:您将利用的手艺包罗Python、TensorFlow/PyTorch战SQL。

    您要处置的成绩听起去像:

    “我怎样才气进步我们模子的精确性,使之更靠近最新程度?”

    “自界说劣化法式有助于削减锻炼工夫吗?”

    那里列出的五种事情形貌其实不是正在一切状况下皆是自力的。比方,正在草创公司的晚期,数据科教家能够借必需是数据工程师战数据阐发师。可是,年夜大都事情皆能够被分别为那几类事情中的一种,并且公司范围越年夜,数据科教事情的分别越揭远那里所列出的种别。

    总而行之,要记着的是,为了获得聘任,您最好能培育一个愈加专注的妙技散:假如您只是念成为一位数据阐发员,没有要焦急来进修TensorFlow;假如您是念成为一位机械进修研讨职员,出须要先来进修Pyspark。

    相反,您需求思索您念协助公司缔造甚么样的代价,而且让本人擅长缔造那种代价。相对任何别的方法,那是获得offer最好的方法。


    第两十八届CIO班招死
    法国布雷斯特商教院MBA班招死
    法国布雷斯特商教院硕士班招死

    【易采站长站编辑:秋军】

  • 0
  • 0
  • 投稿