当您申请与数据科学相关的职位时,您可能必须提交项目组合或项目。尽管您的能力主要是潜在雇主在审查您的工作时要考虑的内容,但风格方面也将发挥作用。
雇用初级数据科学职位时,雇主通常会很大程度地考虑应聘者的工作量。尽管您可能有能力在技术上给人留下深刻的印象,但是如果您对样式方面的关注不够,您的求职也会受到影响。繁忙的雇主不会审查建设不良的项目。
在AAA教育,我们已经帮助许多数据科学专业的学生进行了项目投资组合评论。我们了解到学生犯下的最常见错误,并且在使项目对雇主有吸引力的方面进行了大量思考。
根据我们的经验,我们创建了以下样式指南。我们还创建了一个示例项目,因此您可以在实践中看到这些准则。
请注意,我们的指南主要针对笔记本样式的项目。这是学生发送给雇主的最常见的项目类型,它由在开发环境(如Jupyter Notebook,Jupyter Lab,RStudio,nteract等)中编写的代码和叙述结合而成。
了解你的听众
在甚至开始构建投资组合之前,请先非常清楚地了解谁将要对其进行审查。
在大数据分析深度样式有哪些中,我们将重点放在雇主作为我们项目的受众,因为这是我们最常见的用例。一般而言,雇主不愿冒险-他们会寻找暗示您可能是风险投资的线索。使您的工作适应其标准面临两个重大挑战:
1)受众是由技术人员和非技术人员组成的异类。不同种类的雇主可能会阅读您的项目,例如,一位高级数据科学家可能会评估您的工作,但是没有技术知识的人也可以看看。
2)有些雇主只会略过您的工作,而另一些雇主会更详细。这通常取决于招聘阶段。最初,雇主必须处理数十或数百个申请,也许他们将为每个候选人花费五分钟。在以后的某些阶段,他们通常会详细讨论以找出合适的人选。
为了解决这两个挑战,编写以下项目:
1)对技术和非技术雇主都显而易见的是,您可以为他们的公司带来价值。
2)做好快速扫描。
3)仔细阅读 做好。
接下来,我们将更详细地讨论上述三个操作项目。
为技术和非技术读者撰写
向相关技术和非技术雇主表明您可以为其公司带来价值的最快方法是制定相关的项目主题。但是,什么才是相关主题,取决于您想从事的行业。
假设您有一个投资组合,其中包含有关棒球和篮球数据的多个强大项目。如果您正在金融行业申请数据科学职位,则雇主几乎肯定会发现您的项目无关紧要。您的工作也许很出色,但是他们希望看到一些表明您非常适合金融业的东西:投资建议,股市预测,卖出建议等。
另一方面,如果您要为每天撰写体育运动的出版物申请数据记者的职位,那么您的工作肯定是有意义的。
因此,在投入大量工作来构建一些可能不相关的出色项目之前,请尝试弄清楚您想从事哪些数据科学行业和壁ni。
做出决定后,就开始构建相关项目并将其包括在投资组合中。
理想情况下,您会发现一个既与您的首选行业相关的项目,又激发了一些热情。这应该可行,因为您出于某种原因想在该行业工作。否则,至少尝试找到一个好的折衷方案。
快速扫描效果不错
这些是人们通常会在快速扫描中考虑的数据科学项目的主要部分:
1)标题
2)介绍
3)副标题
4)结论
5)图表
6)码
现在让我们讨论如何改进这些部分,使其在快速扫描中表现良好。
标题
您的头衔很可能是雇主会读的全部。您选择的标题告诉他们:
1)您的项目是否与他们要聘用的职位相关。
2)您的项目是否值得深入阅读。
您的任务是想出一个标题,该标题立即告诉雇主您的工作既相关又有趣。我们已经介绍了相关性这一部分,因此,这里有一些技巧可以使您的头衔吸引雇主的注意:
1)避免标题模糊。例如,如果您要分析纽约的房地产数据,请不要将您的工作命名为“分析房地产数据”。这很模糊,您可以用这样的标题写整本书。考虑而不是准确反映您分析的特殊性的事物。尝试选择“寻找投资机会-分析纽约房价的变化”之类的内容。
2)避免使用中性的头衔。在“分析纽约房价”和“寻找投资机会—分析纽约房价的演变”之间,您想要选择后者,因为“投资”和“机会”之类的词会激发一些与收益相关的情绪在读者心中。通常,人们更有可能点击情绪活跃的标题(无论标题是激发积极情绪还是消极情绪)。
3)避免标题太长。我们希望快速发送强烈的信息-长标题通常较难理解,因此您的目标是确保读者无需再次阅读标题即可理解您想说的话。通常,尝试将标题保持在15个字以内。例如,这似乎太多了,寻找纽约最好的两个社区进行投资,以对房地产行业进行长期获利的投资。
介绍
您想出了一个好头衔,并说服了雇主看一下您的数据科学项目。简介很可能是他们接下来要阅读的内容。同样,您要发送相同的消息:
1)您的项目与您正在考虑的角色有关。
2)您的项目值得深入阅读。
这里有一些主要的做与不做的地方,围绕着写一个很好的介绍:
1)有个介绍。值得在这里说明显而易见的地方,因为我们看到的项目没有介绍。
2)简要描述您的项目。在不超过三个段落(每个段落最多3-4个句子)中,简要讨论:
a)分析的目标。
b)您将达到该目标的方法。
c)您找到的最重要的结果-我们在此处提及结果是为了证明我们有能力快速传达我们的发现。
3)不要使用目录(TOC)。除非您正在编写一个大型项目,否则请不要使用TOC。TOC易于扫描,但通常会占用大量垂直空间,因此引言看起来非常庞大。保持简介简洁,整洁,会给人以简短的快速阅读的印象,这应该鼓励雇主实际阅读它。
4)实事求是。不要大声疾呼,也不要以引号开头(尤其是来自爱因斯坦的引号),而只是坚持简明扼要地介绍分析目标,实现该目标所采用的方法以及最重要的结果找到了。
副标题
如果雇主想浏览您的整个项目,他们会发现子标题非常有用。同样,请确保您发送的信息是您的工作相关且有趣。以下是有关编写良好的副标题的一些技巧:
1)有副标题。确保将项目分解为几个逻辑部分,并为每个部分添加一个子标题。
2)使用一些标题技巧。子标题只是项目不同逻辑部分的标题,这意味着我们可以使用为标题而学到的一些技巧:
a)避免使用模糊的字幕。
b)避免使用长字幕。
c)理想情况下,请避免使用中性的字幕。
结论
对于我们这里的目的,一个很好的结论:
1)提醒读者最初的目标是什么以及达到该目标的主要方法是什么。
2)总结最重要的结果。
实际上,该结论类似于根据主体所做的措词改写的引言。要写一个好的结论,请尝试:
1)简明扼要,不要使用两个以上的段落(每个段落最多3-4个句子)。
2)在您的最终索赔中不要夸张。另外,最好不要试图以引号结束胜利,因为大多数读者不会阅读您的所有作品,因此,他们将无法分享您的热情。
图表
如果您为项目生成图形(强烈建议您这样做),则可以肯定每个图形都将得到快速查看。我们的大脑似乎发现更快,更轻松地从图像而不是文本处理信息,因此我们更倾向于观看而不是阅读。因此,希望您的读者在看到图表时放慢其滚动速度。
考虑到这一点,您需要确保图形能够快速清晰地传达信息,并且看起来很专业。以下是一些实现此目的的技巧:
1)给每个图一个标题,可以清楚地解释该图的含义。将标题加粗并增加字体大小也是一个好主意。
2)标记每个轴。增加标签的字体大小,直到易于阅读为止。在选择字体大小时,请记住,有些人可能会在小屏幕(小型笔记本电脑,平板电脑,移动设备等)上阅读您的作品。
3)理想情况下,应广泛地自定义图形。如果您使用Python进行编码,则可能需要查看有关制作FiveThirtyEight图的教程。
码
在这一阶段,没有人会深入阅读您的代码,但是经验丰富的程序员可能会扫描您的代码来评估诸如以下内容:
1)代码可读性。
2)您使用的算法。
3)您使用的库;等等
在大数据分析深度样式有哪些的后面,我们将提供有关可读性方面的提示。这些技巧将有助于快速扫描和全面阅读,因此我们在下一部分将它们分组在一起。
认真阅读后表现良好
在招聘过程的后期,雇主通常会更加详细地挑选合适的候选人。
此时,您应该期望有技术知识的人对您的项目进行深入的阅读。全面阅读要做好,主要取决于项目的技术部分:
1)您使用的算法。
2)您尝试解决的问题。
3)您用来解决问题的方法。
4)您的方法的深度;等等
但是,风格元素也很重要,它们确实可以有所作为。什么,你的代码和写是至关重要的,但如何你的代码和写也很重要。因此,我们接下来将重点学习一些技巧,这些技巧可以帮助我们编码并在样式方面更好地编写。
码
您如何编写代码很重要,因为它向雇主显示了您是否可以编写干净的代码,供潜在的未来同事阅读和理解。编写其他人可以轻松理解的代码非常具有挑战性。
下面,我们将讨论一些易于理解的围绕编写代码的最佳实践。您可以从阅读所用编程语言的官方样式指南开始,在该指南中应该可以找到许多提高代码可读性的技巧。
如果没有官方指南,请搜索大多数人使用该语言编码的指南。对于Python,您可以在此处找到官方样式指南;对于R,您可以在此处找到指南。
下面,我们在代码可读性方面探讨了一些主要的作为和不作为(我们将使用Python代码,但该准则也适用于其他语言):
1)使用块注释可以为每个具有独特功能的代码块添加简短描述。在编写代码时,大多数时候添加块注释似乎是多余的。尽管如此,请添加它们,因为它们可以帮助读者,并且在几个月后阅读代码后,它们还可以帮助您轻松地重新尝试要执行的操作。
没有:
是的:
2)垂直间隔具有不同功能的代码块。
没有:
是:
3)添加内联注释,但请确保它们有用,并且不要声明明显的内容。
没有:
是:
4)清楚地命名变量 -不要为了节省一些击键而牺牲宝贵的代码可读性。
没有:
是:
文本
正如我们在引言中提到的那样,学生可以发送给雇主的最常见的数据科学项目类型是代码和叙述的组合。
叙述部分很重要,因为它可以向雇主显示您是否具有正确的沟通技巧。在大多数数据科学角色中,沟通是关键,因为数据科学家经常发现自己与跨部门团队一起工作,包括来自市场,产品,工程等方面的同事。团队成员正在同一个复杂项目中开展工作,他们需要进行沟通有效地相互配合。
撰写能使您读得透彻的叙事作品取决于多种因素,例如:
1)可读性。
2)您的解释的深度和清晰度。
3)您正在写的想法的流程。
4)叙述与代码之间的联系;等等
下面,我们将探讨一些仅与叙述风格有关且旨在提高可读性的主要事项:
1)请勿使用较长的段落。文字墙使读者望而却步,并且大大降低了可读性。理想情况下,一个段落包含三到四个句子,但是如果您认为有道理,甚至可以使用一个句子的段落。这是不执行操作的示例:
2)使用正确的句子长度。长句子(接近40个字)很难在初读时理解,并且会使您的写作感到沉重。很短的句子(少于5个单词)很容易理解,并为您的写作提供了良好的流程,但是它们也会使叙事过于分散,从而使某些读者烦恼。
理想情况下,应完全避免使用长句子,稀疏使用非常短的句子,并且大多数时候都选择中等大小的句子。
3)其他小的但重要的细节:
a)确保您的文章没有错别字。
b)遵守语法和拼写规则。
c)避免使用被动语态。
d)避免使用不必要的副词。
要编写出色的风格叙述,您可以使用Hemingway App来帮助自己。这个应用程式可以协助您:
1)压缩句子和段落。
2)避免错别字。
3)避免使用被动语态和不必要的副词。
示例项目
我们在Jupyter Lab中构建了一个示例项目,该项目展示了如何实施我们在此讨论的大多数准则。阅读项目时,请注意:
1)标题是特定的,具有情感动感(激发与增益相关的情绪),并且少于15个字。
2)引言是事实,它描述了分析的目标,实现该目标所需采取的方法以及发现的最重要结果。
3)该项目具有子标题。
4)结论重申了最初的目标,即我们达到该目标所采用的主要方法,并总结了最重要的结果。
5)该项目有图形,每个图形都有标题和轴标签。使用FiveThirtyEight样式自定义一张图。
6)代码和文本符合我们讨论的准则。
还要注意:
1)我们将一个markdown单元与一个代码单元交替。每个markdown单元都会介绍并解释其下方的代码单元中发生的情况(结论除外,该结论下方没有一个代码单元)。通常,请更改单元格的类型(换句话说,避免连续放置两个相同类型的单元格)。
2)将模块优雅地导入所需的代码单元中(而不是在第一个单元中塞满所有内容)。这样,我们避免了不必要地使第一个代码单元过度拥挤。我们以后也避免混淆-假设在最后一个代码单元中使用从鲜为人知的程序包中导入的第一个代码单元中的低级函数。读者不会记住您所做的所有输入,并且会感到困惑。
3)我们告诉读者他们可以在哪里下载数据。
下一步
简要回顾一下,数据科学组合项目应:
1)做好快速扫描。
a)项目主题应与雇主相关。
b)就样式而言,该项目应经过精心打磨。这些是快速扫描中通常需要考虑的元素:标题,简介,子标题,结论,图形和代码。
2)仔细阅读,做好。
a)技术部分应坚固而准确。
b)在样式方面,代码和叙述应经过精心打磨。
以下是您可以采取的一些后续步骤:
1)从头开始构建一个尊重本指南中讨论的指南的项目。请查看我们的指导项目页面以获取灵感。
2)根据大数据分析深度样式有哪些中讨论的准则调整您的项目之一。
3)阅读大数据分析深度样式有哪些文章,就应该添加到项目组合中的项目进行更具体的讨论。
如果您仍在努力完善和专业的数据科学项目,AAA教育的团队 将为您提供帮助。您可以利用我们有用的数据科学课程,或者通过许多指导性项目之一进行工作。
填写下面表单即可预约申请免费试听!怕钱不够?可先就业挣钱后再付学费! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可推荐就业!
©2007-2022/ www.aaa-cg.com.cn 北京漫动者数字科技有限公司 备案号: 京ICP备12034770号 监督电话:010-53672995 邮箱:bjaaa@aaaedu.cc