如何申请创建数据分析项目组合?对于入门级职位,项目组合就像是橡胶与道路相交的地方。
实际上,如果你以前没有在大数据分析领域的经验,那么你的项目组合可能会决定你是否收到最重要的面试电话。项目通常在面试阶段也起着至关重要的作用。
首先,用术语来表达:你会听到诸如大数据分析领域中的不同人使用的项目和项目组合之类的术语。在某些人看来,“投资组合”一词唤起了精心设计的项目包,例如定制网站。但是出于我们这里的目的,我们将投资组合定义为你在工作应用程序中展示的项目组,而不管它们以什么形式呈现(我们将在如何申请创建数据分析项目组合后面讨论呈现)。
在深入探讨如何组合投资组合之前,让我们看一下其中的原因。
为什么大数据分析项目至关重要
老板不会付钱给你做你从未做过的事情。这是任何行业的劳动力市场的基本规则,大数据分析也不例外。确实,这很合乎逻辑:你会去以前从未煮过的厨师的餐厅吗?还是登上从未有过高空飞行的飞行员驾驶的飞机?可能不是。
无论你是要从全日制学习,其他职业过渡到大数据分析,还是只是想尝试另一种大数据分析工作,你都将需要经验。即使对于入门级职位,如果一项工作需要技能,你也需要能够证明自己可以做到,然后再有人付钱去做。
但是大多数入门级申请人在大数据分析领域几乎没有专业经验。那么,如何证明自己具备工作所需的技能呢?项目组合项目。项目组合将替代你的工作申请中的工作经验。它向潜在的雇主表明你确实可以完成你所申请的大数据分析工作。
实际上,项目可能是应用程序中最重要的部分,因为它们会在流程的每个阶段出现。他们将在你的简历中提及,并链接到你的申请中,你可以期望它们在许多求职面试中也发挥重要作用。我们在创建本指南时与之交谈的大多数招聘人员说,他们在筛选候选人时会审查项目和项目组合,但他们也在面试中谈到了这些项目。
可能会要求你解释你在数据分析项目中所做的统计选择,或者通过你的代码与招聘经理交谈。可能会询问你在小组项目中与他人合作的经历,或将特定项目组合在一起时遇到的挑战。
招聘人员告诉我们,他们有时会使用项目来评估从应聘者的技术能力到对主题的热情程度等各个方面。没有该领域的专业经验,你可能不得不在招聘过程的各个阶段严重依赖项目,因此,正确选择它们至关重要。
你的投资组合需要证明什么
确切地说,你需要在投资组合中展示的内容取决于你所申请的工作。在市场营销中寻找数据分析师职位的人应该拥有一系列突出市场营销相关分析技能的项目。寻找机器学习工程师职位的人最好拥有一系列令人印象深刻的机器学习项目。
但是,无论你要寻找什么角色,都要记住的口头禅是:你的作品集应证明你可以胜任这项工作。
做工作并不仅仅意味着证明你具有技术能力。对于大多数与数据相关的职位,你将希望自己的投资组合能够证明自己拥有:
1)交流能力
2)与他人合作的能力
3)技术能力
4)推理数据的能力
5)主动的动机和能力
另外值得指出的是,这个词你在“证明你可以做的工作”是非常重要的。你的投资组合项目应该是唯一的。
投资组合的重点,在很大程度上是整个申请流程的指导原则,能够证明你的工作方式易于验证。如果你选择炫耀一些常用的东西并且已经有现有的教程,对于我作为招聘经理来说,很难评估你是否实际上做了很多工作和思考,或者你是否只是在做简单的事情?然后是通用教程。
包含在大数据分析产品组合中的项目
大数据分析档案包应包含3-5个项目,这些项目应展示你与工作相关的技能。再次,这里的目标是证明你可以胜任这项工作,因此,你的投资组合看起来越像你所申请工作的日常工作,就越有说服力。
不要仅仅选择随机的项目进行处理,就可以将其添加到你的简历或投资组合中。解决与你感兴趣的公司有关的问题。
这适用于你在项目中执行的任务类型,也适用于项目检查的主题领域以及正在使用的数据集类型。让我们仔细看看这三个因素:
任务类型:在你要申请的工作中,你需要做哪些事情?你会做很多数据清理吗?机器学习?数据可视化?自然语言处理?你将严格执行分析,还是为他人构建仪表板和其他分析工具?无论这些问题的答案是什么,都应将它们集成到你的产品组合中。
主题领域:你是否正在寻找市场营销职位?你可能需要突出显示旨在回答与营销相关的问题的项目。如果你正在移动应用程序开发中寻找数据工作,那么你将需要展示可以证明你可以从应用程序数据中获取有用的产品见解的项目。使用项目表明你对与所申请工作相关的主题和业务问题有所了解,或者至少对之感兴趣,可以帮助你的应用程序脱颖而出。
数据集类型:不同行业中可能会使用不同类型的数据,因此表明你具有一些与工作中所见相似的数据处理经验,有助于证明你已具备完成数据准备工作的能力。工作。例如,如果你可能正在查看目标工作中的大量时间序列数据,则有助于在你的投资组合中展示一些时间序列分析技能。
如有疑问,请包括以下项目:
你的投资组合针对所申请的特定工作越仔细地量身定制,就可能获得更好的结果。但是,如果你要申请入门级职位,那么你的职位可能会很宽泛,并且你可能还会考虑那些需要很多相同技能的职位,而不论其行业如何。如果你将一个投资组合与至少一个以上类别的项目组合在一起,那么你将有一个很好的起点。
数据清理项目:数据准备,数据,整理,数据清理–不论你想称它什么,它都占大多数大数据分析工作的60-80%,因此,你肯定需要一个展示你的数据清理技能的项目。至少,你将希望找到一个凌乱的数据集(不要选择任何已经清除的数据),提出一些有趣的分析问题进行检查,然后清除数据并进行一些基本分析以回答这些问题。问题。
如果你想在这里提高难度,那么收集自己的数据(通过API,网络抓取或其他方法)将展示一些其他技能。使用某种非结构化数据(与凌乱但静止的结构化数据集相对)也看起来不错。
数据讲故事和可视化项目:讲故事,提供真实的见解以及用数据说服他人是任何大数据分析工作的关键部分。如果你无法让CEO理解或采取行动,那么最好的分析就是没有用的。这个项目应该使读者进行分析,并得出结论,即使对于只有很少编码或统计学背景的外行来说,也是可以理解的。
数据可视化和交流技巧在这里将很重要,以显示和解释你的代码在做什么。以Jupyter Notebook或R Markdown的形式呈现此图标是很好的,但是你可能需要增加一些额外的难度,例如自定义图表设计或包括一些交互式元素。
小组项目:小组合作表明你具有沟通和协作能力,这两种技能对于大数据分析工作都很重要。任何类型的项目都可以是小组项目;这里重要的是要证明你可以在团队中以人际关系(清晰的沟通,公平的分工,真正的协作)和技术(在Git和GitHub管理项目)中发挥作用。
如果你想在这里解决难题,请尝试参与一个受欢迎的开源项目,例如以你选择的语言为与大数据分析相关的开源库做出贡献。这可能非常困难,但是如果你确实设法为受欢迎的库或程序包做出了贡献,那么实际上可以使你的应用程序在雇主中脱颖而出。
其他要考虑的项目类型
端到端系统构建项目:许多大数据分析工作可以包括构建系统,这些系统可以有效地分析常规数据集的输入,而不是分析单个特定的数据集。例如,你可能需要为销售团队建立一个仪表板,以可视化公司的销售数据并在输入新数据时定期进行更新。
该项目应表明,你有能力构建一个系统,该系统可以对输入的新数据集执行相同的分析,还可以构建一个可以被其他人相对轻松理解和运行的系统。最简单的版本是注释良好的代码,可以从定期更新的公共数据集中获取数据并进行一些分析。它的README文件应说明其他人如何使用它,并且该项目应相对容易让其他编码人员通过命令行运行。
如果你想在这里加大难度,那就无极限了:你可以构建功能完善的交互式Web仪表板,或者构建处理实时/流数据的系统。这里的关键只是表明你可以构建一个可重用的分析系统,并且其他人或至少其他程序员可以理解。
解释性文章,文章或谈话:能够以简单易懂的术语解释复杂的技术概念对于任何大数据分析家来说都是一项宝贵的技能,因此在博客文章,文章或会议谈话中解释一些技术概念可能是一个很好的补充如果做得好,就可以加入你的投资组合。只要确保选择一个适当复杂的主题,并且你理解并可以解释即可。例如,一篇博客文章解释了在你的目标行业中经常使用的机器学习算法的幕后情况,这很可能包含在产品组合中。
项目组合项目格式和演示
既然你已经对要包含在投资组合中的内容有所了解,那么应该如何呈现呢?实际上只有两种通用方法:和个人投资组合网站。
我们与该项目进行交流的每位招聘人员都同意,申请人应具有可显示其项目的有效GitHub帐户,因此,如果你希望获得广泛的吸引力,那绝对是你应该开始的地方。一些招聘人员说,他们对投资组合网站上精心设计的项目介绍印象深刻,但另一些招聘人员则说,他们不太关心单独的投资组合网站,只会看候选人的GitHub。
因此,从准备好GitHub开始是有意义的。
大数据分析项目的GitHub
如果你还不了解GitHub的基础知识,请查看此介绍性博客文章或有关Git和版本控制的完整,交互式课程,以使自己起步并运行。如果你要创建一个新的GitHub帐户,请确保选择一个专业的用户名(用户名是公开的,这是潜在雇主找到你的方式)。
一旦在GitHub上进行设置,好消息就是你的项目演示不必特别复杂:对于大多数项目来说,以Jupyter Notebook或R Markdown格式展示你的项目都是不错的选择。
在项目本身中,请尝试使代码块相对较短,并在其中插入文本块,以清楚,简洁地说明代码在做什么以及原因。使用文本格式(标题和副标题,粗体,斜体,代码段等)使内容井井有条,易于阅读。
你应该始终假设知道自己在说什么的人都可以阅读你的代码。这意味着你应该尝试使用你的语言命名约定,遵循首选的样式,并尝试保持代码高效,整洁。
这也意味着,只要你认为对代码有帮助,就应该在代码中添加注释,这样一眼便可以看到发生了什么。(在团队中进行协作时,对代码进行注释是特别重要的实践,因此包含使代码易于遵循的良好注释也说明了良好的沟通和团队合作能力。)
在你的代码中需要注意的其他一些潜在的跳闸点:
1)如果你是在本地创建的项目,则可能已对数据的文件路径进行了硬编码,以便你的代码读取计算机上存储数据的特定目录。对于公共项目,最好将数据与笔记本(或子文件夹)保存在同一文件夹中,以便你可以包括一个相对路径,该路径将适用于下载存储库并运行代码的任何人。
2)你可能需要包括有关任何软件包的信息以及所用外部软件包和库的版本详细信息,以使其他人更容易下载和运行你的代码。有关如何执行此操作的更多信息,请参见此处。
3)如果你要使用API密钥或其他访问凭据从某处提取数据,则不想公开共享这些凭据!这篇文章包括一个很好的演练,介绍了如何在保持他人私密性的同时仍使其他人轻松使用你的代码。
4)如果要包括在项目存储库中使用的数据,则应检查以确保你具有合法的再分配权。
你应该始终README在每个项目中包括一个通常为Markdown格式的文件,其中包含对该项目的简要说明。这是GitHub在有人查看你的项目存储库时默认显示的文件,因此它应该提供他们将要看到的内容的概述。这可能包括详细信息,例如你的项目分析的内容,该项目的目标是什么,使用的技术以及结论的摘要。它还应包括其他人可能需要自行安装和运行你的项目的任何信息。
GitHub要记住的重要一件事是,它将向所有人显示查看你个人资料的所有公共存储库,并且还将显示你的所有贡献活动。这意味着你需要保持帐户干净和有效。对于潜在的雇主来说,点击进入你的个人资料并找到数百个被放弃的项目将是一件令人讨厌的事情,如果潜在的雇主在过去几个月中实际上没有做任何事情,那将是令人讨厌的事情。
遵循这些原则,请记住,将项目添加到GitHub后,这些项目并不是一成不变的。即使你正在申请工作,也可以并且应该继续对它们进行迭代。如果你获得有用的反馈(或者只是想出了一个好主意),那么在已经发布的项目中实施这些更改就没有错。实际上,继续迭代你的项目是一个好主意-它向你的雇主表明你很活跃,感兴趣并且从事与雇用你相同的工作。
准备GitHub的最后一步?确保将其链接到雇主可能找到你的所有地方。如我们的履历章节所述,履历上应该有一个可点击的GitHub链接,但你还想确保在你使用的任何社交网站(LinkedIn,Twitter,Instagram,个人网站等)上都包含一个GitHub链接,并包含你提交的带有任何在线申请表的URL。你想让寻找你的人尽可能轻松地找到你的GitHub。
下一级:专用项目或项目组合站点
一旦启动并运行了活动的GitHub,可能值得花一些时间为你的一个或多个项目组合一个更加独特的演示文稿。并非每个招聘经理都会花时间查看专门的项目页面或特殊的投资组合网站,但是对于某些人来说,多花些功夫会引人注目。
总的来说,你想要的是视觉效果,” SharpestMinds的爱德华·哈里斯(Edouard Harris)说。“理想情况下,你已经在某处的服务器上运行了某些东西。
最佳的情况是:你正在开会(与业内人士交谈),你巧妙地将对话引向了你所构建的这个很酷的东西的方向。然后,你可以拿出手机,就像:签出。玩吧。就在这里。”
拥有一个基于网络的视觉或交互式数据项目“发出了一个非常好的信号。它发出一个信号,表明此人足够了解服务器的设置。这是一笔不小的工作。[此人知道如何操作]使界面足够漂亮,以便人们可以使用它。这些都是真实的,有价值的东西。
显然,为项目创建一个专用站点,尤其是交互式站点,比在GitHub上简单地投放Jupyter Notebook所需的时间要多几个数量级。但是,尽管它需要更多的前期投资,但从长远来看,它确实可以带来红利,特别是如果你在活动中亲自进行并亲自结成网络(应该如此)时。在拥挤的会议大厅中,要给在手机上滚动浏览GitHub的人留下深刻的印象,斜眼并尝试读取你的代码。清晰,可视,基于数据的故事或交互式项目可以给人留下深刻的印象。
仅出于启发目的,这是一个非常直观的数据故事的示例,这是一个很酷的交互式数据项目的示例。这些只是为了激发灵感–不用担心,入门级求职者不可能达到这种水平的打磨质量。但是你可以看到为什么要亲自进行网络连接,拥有一个像这样的项目来炫耀,比尝试让别人浏览你喜欢的GitHub存储库更具影响力。
项目资源
至此,你知道了为什么需要项目组合。你知道哪些项目应包括在投资组合中,以及如何展示它们。现在,困难的部分来了:实际执行项目。
你选择的项目会根据你的个人兴趣和目标工作角色而有很大差异。但是,如果你需要一个良好的起点,那么实际上我们所有的大数据分析课程都包括开放式指导项目。如果你需要一些时间来适应它们并使其成为自己的产品,那么这些对投资组合可能会很有用,并且它们也将是有用的灵感来源。例如,你可以在我们网站上的一个指导项目中工作,然后找到一个新的数据集,并尝试对自己的投资组合项目应用类似的分析。
以下是一些其他资源,当你将新项目放在一起或在求职之前回头对旧项目进行改进和迭代时,这些资源可能会有所帮助:
数据源
对于任何项目,最重要的选择之一就是要分析哪些数据。如果你想使用现有的公共数据集,则最好避免从Kaggle这样的网站上大受打击-Kaggle上的流行数据集将在数百个项目中使用,并且雇主会讨厌看到它们。
确保你正在做的事情完全与众不同,最好的方法是获取自己的数据集,而不是下载别人编译的数据。两种最简单的方法是通过网络抓取或通过访问API。
AAA教育提供了涵盖API和Web抓取的课程,并且我们还提供了一些免费教程,供你使用BeautifulSoup等工具进行Web抓取和使用API。例如,你可以访问Twitter API并使用它来实时分析推文(我们也有相应的教程)。
如果你真的想加倍努力,还可以通过执行自己的调查或手动收集数据等方法来收集数据。收集自己的数据非常耗时,但是如果这是获取有趣且独特的数据集的唯一方法,那么以后可以通过独特的分析创建的“哇”因素将值得你付出所有这些痛苦。
并且不要忘记,你可能会生成大量自己的数据-使用计算机和智能手机,你可以收集有关自己的各种数据,从生产力水平到睡眠习惯。走这条路线可能会有风险(你不希望以自我为中心,而且你的个人数据可能不会像其他人那样对你感兴趣),但是你肯定有一些方法可以从自己的角度来处理数据成为具有广泛吸引力的有趣的大数据分析项目。
设计资源
项目完成后,使其脱颖而出的最简单方法之一就是升级可视化效果,以使招聘人员不会在许多其他大数据分析产品组合中看到“默认”外观。
有多种方法可以使用代码进行此操作-例如,查看有关如何在Python中获得FiveThirtyEight图表外观的教程。但更一般而言,将一些基本设计原则应用于你的工作将帮助你的图表脱颖而出,并更清楚地讲述其故事。
以下是一些其他有用的数据可视化资源:
1)Data Viz Project的大型图表类型库非常适合提醒自己各种图表类型,并帮助你找到适合数据的最佳图表类型。
2)Hubspot的数据可视化设计PDF具有一些针对特定类型的图表进行设计的非常有用的技巧。
3)我们自己的数据颜色指南,深入介绍了在选择颜色时应考虑的事项。
4)Geckoboard提供了可打印的海报,如果你需要一些基于墙的灵感和设计帮助,可以将其挂在办公室中。
5)加州大学伯克利分校(UC Berkeley)在数据背景下有30分钟的图形设计视频,如果你有时间投入其中,这将非常有帮助。
灵感来源
有时,你只需要一点火花就可以开始一个项目,或者给你一个使项目从优到高的想法。你可以在这里找到真正出色的大数据分析项目:
1)FiveThirtyEight-数据新闻业的拥护者538不断发布有关政治和体育的基于数据的新工作。他们还发布了许多数据,因此你可以尝试对他们的某些工作进行反向工程。
2)信息就是美丽奖 -该网站每年都会奖励各种基于数据的项目类别的奖项,但它们还会在全年中定期发布重大项目的重点摘要。
3)数据是美丽的 -此subreddit主持了业余和专业大数据分析项目以及可视化。你也可以在那里共享你自己的项目,以获得其他reddit用户的反馈。
4)Kaggle -Kaggle竞赛是找到完整的大数据分析项目的好地方(查找已完成的竞赛,然后浏览最受好评的“内核”。这里的好处是你可以看到整个项目,包括所有代码。
5)国家报纸的大数据分析团队-主要的国家和国际报纸以及其他媒体组织经常有“数据”部分,你可以在其中找到有趣的大数据分析工作的结果。在某些情况下,他们也有GitHub帐户,他们也可以在其中共享项目和/或数据。
填写下面表单即可预约申请免费试听!怕钱不够?可先就业挣钱后再付学费! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可推荐就业!
©2007-2022/ www.aaa-cg.com.cn 北京漫动者数字科技有限公司 备案号: 京ICP备12034770号 监督电话:010-53672995 邮箱:bjaaa@aaaedu.cc