如何申請(qǐng)創(chuàng)建數(shù)據(jù)分析項(xiàng)目組合?對(duì)于入門級(jí)職位,項(xiàng)目組合就像是橡膠與道路相交的地方。
實(shí)際上,如果你以前沒有在大數(shù)據(jù)分析領(lǐng)域的經(jīng)驗(yàn),那么你的項(xiàng)目組合可能會(huì)決定你是否收到最重要的面試電話。項(xiàng)目通常在面試階段也起著至關(guān)重要的作用。
首先,用術(shù)語(yǔ)來表達(dá):你會(huì)聽到諸如大數(shù)據(jù)分析領(lǐng)域中的不同人使用的項(xiàng)目和項(xiàng)目組合之類的術(shù)語(yǔ)。在某些人看來,“投資組合”一詞喚起了精心設(shè)計(jì)的項(xiàng)目包,例如定制網(wǎng)站。但是出于我們這里的目的,我們將投資組合定義為你在工作應(yīng)用程序中展示的項(xiàng)目組,而不管它們以什么形式呈現(xiàn)(我們將在如何申請(qǐng)創(chuàng)建數(shù)據(jù)分析項(xiàng)目組合后面討論呈現(xiàn))。
在深入探討如何組合投資組合之前,讓我們看一下其中的原因。
為什么大數(shù)據(jù)分析項(xiàng)目至關(guān)重要
老板不會(huì)付錢給你做你從未做過的事情。這是任何行業(yè)的勞動(dòng)力市場(chǎng)的基本規(guī)則,大數(shù)據(jù)分析也不例外。確實(shí),這很合乎邏輯:你會(huì)去以前從未煮過的廚師的餐廳嗎?還是登上從未有過高空飛行的飛行員駕駛的飛機(jī)?可能不是。
無(wú)論你是要從全日制學(xué)習(xí),其他職業(yè)過渡到大數(shù)據(jù)分析,還是只是想嘗試另一種大數(shù)據(jù)分析工作,你都將需要經(jīng)驗(yàn)。即使對(duì)于入門級(jí)職位,如果一項(xiàng)工作需要技能,你也需要能夠證明自己可以做到,然后再有人付錢去做。
但是大多數(shù)入門級(jí)申請(qǐng)人在大數(shù)據(jù)分析領(lǐng)域幾乎沒有專業(yè)經(jīng)驗(yàn)。那么,如何證明自己具備工作所需的技能呢?項(xiàng)目組合項(xiàng)目。項(xiàng)目組合將替代你的工作申請(qǐng)中的工作經(jīng)驗(yàn)。它向潛在的雇主表明你確實(shí)可以完成你所申請(qǐng)的大數(shù)據(jù)分析工作。
實(shí)際上,項(xiàng)目可能是應(yīng)用程序中最重要的部分,因?yàn)樗鼈儠?huì)在流程的每個(gè)階段出現(xiàn)。他們將在你的簡(jiǎn)歷中提及,并鏈接到你的申請(qǐng)中,你可以期望它們?cè)谠S多求職面試中也發(fā)揮重要作用。我們?cè)趧?chuàng)建本指南時(shí)與之交談的大多數(shù)招聘人員說,他們?cè)诤Y選候選人時(shí)會(huì)審查項(xiàng)目和項(xiàng)目組合,但他們也在面試中談到了這些項(xiàng)目。
可能會(huì)要求你解釋你在數(shù)據(jù)分析項(xiàng)目中所做的統(tǒng)計(jì)選擇,或者通過你的代碼與招聘經(jīng)理交談??赡軙?huì)詢問你在小組項(xiàng)目中與他人合作的經(jīng)歷,或?qū)⑻囟?xiàng)目組合在一起時(shí)遇到的挑戰(zhàn)。
招聘人員告訴我們,他們有時(shí)會(huì)使用項(xiàng)目來評(píng)估從應(yīng)聘者的技術(shù)能力到對(duì)主題的熱情程度等各個(gè)方面。沒有該領(lǐng)域的專業(yè)經(jīng)驗(yàn),你可能不得不在招聘過程的各個(gè)階段嚴(yán)重依賴項(xiàng)目,因此,正確選擇它們至關(guān)重要。
你的投資組合需要證明什么
確切地說,你需要在投資組合中展示的內(nèi)容取決于你所申請(qǐng)的工作。在市場(chǎng)營(yíng)銷中尋找數(shù)據(jù)分析師職位的人應(yīng)該擁有一系列突出市場(chǎng)營(yíng)銷相關(guān)分析技能的項(xiàng)目。尋找機(jī)器學(xué)習(xí)工程師職位的人最好擁有一系列令人印象深刻的機(jī)器學(xué)習(xí)項(xiàng)目。
但是,無(wú)論你要尋找什么角色,都要記住的口頭禪是:你的作品集應(yīng)證明你可以勝任這項(xiàng)工作。
做工作并不僅僅意味著證明你具有技術(shù)能力。對(duì)于大多數(shù)與數(shù)據(jù)相關(guān)的職位,你將希望自己的投資組合能夠證明自己擁有:
1)交流能力
2)與他人合作的能力
3)技術(shù)能力
4)推理數(shù)據(jù)的能力
5)主動(dòng)的動(dòng)機(jī)和能力
另外值得指出的是,這個(gè)詞你在“證明你可以做的工作”是非常重要的。你的投資組合項(xiàng)目應(yīng)該是唯一的。
投資組合的重點(diǎn),在很大程度上是整個(gè)申請(qǐng)流程的指導(dǎo)原則,能夠證明你的工作方式易于驗(yàn)證。如果你選擇炫耀一些常用的東西并且已經(jīng)有現(xiàn)有的教程,對(duì)于我作為招聘經(jīng)理來說,很難評(píng)估你是否實(shí)際上做了很多工作和思考,或者你是否只是在做簡(jiǎn)單的事情?然后是通用教程。
包含在大數(shù)據(jù)分析產(chǎn)品組合中的項(xiàng)目
大數(shù)據(jù)分析檔案包應(yīng)包含3-5個(gè)項(xiàng)目,這些項(xiàng)目應(yīng)展示你與工作相關(guān)的技能。再次,這里的目標(biāo)是證明你可以勝任這項(xiàng)工作,因此,你的投資組合看起來越像你所申請(qǐng)工作的日常工作,就越有說服力。
不要僅僅選擇隨機(jī)的項(xiàng)目進(jìn)行處理,就可以將其添加到你的簡(jiǎn)歷或投資組合中。解決與你感興趣的公司有關(guān)的問題。
這適用于你在項(xiàng)目中執(zhí)行的任務(wù)類型,也適用于項(xiàng)目檢查的主題領(lǐng)域以及正在使用的數(shù)據(jù)集類型。讓我們仔細(xì)看看這三個(gè)因素:
任務(wù)類型:在你要申請(qǐng)的工作中,你需要做哪些事情?你會(huì)做很多數(shù)據(jù)清理嗎?機(jī)器學(xué)習(xí)?數(shù)據(jù)可視化?自然語(yǔ)言處理?你將嚴(yán)格執(zhí)行分析,還是為他人構(gòu)建儀表板和其他分析工具?無(wú)論這些問題的答案是什么,都應(yīng)將它們集成到你的產(chǎn)品組合中。
主題領(lǐng)域:你是否正在尋找市場(chǎng)營(yíng)銷職位?你可能需要突出顯示旨在回答與營(yíng)銷相關(guān)的問題的項(xiàng)目。如果你正在移動(dòng)應(yīng)用程序開發(fā)中尋找數(shù)據(jù)工作,那么你將需要展示可以證明你可以從應(yīng)用程序數(shù)據(jù)中獲取有用的產(chǎn)品見解的項(xiàng)目。使用項(xiàng)目表明你對(duì)與所申請(qǐng)工作相關(guān)的主題和業(yè)務(wù)問題有所了解,或者至少對(duì)之感興趣,可以幫助你的應(yīng)用程序脫穎而出。
數(shù)據(jù)集類型:不同行業(yè)中可能會(huì)使用不同類型的數(shù)據(jù),因此表明你具有一些與工作中所見相似的數(shù)據(jù)處理經(jīng)驗(yàn),有助于證明你已具備完成數(shù)據(jù)準(zhǔn)備工作的能力。工作。例如,如果你可能正在查看目標(biāo)工作中的大量時(shí)間序列數(shù)據(jù),則有助于在你的投資組合中展示一些時(shí)間序列分析技能。
如有疑問,請(qǐng)包括以下項(xiàng)目:
你的投資組合針對(duì)所申請(qǐng)的特定工作越仔細(xì)地量身定制,就可能獲得更好的結(jié)果。但是,如果你要申請(qǐng)入門級(jí)職位,那么你的職位可能會(huì)很寬泛,并且你可能還會(huì)考慮那些需要很多相同技能的職位,而不論其行業(yè)如何。如果你將一個(gè)投資組合與至少一個(gè)以上類別的項(xiàng)目組合在一起,那么你將有一個(gè)很好的起點(diǎn)。
數(shù)據(jù)清理項(xiàng)目:數(shù)據(jù)準(zhǔn)備,數(shù)據(jù),整理,數(shù)據(jù)清理–不論你想稱它什么,它都占大多數(shù)大數(shù)據(jù)分析工作的60-80%,因此,你肯定需要一個(gè)展示你的數(shù)據(jù)清理技能的項(xiàng)目。至少,你將希望找到一個(gè)凌亂的數(shù)據(jù)集(不要選擇任何已經(jīng)清除的數(shù)據(jù)),提出一些有趣的分析問題進(jìn)行檢查,然后清除數(shù)據(jù)并進(jìn)行一些基本分析以回答這些問題。問題。
如果你想在這里提高難度,那么收集自己的數(shù)據(jù)(通過API,網(wǎng)絡(luò)抓取或其他方法)將展示一些其他技能。使用某種非結(jié)構(gòu)化數(shù)據(jù)(與凌亂但靜止的結(jié)構(gòu)化數(shù)據(jù)集相對(duì))也看起來不錯(cuò)。
數(shù)據(jù)講故事和可視化項(xiàng)目:講故事,提供真實(shí)的見解以及用數(shù)據(jù)說服他人是任何大數(shù)據(jù)分析工作的關(guān)鍵部分。如果你無(wú)法讓CEO理解或采取行動(dòng),那么最好的分析就是沒有用的。這個(gè)項(xiàng)目應(yīng)該使讀者進(jìn)行分析,并得出結(jié)論,即使對(duì)于只有很少編碼或統(tǒng)計(jì)學(xué)背景的外行來說,也是可以理解的。
數(shù)據(jù)可視化和交流技巧在這里將很重要,以顯示和解釋你的代碼在做什么。以Jupyter Notebook或R Markdown的形式呈現(xiàn)此圖標(biāo)是很好的,但是你可能需要增加一些額外的難度,例如自定義圖表設(shè)計(jì)或包括一些交互式元素。
小組項(xiàng)目:小組合作表明你具有溝通和協(xié)作能力,這兩種技能對(duì)于大數(shù)據(jù)分析工作都很重要。任何類型的項(xiàng)目都可以是小組項(xiàng)目;這里重要的是要證明你可以在團(tuán)隊(duì)中以人際關(guān)系(清晰的溝通,公平的分工,真正的協(xié)作)和技術(shù)(在Git和GitHub管理項(xiàng)目)中發(fā)揮作用。
如果你想在這里解決難題,請(qǐng)嘗試參與一個(gè)受歡迎的開源項(xiàng)目,例如以你選擇的語(yǔ)言為與大數(shù)據(jù)分析相關(guān)的開源庫(kù)做出貢獻(xiàn)。這可能非常困難,但是如果你確實(shí)設(shè)法為受歡迎的庫(kù)或程序包做出了貢獻(xiàn),那么實(shí)際上可以使你的應(yīng)用程序在雇主中脫穎而出。
其他要考慮的項(xiàng)目類型
端到端系統(tǒng)構(gòu)建項(xiàng)目:許多大數(shù)據(jù)分析工作可以包括構(gòu)建系統(tǒng),這些系統(tǒng)可以有效地分析常規(guī)數(shù)據(jù)集的輸入,而不是分析單個(gè)特定的數(shù)據(jù)集。例如,你可能需要為銷售團(tuán)隊(duì)建立一個(gè)儀表板,以可視化公司的銷售數(shù)據(jù)并在輸入新數(shù)據(jù)時(shí)定期進(jìn)行更新。
該項(xiàng)目應(yīng)表明,你有能力構(gòu)建一個(gè)系統(tǒng),該系統(tǒng)可以對(duì)輸入的新數(shù)據(jù)集執(zhí)行相同的分析,還可以構(gòu)建一個(gè)可以被其他人相對(duì)輕松理解和運(yùn)行的系統(tǒng)。最簡(jiǎn)單的版本是注釋良好的代碼,可以從定期更新的公共數(shù)據(jù)集中獲取數(shù)據(jù)并進(jìn)行一些分析。它的README文件應(yīng)說明其他人如何使用它,并且該項(xiàng)目應(yīng)相對(duì)容易讓其他編碼人員通過命令行運(yùn)行。
如果你想在這里加大難度,那就無(wú)極限了:你可以構(gòu)建功能完善的交互式Web儀表板,或者構(gòu)建處理實(shí)時(shí)/流數(shù)據(jù)的系統(tǒng)。這里的關(guān)鍵只是表明你可以構(gòu)建一個(gè)可重用的分析系統(tǒng),并且其他人或至少其他程序員可以理解。
解釋性文章,文章或談話:能夠以簡(jiǎn)單易懂的術(shù)語(yǔ)解釋復(fù)雜的技術(shù)概念對(duì)于任何大數(shù)據(jù)分析家來說都是一項(xiàng)寶貴的技能,因此在博客文章,文章或會(huì)議談話中解釋一些技術(shù)概念可能是一個(gè)很好的補(bǔ)充如果做得好,就可以加入你的投資組合。只要確保選擇一個(gè)適當(dāng)復(fù)雜的主題,并且你理解并可以解釋即可。例如,一篇博客文章解釋了在你的目標(biāo)行業(yè)中經(jīng)常使用的機(jī)器學(xué)習(xí)算法的幕后情況,這很可能包含在產(chǎn)品組合中。
項(xiàng)目組合項(xiàng)目格式和演示
既然你已經(jīng)對(duì)要包含在投資組合中的內(nèi)容有所了解,那么應(yīng)該如何呈現(xiàn)呢?實(shí)際上只有兩種通用方法:和個(gè)人投資組合網(wǎng)站。
我們與該項(xiàng)目進(jìn)行交流的每位招聘人員都同意,申請(qǐng)人應(yīng)具有可顯示其項(xiàng)目的有效GitHub帳戶,因此,如果你希望獲得廣泛的吸引力,那絕對(duì)是你應(yīng)該開始的地方。一些招聘人員說,他們對(duì)投資組合網(wǎng)站上精心設(shè)計(jì)的項(xiàng)目介紹印象深刻,但另一些招聘人員則說,他們不太關(guān)心單獨(dú)的投資組合網(wǎng)站,只會(huì)看候選人的GitHub。
因此,從準(zhǔn)備好GitHub開始是有意義的。
大數(shù)據(jù)分析項(xiàng)目的GitHub
如果你還不了解GitHub的基礎(chǔ)知識(shí),請(qǐng)查看此介紹性博客文章或有關(guān)Git和版本控制的完整,交互式課程,以使自己起步并運(yùn)行。如果你要?jiǎng)?chuàng)建一個(gè)新的GitHub帳戶,請(qǐng)確保選擇一個(gè)專業(yè)的用戶名(用戶名是公開的,這是潛在雇主找到你的方式)。
一旦在GitHub上進(jìn)行設(shè)置,好消息就是你的項(xiàng)目演示不必特別復(fù)雜:對(duì)于大多數(shù)項(xiàng)目來說,以Jupyter Notebook或R Markdown格式展示你的項(xiàng)目都是不錯(cuò)的選擇。
在項(xiàng)目本身中,請(qǐng)嘗試使代碼塊相對(duì)較短,并在其中插入文本塊,以清楚,簡(jiǎn)潔地說明代碼在做什么以及原因。使用文本格式(標(biāo)題和副標(biāo)題,粗體,斜體,代碼段等)使內(nèi)容井井有條,易于閱讀。
你應(yīng)該始終假設(shè)知道自己在說什么的人都可以閱讀你的代碼。這意味著你應(yīng)該嘗試使用你的語(yǔ)言命名約定,遵循首選的樣式,并嘗試保持代碼高效,整潔。
這也意味著,只要你認(rèn)為對(duì)代碼有幫助,就應(yīng)該在代碼中添加注釋,這樣一眼便可以看到發(fā)生了什么。(在團(tuán)隊(duì)中進(jìn)行協(xié)作時(shí),對(duì)代碼進(jìn)行注釋是特別重要的實(shí)踐,因此包含使代碼易于遵循的良好注釋也說明了良好的溝通和團(tuán)隊(duì)合作能力。)
在你的代碼中需要注意的其他一些潛在的跳閘點(diǎn):
1)如果你是在本地創(chuàng)建的項(xiàng)目,則可能已對(duì)數(shù)據(jù)的文件路徑進(jìn)行了硬編碼,以便你的代碼讀取計(jì)算機(jī)上存儲(chǔ)數(shù)據(jù)的特定目錄。對(duì)于公共項(xiàng)目,最好將數(shù)據(jù)與筆記本(或子文件夾)保存在同一文件夾中,以便你可以包括一個(gè)相對(duì)路徑,該路徑將適用于下載存儲(chǔ)庫(kù)并運(yùn)行代碼的任何人。
2)你可能需要包括有關(guān)任何軟件包的信息以及所用外部軟件包和庫(kù)的版本詳細(xì)信息,以使其他人更容易下載和運(yùn)行你的代碼。有關(guān)如何執(zhí)行此操作的更多信息,請(qǐng)參見此處。
3)如果你要使用API??密鑰或其他訪問憑據(jù)從某處提取數(shù)據(jù),則不想公開共享這些憑據(jù)!這篇文章包括一個(gè)很好的演練,介紹了如何在保持他人私密性的同時(shí)仍使其他人輕松使用你的代碼。
4)如果要包括在項(xiàng)目存儲(chǔ)庫(kù)中使用的數(shù)據(jù),則應(yīng)檢查以確保你具有合法的再分配權(quán)。
你應(yīng)該始終README在每個(gè)項(xiàng)目中包括一個(gè)通常為Markdown格式的文件,其中包含對(duì)該項(xiàng)目的簡(jiǎn)要說明。這是GitHub在有人查看你的項(xiàng)目存儲(chǔ)庫(kù)時(shí)默認(rèn)顯示的文件,因此它應(yīng)該提供他們將要看到的內(nèi)容的概述。這可能包括詳細(xì)信息,例如你的項(xiàng)目分析的內(nèi)容,該項(xiàng)目的目標(biāo)是什么,使用的技術(shù)以及結(jié)論的摘要。它還應(yīng)包括其他人可能需要自行安裝和運(yùn)行你的項(xiàng)目的任何信息。
GitHub要記住的重要一件事是,它將向所有人顯示查看你個(gè)人資料的所有公共存儲(chǔ)庫(kù),并且還將顯示你的所有貢獻(xiàn)活動(dòng)。這意味著你需要保持帳戶干凈和有效。對(duì)于潛在的雇主來說,點(diǎn)擊進(jìn)入你的個(gè)人資料并找到數(shù)百個(gè)被放棄的項(xiàng)目將是一件令人討厭的事情,如果潛在的雇主在過去幾個(gè)月中實(shí)際上沒有做任何事情,那將是令人討厭的事情。
遵循這些原則,請(qǐng)記住,將項(xiàng)目添加到GitHub后,這些項(xiàng)目并不是一成不變的。即使你正在申請(qǐng)工作,也可以并且應(yīng)該繼續(xù)對(duì)它們進(jìn)行迭代。如果你獲得有用的反饋(或者只是想出了一個(gè)好主意),那么在已經(jīng)發(fā)布的項(xiàng)目中實(shí)施這些更改就沒有錯(cuò)。實(shí)際上,繼續(xù)迭代你的項(xiàng)目是一個(gè)好主意-它向你的雇主表明你很活躍,感興趣并且從事與雇用你相同的工作。
準(zhǔn)備GitHub的最后一步?確保將其鏈接到雇主可能找到你的所有地方。如我們的履歷章節(jié)所述,履歷上應(yīng)該有一個(gè)可點(diǎn)擊的GitHub鏈接,但你還想確保在你使用的任何社交網(wǎng)站(LinkedIn,Twitter,Instagram,個(gè)人網(wǎng)站等)上都包含一個(gè)GitHub鏈接,并包含你提交的帶有任何在線申請(qǐng)表的URL。你想讓尋找你的人盡可能輕松地找到你的GitHub。
下一級(jí):專用項(xiàng)目或項(xiàng)目組合站點(diǎn)
一旦啟動(dòng)并運(yùn)行了活動(dòng)的GitHub,可能值得花一些時(shí)間為你的一個(gè)或多個(gè)項(xiàng)目組合一個(gè)更加獨(dú)特的演示文稿。并非每個(gè)招聘經(jīng)理都會(huì)花時(shí)間查看專門的項(xiàng)目頁(yè)面或特殊的投資組合網(wǎng)站,但是對(duì)于某些人來說,多花些功夫會(huì)引人注目。
總的來說,你想要的是視覺效果,” SharpestMinds的愛德華·哈里斯(Edouard Harris)說。“理想情況下,你已經(jīng)在某處的服務(wù)器上運(yùn)行了某些東西。
最佳的情況是:你正在開會(huì)(與業(yè)內(nèi)人士交談),你巧妙地將對(duì)話引向了你所構(gòu)建的這個(gè)很酷的東西的方向。然后,你可以拿出手機(jī),就像:簽出。玩吧。就在這里。”
擁有一個(gè)基于網(wǎng)絡(luò)的視覺或交互式數(shù)據(jù)項(xiàng)目“發(fā)出了一個(gè)非常好的信號(hào)。它發(fā)出一個(gè)信號(hào),表明此人足夠了解服務(wù)器的設(shè)置。這是一筆不小的工作。[此人知道如何操作]使界面足夠漂亮,以便人們可以使用它。這些都是真實(shí)的,有價(jià)值的東西。
顯然,為項(xiàng)目創(chuàng)建一個(gè)專用站點(diǎn),尤其是交互式站點(diǎn),比在GitHub上簡(jiǎn)單地投放Jupyter Notebook所需的時(shí)間要多幾個(gè)數(shù)量級(jí)。但是,盡管它需要更多的前期投資,但從長(zhǎng)遠(yuǎn)來看,它確實(shí)可以帶來紅利,特別是如果你在活動(dòng)中親自進(jìn)行并親自結(jié)成網(wǎng)絡(luò)(應(yīng)該如此)時(shí)。在擁擠的會(huì)議大廳中,要給在手機(jī)上滾動(dòng)瀏覽GitHub的人留下深刻的印象,斜眼并嘗試讀取你的代碼。清晰,可視,基于數(shù)據(jù)的故事或交互式項(xiàng)目可以給人留下深刻的印象。
僅出于啟發(fā)目的,這是一個(gè)非常直觀的數(shù)據(jù)故事的示例,這是一個(gè)很酷的交互式數(shù)據(jù)項(xiàng)目的示例。這些只是為了激發(fā)靈感–不用擔(dān)心,入門級(jí)求職者不可能達(dá)到這種水平的打磨質(zhì)量。但是你可以看到為什么要親自進(jìn)行網(wǎng)絡(luò)連接,擁有一個(gè)像這樣的項(xiàng)目來炫耀,比嘗試讓別人瀏覽你喜歡的GitHub存儲(chǔ)庫(kù)更具影響力。
項(xiàng)目資源
至此,你知道了為什么需要項(xiàng)目組合。你知道哪些項(xiàng)目應(yīng)包括在投資組合中,以及如何展示它們?,F(xiàn)在,困難的部分來了:實(shí)際執(zhí)行項(xiàng)目。
你選擇的項(xiàng)目會(huì)根據(jù)你的個(gè)人興趣和目標(biāo)工作角色而有很大差異。但是,如果你需要一個(gè)良好的起點(diǎn),那么實(shí)際上我們所有的大數(shù)據(jù)分析課程都包括開放式指導(dǎo)項(xiàng)目。如果你需要一些時(shí)間來適應(yīng)它們并使其成為自己的產(chǎn)品,那么這些對(duì)投資組合可能會(huì)很有用,并且它們也將是有用的靈感來源。例如,你可以在我們網(wǎng)站上的一個(gè)指導(dǎo)項(xiàng)目中工作,然后找到一個(gè)新的數(shù)據(jù)集,并嘗試對(duì)自己的投資組合項(xiàng)目應(yīng)用類似的分析。
以下是一些其他資源,當(dāng)你將新項(xiàng)目放在一起或在求職之前回頭對(duì)舊項(xiàng)目進(jìn)行改進(jìn)和迭代時(shí),這些資源可能會(huì)有所幫助:
數(shù)據(jù)源
對(duì)于任何項(xiàng)目,最重要的選擇之一就是要分析哪些數(shù)據(jù)。如果你想使用現(xiàn)有的公共數(shù)據(jù)集,則最好避免從Kaggle這樣的網(wǎng)站上大受打擊-Kaggle上的流行數(shù)據(jù)集將在數(shù)百個(gè)項(xiàng)目中使用,并且雇主會(huì)討厭看到它們。
確保你正在做的事情完全與眾不同,最好的方法是獲取自己的數(shù)據(jù)集,而不是下載別人編譯的數(shù)據(jù)。兩種最簡(jiǎn)單的方法是通過網(wǎng)絡(luò)抓取或通過訪問API。
AAA教育提供了涵蓋API和Web抓取的課程,并且我們還提供了一些免費(fèi)教程,供你使用BeautifulSoup等工具進(jìn)行Web抓取和使用API。例如,你可以訪問Twitter API并使用它來實(shí)時(shí)分析推文(我們也有相應(yīng)的教程)。
如果你真的想加倍努力,還可以通過執(zhí)行自己的調(diào)查或手動(dòng)收集數(shù)據(jù)等方法來收集數(shù)據(jù)。收集自己的數(shù)據(jù)非常耗時(shí),但是如果這是獲取有趣且獨(dú)特的數(shù)據(jù)集的唯一方法,那么以后可以通過獨(dú)特的分析創(chuàng)建的“哇”因素將值得你付出所有這些痛苦。
并且不要忘記,你可能會(huì)生成大量自己的數(shù)據(jù)-使用計(jì)算機(jī)和智能手機(jī),你可以收集有關(guān)自己的各種數(shù)據(jù),從生產(chǎn)力水平到睡眠習(xí)慣。走這條路線可能會(huì)有風(fēng)險(xiǎn)(你不希望以自我為中心,而且你的個(gè)人數(shù)據(jù)可能不會(huì)像其他人那樣對(duì)你感興趣),但是你肯定有一些方法可以從自己的角度來處理數(shù)據(jù)成為具有廣泛吸引力的有趣的大數(shù)據(jù)分析項(xiàng)目。
設(shè)計(jì)資源
項(xiàng)目完成后,使其脫穎而出的最簡(jiǎn)單方法之一就是升級(jí)可視化效果,以使招聘人員不會(huì)在許多其他大數(shù)據(jù)分析產(chǎn)品組合中看到“默認(rèn)”外觀。
有多種方法可以使用代碼進(jìn)行此操作-例如,查看有關(guān)如何在Python中獲得FiveThirtyEight圖表外觀的教程。但更一般而言,將一些基本設(shè)計(jì)原則應(yīng)用于你的工作將幫助你的圖表脫穎而出,并更清楚地講述其故事。
以下是一些其他有用的數(shù)據(jù)可視化資源:
1)Data Viz Project的大型圖表類型庫(kù)非常適合提醒自己各種圖表類型,并幫助你找到適合數(shù)據(jù)的最佳圖表類型。
2)Hubspot的數(shù)據(jù)可視化設(shè)計(jì)PDF具有一些針對(duì)特定類型的圖表進(jìn)行設(shè)計(jì)的非常有用的技巧。
3)我們自己的數(shù)據(jù)顏色指南,深入介紹了在選擇顏色時(shí)應(yīng)考慮的事項(xiàng)。
4)Geckoboard提供了可打印的海報(bào),如果你需要一些基于墻的靈感和設(shè)計(jì)幫助,可以將其掛在辦公室中。
5)加州大學(xué)伯克利分校(UC Berkeley)在數(shù)據(jù)背景下有30分鐘的圖形設(shè)計(jì)視頻,如果你有時(shí)間投入其中,這將非常有幫助。
靈感來源
有時(shí),你只需要一點(diǎn)火花就可以開始一個(gè)項(xiàng)目,或者給你一個(gè)使項(xiàng)目從優(yōu)到高的想法。你可以在這里找到真正出色的大數(shù)據(jù)分析項(xiàng)目:
1)FiveThirtyEight-數(shù)據(jù)新聞業(yè)的擁護(hù)者538不斷發(fā)布有關(guān)政治和體育的基于數(shù)據(jù)的新工作。他們還發(fā)布了許多數(shù)據(jù),因此你可以嘗試對(duì)他們的某些工作進(jìn)行反向工程。
2)信息就是美麗獎(jiǎng) -該網(wǎng)站每年都會(huì)獎(jiǎng)勵(lì)各種基于數(shù)據(jù)的項(xiàng)目類別的獎(jiǎng)項(xiàng),但它們還會(huì)在全年中定期發(fā)布重大項(xiàng)目的重點(diǎn)摘要。
3)數(shù)據(jù)是美麗的 -此subreddit主持了業(yè)余和專業(yè)大數(shù)據(jù)分析項(xiàng)目以及可視化。你也可以在那里共享你自己的項(xiàng)目,以獲得其他reddit用戶的反饋。
4)Kaggle -Kaggle競(jìng)賽是找到完整的大數(shù)據(jù)分析項(xiàng)目的好地方(查找已完成的競(jìng)賽,然后瀏覽最受好評(píng)的“內(nèi)核”。這里的好處是你可以看到整個(gè)項(xiàng)目,包括所有代碼。
5)國(guó)家報(bào)紙的大數(shù)據(jù)分析團(tuán)隊(duì)-主要的國(guó)家和國(guó)際報(bào)紙以及其他媒體組織經(jīng)常有“數(shù)據(jù)”部分,你可以在其中找到有趣的大數(shù)據(jù)分析工作的結(jié)果。在某些情況下,他們也有GitHub帳戶,他們也可以在其中共享項(xiàng)目和/或數(shù)據(jù)。
填寫下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!
?2007-2022/ m.5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc