Microsoft Excel可能是商業(yè)社區(qū)中最受歡迎的單個(gè)軟件。Excel已有30多年的歷史,至今仍在全球各個(gè)國(guó)家/地區(qū)每天都在使用Excel來(lái)存儲(chǔ),處理和分析數(shù)據(jù)。它的用途非常廣泛,因此成為Excel向?qū)Э梢詷O大地提高你的收入。
但是Excel雖然很棒,但也有其局限性。如果你每天都在處理數(shù)據(jù),那么這些限制是很重要的。我們與AAA教育大數(shù)據(jù)分析講師張國(guó)棟進(jìn)行了交談,他為我們提供了九個(gè)學(xué)習(xí)編程的理由,說(shuō)明即使你已經(jīng)是Excel大師并且不打算嘗試從事數(shù)據(jù)工作,你仍然可以花點(diǎn)時(shí)間學(xué)習(xí)用于數(shù)據(jù)分析的編程語(yǔ)言科學(xué)。
在以下幾點(diǎn)中,AAA教育大數(shù)據(jù)老師將Excel與R(一種用于數(shù)據(jù)分析的流行編程語(yǔ)言)中的數(shù)據(jù)分析進(jìn)行了比較。但是,大多數(shù)這些優(yōu)點(diǎn)對(duì)于Python(另一種用于處理數(shù)據(jù)的流行編碼語(yǔ)言)也是如此。我們?cè)谶@兩種方法中均提供免費(fèi)的入門(mén)課程,并且兩者都是對(duì)Excel的重大提升。
1、更強(qiáng)大的數(shù)據(jù)導(dǎo)入和處理
與Excel不同, R本質(zhì)上可以讀取任何類(lèi)型的數(shù)據(jù)。 它本身無(wú)法讀取的數(shù)據(jù)格式仍然可以使用:還有專(zhuān)門(mén)設(shè)計(jì)用于讀取XML,JSON,SPSS,Excel,SAS和STATA數(shù)據(jù)文件的R包,你還可以從網(wǎng)站抓取數(shù)據(jù)并執(zhí)行SQL查詢(xún)。
在R中,數(shù)據(jù)操作(如子集,合并和重新編碼等任務(wù))也要容易得多。任何花費(fèi)大量時(shí)間試圖合并和清理Excel中的大型數(shù)據(jù)集進(jìn)行分析的人都可以證明這是一個(gè)困難且耗時(shí)的過(guò)程。但是R以及一些受歡迎的軟件包(如dplyr,tidyr和plyr)使此過(guò)程更加簡(jiǎn)單和快捷。
2、更輕松的自動(dòng)化
Excel具有GUI(一個(gè)用戶(hù)界面,你可以單擊按鈕而不是編寫(xiě)代碼)的事實(shí)無(wú)疑使它更易于訪(fǎng)問(wèn),但是當(dāng)你嘗試自動(dòng)執(zhí)行一個(gè)流程或多次運(yùn)行相同的分析時(shí),這可能是一個(gè)很大的障礙。
使用編程語(yǔ)言可以使速度更快。例如,如果你需要每周對(duì)一組新的銷(xiāo)售數(shù)據(jù)進(jìn)行相同的分析,則在Excel中執(zhí)行此操作將需要每周手動(dòng)打開(kāi)一個(gè)不同的文件,并重新輸入分析所需的公式和其他元素。但是你可以使用R之類(lèi)的語(yǔ)言自動(dòng)執(zhí)行相同的分析,編寫(xiě)一個(gè)簡(jiǎn)單的腳本來(lái)導(dǎo)入新數(shù)據(jù)并每周運(yùn)行相同的分析,并以你想要的任何格式輸出結(jié)果。
3、更輕松地處理大量數(shù)據(jù)
在Excel中,項(xiàng)目以工作表或標(biāo)簽的形式組織,如果你曾經(jīng)處理過(guò)包含大量工作表或每張工作表中都有大量數(shù)據(jù)條目的Excel文件,那么你會(huì)知道它會(huì)變得非常慢。在Excel中使用足夠的數(shù)據(jù)有時(shí)甚至?xí)?dǎo)致崩潰。如R編程語(yǔ)言,但是,可以處理大量數(shù)據(jù)的多少更迅速,并且在同樣的方式,Excel可以,所以你不必?fù)?dān)心失去你的工作擔(dān)心,他們不能真正崩潰。
4、更可重復(fù)
當(dāng)你可以向他人解釋你所做的事情,并且他人可以輕松地復(fù)制你的工作以進(jìn)行確認(rèn)(或者你可以自己復(fù)制以進(jìn)行再次檢查)時(shí),數(shù)據(jù)分析最有用。但這在Excel中很難實(shí)現(xiàn)。無(wú)法清晰地記錄或說(shuō)明你在分析中采取的步驟,而重新進(jìn)行分析將需要重新打開(kāi)原始Excel文件并手動(dòng)重新執(zhí)行你執(zhí)行的所有步驟(如果你還記得的話(huà))。
在R之類(lèi)的編程語(yǔ)言中,重現(xiàn)結(jié)果要容易得多。重新運(yùn)行分析就像按“ Enter”一樣簡(jiǎn)單,并且可以在代碼中添加注釋?zhuān)越忉屵^(guò)程中每個(gè)步驟的發(fā)生,因此任何人都可以仔細(xì)檢查你的工作。
5、更容易發(fā)現(xiàn)和修復(fù)錯(cuò)誤
當(dāng)你在Excel中出錯(cuò)時(shí),找出問(wèn)題所在可能很困難,因?yàn)槟憧赡鼙仨殱L動(dòng)瀏覽數(shù)千個(gè)數(shù)據(jù)單元以找到答案,或者嘗試手動(dòng)重新追蹤你的步驟。
但是,當(dāng)你使用R之類(lèi)的編碼語(yǔ)言出錯(cuò)時(shí),通常會(huì)收到一條錯(cuò)誤消息,說(shuō)明計(jì)算機(jī)認(rèn)為出了什么問(wèn)題。當(dāng)然,你還應(yīng)該有注釋來(lái)解釋代碼的每一行,這樣可以更輕松地返回并重新檢查每個(gè)步驟以查找錯(cuò)誤。通常,程序員還使用系統(tǒng)進(jìn)行版本控制,因此,如果遇到以前從未遇到過(guò)的錯(cuò)誤,則可以將當(dāng)前代碼與其先前的迭代進(jìn)行比較,以了解發(fā)生了什么問(wèn)題。
這并不意味著你將始終能夠立即糾正錯(cuò)誤。但是,數(shù)據(jù)分析中的錯(cuò)誤是不可避免的, 在R中查找和修復(fù)這些錯(cuò)誤比在Excel中更容易。
6、開(kāi)源可訪(fǎng)問(wèn)性
Excel很棒,但是它是Microsoft擁有的,這意味著從錯(cuò)誤,更新和功能支持方面,你最終會(huì)感到這家總部位于華盛頓的公司的異想天開(kāi)。與Excel不同, R不是黑匣子。你可以檢查R代碼中執(zhí)行的任何功能或計(jì)算。你甚至可以通過(guò)更改代碼來(lái)修改和改進(jìn)關(guān)鍵功能。
Python也是開(kāi)源的,對(duì)于這兩種語(yǔ)言,這也意味著任何開(kāi)發(fā)人員(包括你)都可以創(chuàng)建包來(lái)擴(kuò)展該語(yǔ)言并添加功能或提高易用性。兩種語(yǔ)言都有由第三方開(kāi)發(fā)人員創(chuàng)建的流行和廣泛使用的軟件包和庫(kù),它們使數(shù)據(jù)分析和可視化變得更加容易。
誠(chéng)然,Excel確實(shí)具有一些第三方加載項(xiàng),但是由于它是專(zhuān)有軟件,因此功能不那么強(qiáng)大,并且添加所需的功能并非易事。
7、先進(jìn)的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)功能
R和Python均具有比Excel更高級(jí)的統(tǒng)計(jì)功能(R尤其如此,因?yàn)镽在設(shè)計(jì)時(shí)就考慮了高級(jí)統(tǒng)計(jì)分析)。這兩種語(yǔ)言也允許創(chuàng)建機(jī)器學(xué)習(xí)模型(通常與機(jī)器的整合學(xué)習(xí)包和框架,如caret,scikit-learn和TensorFlow)。
8、先進(jìn)的數(shù)據(jù)可視化功能
有更好的,更先進(jìn)的國(guó)家的最先進(jìn)和圖形處理能力與顯然,Excel可以創(chuàng)建各種圖表,但是編程語(yǔ)言可以做的更多,特別是R lattice,ggplot2和shiny包。
在企業(yè)環(huán)境中,創(chuàng)建具有吸引力和信息量大的可視化功能的能力特別重要,因?yàn)樵诠緵Q策的人員可能不熟悉統(tǒng)計(jì)分析或不擅長(zhǎng)閱讀復(fù)雜的圖表。你越容易理解數(shù)據(jù),就越有可能對(duì)你的工作產(chǎn)生真正的影響。
9、跨平臺(tái)穩(wěn)定性
R和Python等編程語(yǔ)言的腳本可以在任何平臺(tái)上運(yùn)行而不會(huì)打ic。你可以確信你的R腳本可以在Windows,Mac和Linux計(jì)算機(jī)上使用,但是Excel文件并非總是如此。
當(dāng)然,這并不是說(shuō)你應(yīng)該完全放棄Excel!與編程語(yǔ)言相比,它確實(shí)具有一些優(yōu)勢(shì)。由于其圖形用戶(hù)界面,在Excel中手動(dòng)輸入數(shù)據(jù)通常會(huì)更容易,并且如果你只想快速瀏覽電子表格,那么與使用代碼進(jìn)行查找相比,瀏覽Excel文件會(huì)更快,更容易。Python和R 都具有以可視表格式呈現(xiàn)正在使用的數(shù)據(jù)部分的方法,以便更輕松地查看正在使用的數(shù)據(jù),但是在Excel中,這種可視數(shù)據(jù)表示是默認(rèn)的,而不是某些東西。你必須有意實(shí)施。
當(dāng)然,很明顯,如果你要進(jìn)行大量數(shù)據(jù)分析,則使用編程語(yǔ)言將比Excel提供一些非常重要的優(yōu)勢(shì)。如果你使用Excel的工作很多,學(xué)習(xí)的R或Python編程的哪怕是一點(diǎn)點(diǎn)可以為你節(jié)省時(shí)間每個(gè)星期在Excel中所花費(fèi)的時(shí)間。如果你只熟悉Excel,那么學(xué)習(xí)R或Python之類(lèi)的編程語(yǔ)言的想法可能會(huì)令人生畏。
但這并不像你想的那樣困難!在AAA教育,我們相信任何人都可以學(xué)習(xí)編碼,并且我們提供了免費(fèi)的R和Python入門(mén)類(lèi),你可以在沒(méi)有任何編碼經(jīng)驗(yàn),沒(méi)有任何數(shù)學(xué)或工程背景的情況下上課。
填寫(xiě)下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽(tīng)!怕錢(qián)不夠?可先就業(yè)掙錢(qián)后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!
?2007-2022/ m.5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話(huà):010-53672995 郵箱:bjaaa@aaaedu.cc