旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國(guó)統(tǒng)一咨詢(xún)熱線(xiàn):010-5367 2995
首頁(yè) > 熱門(mén)文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析面試題庫(kù)-有經(jīng)驗(yàn)的大數(shù)據(jù)分析面試問(wèn)題

大數(shù)據(jù)分析面試題庫(kù)-有經(jīng)驗(yàn)的大數(shù)據(jù)分析面試問(wèn)題

時(shí)間:2019-12-26來(lái)源:m.5wd995.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2019-12-26點(diǎn)擊量:作者:Sissi



  之前我分享了《大數(shù)據(jù)分析面試題庫(kù)—基本的大數(shù)據(jù)分析面試問(wèn)題》,這個(gè)是針對(duì)基本的大數(shù)據(jù)分析問(wèn)題,如果您在大數(shù)據(jù)分析世界中有相當(dāng)豐富的工作經(jīng)驗(yàn),那么根據(jù)您以前的經(jīng)驗(yàn),您將在大數(shù)據(jù)分析采訪中被問(wèn)到許多問(wèn)題。這些問(wèn)題可能只是與您的經(jīng)驗(yàn)或場(chǎng)景有關(guān)。因此,AAA教育為您準(zhǔn)備好這些最佳的大數(shù)據(jù)分析面試問(wèn)題和答案。

 

11.您有大數(shù)據(jù)分析經(jīng)驗(yàn)嗎?
 

  如何處理: 由于該問(wèn)題是主觀問(wèn)題,因此沒(méi)有具體答案,并且答案取決于您以前的經(jīng)驗(yàn)。在大數(shù)據(jù)分析采訪中問(wèn)這個(gè)問(wèn)題時(shí),采訪者想了解您以前的經(jīng)驗(yàn),并且還試圖評(píng)估您是否適合項(xiàng)目要求。
 

  那么,您將如何處理這個(gè)問(wèn)題?如果您以前有經(jīng)驗(yàn),請(qǐng)從以前的職務(wù)開(kāi)始,然后慢慢地在對(duì)話(huà)中添加細(xì)節(jié)。告訴他們您使項(xiàng)目成功的貢獻(xiàn)。這個(gè)問(wèn)題通常是面試中問(wèn)到的第二個(gè) 或第三個(gè)問(wèn)題。后面的問(wèn)題基于此問(wèn)題,因此請(qǐng)仔細(xì)回答。您還應(yīng)該注意不要過(guò)度處理以前的工作。保持簡(jiǎn)單明了。
 

12.您喜歡好的數(shù)據(jù)還是好的模型?為什么?
 

  如何處理: 這是一個(gè)棘手的問(wèn)題,但通常在大數(shù)據(jù)分析面試中會(huì)問(wèn)到。它要求您在良好的數(shù)據(jù)或良好的模型之間進(jìn)行選擇。作為候選人,您應(yīng)該嘗試根據(jù)自己的經(jīng)驗(yàn)來(lái)回答。許多公司希望遵循嚴(yán)格的數(shù)據(jù)評(píng)估流程,這意味著他們已經(jīng)選擇了數(shù)據(jù)模型。在這種情況下,擁有良好的數(shù)據(jù)可能會(huì)改變游戲規(guī)則。另一種方法是根據(jù)良好的數(shù)據(jù)選擇模型。
 

  如前所述,請(qǐng)根據(jù)您的經(jīng)驗(yàn)進(jìn)行回答。但是,不要說(shuō)擁有良好的數(shù)據(jù)和良好的模型很重要,因?yàn)樵诂F(xiàn)實(shí)生活中很難同時(shí)擁有兩者。
 

13.您是否會(huì)優(yōu)化算法或代碼以使其運(yùn)行更快?
 

  如何處理: 這個(gè)問(wèn)題的答案應(yīng)該始終是“是”。真實(shí)世界的性能很重要,它并不取決于您在項(xiàng)目中使用的數(shù)據(jù)或模型。
 

  面試官也可能想知道您以前是否有代碼或算法優(yōu)化方面的經(jīng)驗(yàn)。對(duì)于初學(xué)者而言,這顯然取決于他過(guò)去從事的項(xiàng)目。經(jīng)驗(yàn)豐富的候選人也可以相應(yīng)地分享他們的經(jīng)驗(yàn)。但是,請(qǐng)誠(chéng)實(shí)對(duì)待您的工作,如果您過(guò)去沒(méi)有優(yōu)化代碼,那也很好。只要讓面試官知道您的真實(shí)經(jīng)驗(yàn),您就可以破解大數(shù)據(jù)分析面試。

大數(shù)據(jù)分析
 

14.您如何進(jìn)行數(shù)據(jù)準(zhǔn)備?
 

  如何進(jìn)行: 數(shù)據(jù)準(zhǔn)備是大數(shù)據(jù)分析項(xiàng)目中的關(guān)鍵步驟之一。大數(shù)據(jù)分析采訪可能涉及基于數(shù)據(jù)準(zhǔn)備的至少一個(gè)問(wèn)題。當(dāng)面試官問(wèn)您這個(gè)問(wèn)題時(shí),他想知道您在數(shù)據(jù)準(zhǔn)備過(guò)程中采取了哪些步驟或預(yù)防措施。
 

  如您所知,需要進(jìn)行數(shù)據(jù)準(zhǔn)備才能獲得必要的數(shù)據(jù),然后可以將這些數(shù)據(jù)進(jìn)一步用于建模目的。您應(yīng)該將此信息傳達(dá)給面試官。您還應(yīng)該強(qiáng)調(diào)要使用的模型的類(lèi)型以及選擇該特定模型的原因。最后但并非最不重要的一點(diǎn),您還應(yīng)該討論重要的數(shù)據(jù)準(zhǔn)備術(shù)語(yǔ),例如轉(zhuǎn)換變量,離群值,非結(jié)構(gòu)化數(shù)據(jù),識(shí)別差距等。
 

15.如何將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)?
 

  如何處理: 非結(jié)構(gòu)化數(shù)據(jù)在大數(shù)據(jù)分析中非常常見(jiàn)。應(yīng)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),以確保進(jìn)行正確的數(shù)據(jù)分析。您可以通過(guò)簡(jiǎn)要區(qū)分兩者來(lái)開(kāi)始回答問(wèn)題。完成后,您現(xiàn)在可以討論將一種形式轉(zhuǎn)換為另一種形式的方法。您也可能會(huì)分享實(shí)際情況。如果您剛畢業(yè),則可以共享與您的學(xué)術(shù)項(xiàng)目有關(guān)的信息。
 

  通過(guò)正確回答此問(wèn)題,表示您了解結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)類(lèi)型,并且具有處理這些數(shù)據(jù)的實(shí)踐經(jīng)驗(yàn)。如果您具體回答該問(wèn)題,那么您肯定可以破解大數(shù)據(jù)分析采訪。
 

16.哪種硬件配置最適合Hadoop作業(yè)?
 

  配置4/8 GB RAM和ECC內(nèi)存的雙處理器或核心計(jì)算機(jī)是運(yùn)行Hadoop操作的理想選擇。但是,硬件配置會(huì)根據(jù)特定于項(xiàng)目的工作流和處理流程而有所不同,因此需要進(jìn)行相應(yīng)的自定義。
 

17、當(dāng)兩個(gè)用戶(hù)嘗試訪問(wèn)HDFS中的相同文件時(shí)會(huì)發(fā)生什么?
 

  HDFS NameNode僅支持獨(dú)占寫(xiě)入。因此,只有第一個(gè)用戶(hù)將獲得文件訪問(wèn)許可,而第二個(gè)用戶(hù)將被拒絕。
 

18、NameNode出現(xiàn)故障時(shí)如何恢復(fù)?
 

  需要執(zhí)行以下步驟以使Hadoop集群?jiǎn)?dòng)并運(yùn)行:

  使用文件系統(tǒng)元數(shù)據(jù)副本FsImage來(lái)啟動(dòng)新的NameNode。

  配置數(shù)據(jù)節(jié)點(diǎn)以及客戶(hù)端,以使它們確認(rèn)新啟動(dòng)的名稱(chēng)節(jié)點(diǎn)。

  一旦新的NameNode完成加載最后一個(gè)從DataNode接收到足夠阻止報(bào)告的檢查點(diǎn)FsImage,它將開(kāi)始為客戶(hù)端提供服務(wù)。

  在大型Hadoop集群的情況下,NameNode恢復(fù)過(guò)程會(huì)耗費(fèi)大量時(shí)間,這對(duì)于例行維護(hù)而言是一個(gè)更大的挑戰(zhàn)。
 

19、您對(duì)Hadoop中的Rack Awareness了解什么?
 

  這是應(yīng)用于NameNode的算法,用于確定如何放置塊及其副本。根據(jù)機(jī)架定義,可將同一機(jī)架內(nèi)各DataNode之間的網(wǎng)絡(luò)流量最小化。例如,如果我們考慮復(fù)制因子為3,則將兩個(gè)副本放在一個(gè)機(jī)架中,而將第三副本放在一個(gè)單獨(dú)的機(jī)架中。
 

20、“ HDFS塊”和“輸入分割”之間有什么區(qū)別?
 

  HDFS將輸入數(shù)據(jù)物理上劃分為塊進(jìn)行處理,這稱(chēng)為HDFS塊。

  輸入拆分是映射器對(duì)數(shù)據(jù)的邏輯劃分,用于映射操作。




 

預(yù)約申請(qǐng)免費(fèi)試聽(tīng)課

填寫(xiě)下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽(tīng)!怕錢(qián)不夠?可先就業(yè)掙錢(qián)后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動(dòng)者教育科技有限公司版權(quán)所有
備案號(hào):京ICP備12034770號(hào)

?2007-2022/ m.5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話(huà):010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號(hào)

網(wǎng)站地圖