術(shù)語機器學習常常被錯誤互換與人工智能。實際上,機器學習是AI的一個子領(lǐng)域。機器學習有時也與預(yù)測分析或預(yù)測建模相混淆。同樣,機器學習可用于預(yù)測建模,但這只是預(yù)測分析的一種類型,其用途比預(yù)測建模更廣泛。
機器學習是計算機無需明確編程即可學習的能力
機器學習最基本的方法是使用編程算法來接收和分析輸入數(shù)據(jù),以預(yù)測可接受范圍內(nèi)的輸出值。隨著將新數(shù)據(jù)輸入這些算法,他們將學習并優(yōu)化其操作以提高性能,并隨著時間的推移開發(fā)智能。
機器學習算法有四種類型:有監(jiān)督,半監(jiān)督,無監(jiān)督和強化。
我應(yīng)該使用哪種機器學習算法?
該備忘單可幫助你從各種機器學習算法中進行選擇,以找到適合你特定問題的適當算法,并且整篇文章將引導你完成如何使用該表單的過程。
監(jiān)督學習
在監(jiān)督學習中,機器是通過示例進行教學的。操作員向機器學習算法提供一個包含所需輸入和輸出的已知數(shù)據(jù)集,并且該算法必須找到一種方法來確定如何得出這些輸入和輸出。當操作員知道問題的正確答案時,該算法可以識別數(shù)據(jù)中的模式,從觀察中學習并做出預(yù)測。該算法進行預(yù)測并由操作員進行校正-直到該算法達到較高的準確性/性能水平為止,此過程將繼續(xù)進行。
在監(jiān)督學習的保護下,分類,回歸和預(yù)測成為可能。
分類:在分類任務(wù)中,機器學習程序必須從觀察值得出結(jié)論,并確定
新觀察結(jié)果屬于什么類別。例如,當將電子郵件過濾為垃圾郵件或非垃圾郵件時,程序?qū)⒉榭船F(xiàn)有的觀察數(shù)據(jù)并相應(yīng)地過濾電子郵件。
回歸:在回歸任務(wù)中,機器學習程序必須估計并理解變量之間的關(guān)系?;貧w分析的重點是一個因變量和一系列其他變化變量,這使其對預(yù)測和預(yù)測特別有用。
預(yù)測:預(yù)測是根據(jù)過去和現(xiàn)在的數(shù)據(jù)對未來進行預(yù)測的過程,通常用于分析趨勢。
監(jiān)督學習與無監(jiān)督學習,這兩種流行的機器學習類型以及何時使用它們
差異真正歸結(jié)為數(shù)據(jù)集中的觀察結(jié)果代表你所了解的事物還是你要學習的關(guān)系的事物
半監(jiān)督學習
半監(jiān)督學習與監(jiān)督學習相似,但是使用標簽數(shù)據(jù)和未標簽數(shù)據(jù)。標記數(shù)據(jù)本質(zhì)上是具有有意義標簽的信息,因此算法可以理解該數(shù)據(jù),而未標記數(shù)據(jù)則缺少該信息。通過組合這些技術(shù),機器學習算法可以學習標記未標記的數(shù)據(jù)。
無監(jiān)督學習
在這里,機器學習算法研究數(shù)據(jù)以識別模式。沒有答案鍵或人工操作員來提供說明。相反,機器通過分析可用數(shù)據(jù)來確定相關(guān)性和關(guān)系。在無監(jiān)督的學習過程中,機器學習算法被用來解釋大型數(shù)據(jù)集并相應(yīng)地處理該數(shù)據(jù)。該算法嘗試以某種方式組織數(shù)據(jù)以描述其結(jié)構(gòu)。這可能意味著將數(shù)據(jù)分組到群集中或以看起來更有條理的方式進行排列。
當它評估更多數(shù)據(jù)時,其對該數(shù)據(jù)做出決策的能力逐漸提高并變得更加完善。
無監(jiān)督學習技術(shù)包括:
聚類:聚類涉及將相似數(shù)據(jù)集(基于定義的標準)進行分組。將數(shù)據(jù)分成幾組并對每個數(shù)據(jù)集進行分析以找到模式非常有用。
降維:降維減少了為了找到所需的確切信息而要考慮的變量數(shù)量。
強化學習
強化學習專注于有條理的學習過程,其中機器學習算法提供了一組動作,參數(shù)和最終值。通過定義規(guī)則,機器學習算法然后嘗試探索不同的選項和可能性,監(jiān)視和評估每個結(jié)果以確定哪個是最佳的。強化學習可以教機器嘗試和錯誤。它從過去的經(jīng)驗中吸取教訓,并開始根據(jù)情況調(diào)整其方法以實現(xiàn)最佳結(jié)果。
機器學習使用接收和分析輸入數(shù)據(jù)的編程算法來預(yù)測可接受范圍內(nèi)的輸出值。隨著將新數(shù)據(jù)輸入這些算法,他們將學習并優(yōu)化其操作以提高性能,并隨著時間的推移開發(fā)智能。
確定要使用的機器學習算法
選擇正確的機器學習算法取決于幾個因素,包括但不限于:數(shù)據(jù)大小,質(zhì)量和多樣性,以及企業(yè)希望從該數(shù)據(jù)中得出什么答案。其他注意事項包括準確性,訓練時間,參數(shù),數(shù)據(jù)點等等。因此,選擇正確的算法是業(yè)務(wù)需求,規(guī)范,實驗和可用時間的結(jié)合。
即使是經(jīng)驗最豐富的數(shù)據(jù)科學家,也無法在與其他人進行實驗之前就告訴你哪種算法性能最好。但是,我們已經(jīng)編寫了一份機器學習算法備忘單,它將幫助你找到最適合自己的特定挑戰(zhàn)。
最常見和最受歡迎的機器學習算法是什么?
在右側(cè)的幻燈片中滾動以了解最常用的機器學習算法。該列表并非詳盡無遺,但確實包含了數(shù)據(jù)科學家在解決業(yè)務(wù)問題時最有可能遇到的算法。
請記住,這些技術(shù)中有許多是組合在一起并一起使用的,通常你必須嘗試不同的算法并比較結(jié)果來進行試驗。
顯然,在為你的業(yè)務(wù)分析選擇正確的機器學習算法時,需要考慮很多因素。但是,你無需成為數(shù)據(jù)科學家或?qū)I(yè)統(tǒng)計學家即可將這些模型用于你的業(yè)務(wù)。在AAA教育,我們的產(chǎn)品和解決方案利用全面的機器學習算法選擇,幫助你開發(fā)可不斷從數(shù)據(jù)中傳遞價值的流程。
填寫下面表單即可預(yù)約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學費! 怕學不會?助教全程陪讀,隨時解惑!擔心就業(yè)?一地學習,可推薦就業(yè)!
?2007-2022/ m.5wd995.cn 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc