旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國(guó)統(tǒng)一咨詢熱線:010-5367 2995
首頁(yè) > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析機(jī)器學(xué)習(xí)AI入門指南

大數(shù)據(jù)分析機(jī)器學(xué)習(xí)AI入門指南

時(shí)間:2020-04-29來(lái)源:m.5wd995.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2020-04-29點(diǎn)擊量:作者:Sissi




  許多人將機(jī)器學(xué)習(xí)視為通向人工智能的途徑,但是對(duì)于統(tǒng)計(jì)學(xué)家或商人而言,機(jī)器學(xué)習(xí)也可以是一種強(qiáng)大的工具,可以實(shí)現(xiàn)前所未有的預(yù)測(cè)結(jié)果。
 

機(jī)器學(xué)習(xí)
 

  為什么機(jī)器學(xué)習(xí)如此重要?
 

  在開(kāi)始學(xué)習(xí)之前,我們想花一些時(shí)間強(qiáng)調(diào)WHY機(jī)器學(xué)習(xí)非常重要。
 

  總之,每個(gè)人都知道人工智能或人工智能。通常,當(dāng)我們聽(tīng)到AI時(shí),我們會(huì)想象機(jī)器人到處走動(dòng),執(zhí)行與人類相同的任務(wù)。但是,我們必須了解,雖然有些任務(wù)很容易,但有些任務(wù)卻很困難,并且距離擁有像人類一樣的機(jī)器人還有很長(zhǎng)的路要走。
 

  但是,機(jī)器學(xué)習(xí)是非常真實(shí)的并且已經(jīng)存在。它可以被視為AI的一部分,因?yàn)楫?dāng)我們想到AI時(shí),我們想象的大部分內(nèi)容都是基于機(jī)器學(xué)習(xí)的。
 

  在過(guò)去,我們相信未來(lái)的這些機(jī)器人將需要向我們學(xué)習(xí)一切。但是人腦是復(fù)雜的,并且并非可以輕松描述其協(xié)調(diào)的所有動(dòng)作和活動(dòng)。1959年,亞瑟·塞繆爾(Arthur Samuel)提出了一個(gè)絕妙的主意,即我們不需要教計(jì)算機(jī),但我們應(yīng)該讓他們自己學(xué)習(xí)。塞繆爾(Samuel)也創(chuàng)造了“機(jī)器學(xué)習(xí)”一詞,從那時(shí)起,當(dāng)我們談?wù)摍C(jī)器學(xué)習(xí)過(guò)程時(shí),我們指的是計(jì)算機(jī)自主學(xué)習(xí)的能力。
 

  機(jī)器學(xué)習(xí)有哪些應(yīng)用?
 

  在準(zhǔn)備這篇文章的內(nèi)容時(shí),我寫(xiě)下了沒(méi)有進(jìn)一步說(shuō)明的示例,假定所有人都熟悉它們。然后我想:人們知道這些是機(jī)器學(xué)習(xí)的例子嗎?
 

  讓我們考慮一些。
 

  自然語(yǔ)言處理,例如翻譯。如果您認(rèn)為百度翻譯是一本非常好的字典,請(qǐng)?jiān)倏紤]一下。百度翻譯本質(zhì)上是一組機(jī)器學(xué)習(xí)算法。百度不需要更新百度 Translate;它會(huì)根據(jù)不同單詞的使用情況自動(dòng)更新。
 

機(jī)器學(xué)習(xí)
 

  哦,哇 還有什么?
 

  雖然仍然是主題,但Siri,Alexa,Cortana都是語(yǔ)音識(shí)別和合成的實(shí)例。有些技術(shù)可以使這些助手識(shí)別或發(fā)音以前從未聽(tīng)過(guò)的單詞。他們現(xiàn)在能做的事令人難以置信,但在不久的將來(lái),它們將給人留下深刻的印象!
 

  SPAM過(guò)濾。令人印象深刻,但值得注意的是,SPAM不再遵循一組規(guī)則。它自己了解了什么是垃圾郵件,什么不是垃圾郵件。
 

  推薦系統(tǒng)。Netflix,淘寶,F(xiàn)acebook。推薦給您的所有內(nèi)容都取決于您的搜索活動(dòng),喜歡,以前的行為等等。一個(gè)人不可能像這些網(wǎng)站一樣提出適合您的推薦。最重要的是,他們跨平臺(tái),跨設(shè)備和跨應(yīng)用程序執(zhí)行此操作。盡管有些人認(rèn)為它是侵入性的,但通常情況下,數(shù)據(jù)不是由人處理的。通常,它是如此復(fù)雜,以至于人類無(wú)法掌握它。但是,機(jī)器將賣方與買方配對(duì),將電影與潛在觀眾配對(duì),將照片與希望觀看的人配對(duì)。這極大地改善了我們的生活。
 

  說(shuō)到這,淘寶擁有如此出色的機(jī)器學(xué)習(xí)算法,它們可以高度確定地預(yù)測(cè)您將購(gòu)買什么以及何時(shí)購(gòu)買。那么,他們?nèi)绾翁幚磉@些信息?他們將產(chǎn)品運(yùn)送到最近的倉(cāng)庫(kù),因此您可以在當(dāng)天訂購(gòu)并收到產(chǎn)品。難以置信!
 

  金融機(jī)器學(xué)習(xí)
 

  我們名單上的下一個(gè)是金融交易。交易涉及隨機(jī)行為,不斷變化的數(shù)據(jù)以及從政治到司法的各種因素,這些因素與傳統(tǒng)金融相距甚遠(yuǎn)。盡管金融家無(wú)法預(yù)測(cè)很多這種行為,但是機(jī)器學(xué)習(xí)算法會(huì)照顧到這種情況,并且對(duì)市場(chǎng)的變化做出響應(yīng)的速度比人們想象的要快。
 

  這些都是業(yè)務(wù)實(shí)現(xiàn),但還有更多。您可以預(yù)測(cè)員工是否會(huì)留在公司或離開(kāi)公司,或者可以確定客戶是否值得您光顧-他們可能會(huì)從競(jìng)爭(zhēng)對(duì)手那里購(gòu)買還是根本不購(gòu)買。您可以優(yōu)化流程,預(yù)測(cè)銷售,發(fā)現(xiàn)隱藏的機(jī)會(huì)。機(jī)器學(xué)習(xí)為機(jī)會(huì)開(kāi)辟了一個(gè)全新的世界,對(duì)于在公司戰(zhàn)略部門工作的人們來(lái)說(shuō),這是一個(gè)夢(mèng)想成真。
 

  無(wú)論如何,這些已在這里使用。然后,我們將進(jìn)入自動(dòng)駕駛汽車的新境界。
 

  機(jī)器學(xué)習(xí)算法
 

  直到最近幾年,無(wú)人駕駛汽車還是科幻小說(shuō)。好吧,不再了。自動(dòng)駕駛汽車已經(jīng)驅(qū)動(dòng)了數(shù)百萬(wàn)英里(即使不是數(shù)十億英里)。那是怎么發(fā)生的?沒(méi)有一套規(guī)則。而是一組機(jī)器學(xué)習(xí)算法,使汽車學(xué)習(xí)了如何極其安全有效地駕駛。
 

  我們可以繼續(xù)學(xué)習(xí)幾個(gè)小時(shí),但我相信您的主旨是:“為什么要使用機(jī)器學(xué)習(xí)”。
 

  因此,對(duì)您來(lái)說(shuō),這不是為什么的問(wèn)題,而是如何的問(wèn)題。
 

  這就是我們的Python機(jī)器學(xué)習(xí)課程所要解決的問(wèn)題。蓬勃發(fā)展的數(shù)據(jù)科學(xué)事業(yè)中最重要的技能之一-如何創(chuàng)建機(jī)器學(xué)習(xí)算法!
 

  如何創(chuàng)建機(jī)器學(xué)習(xí)算法?
 

  假設(shè)我們已經(jīng)提供了輸入數(shù)據(jù),創(chuàng)建機(jī)器學(xué)習(xí)算法最終意味著建立一個(gè)輸出正確信息的模型。
 

  現(xiàn)在,將此模型視為黑匣子。我們提供輸入,并提供輸出。例如,考慮到過(guò)去幾天的氣象信息,我們可能想創(chuàng)建一個(gè)預(yù)測(cè)明天天氣的模型。我們將輸入模型的輸入可以是度量,例如溫度,濕度和降水。我們將獲得的輸出將是明天的天氣預(yù)報(bào)。
 

  現(xiàn)在,在對(duì)模型的輸出感到滿意和自信之前,我們必須訓(xùn)練模型。訓(xùn)練是機(jī)器學(xué)習(xí)中的核心概念,因?yàn)檫@是模型學(xué)習(xí)如何理解輸入數(shù)據(jù)的過(guò)程。訓(xùn)練完模型后,我們可以簡(jiǎn)單地將其輸入數(shù)據(jù)并獲得輸出。
 

  如何訓(xùn)練機(jī)器學(xué)習(xí)算法?
 

  訓(xùn)練算法背后的基本邏輯涉及四個(gè)要素:
 

  a.數(shù)據(jù)

  b.模型

  c.目標(biāo)函數(shù)

  d.優(yōu)化算法
 

  讓我們探索每個(gè)。
 

  首先,我們必須準(zhǔn)備一定數(shù)量的數(shù)據(jù)進(jìn)行訓(xùn)練。
 

  通常,這是歷史數(shù)據(jù),很容易獲得。
 

  其次,我們需要一個(gè)模型。
 

  我們可以訓(xùn)練的最簡(jiǎn)單模型是線性模型。在天氣預(yù)報(bào)示例中,這將意味著找到一些系數(shù),將每個(gè)變量與它們相乘,然后將所有結(jié)果求和以得到輸出。但是,正如我們稍后將看到的那樣,線性模型只是冰山一角。依靠線性模型,深度機(jī)器學(xué)習(xí)使我們可以創(chuàng)建復(fù)雜的非線性模型。它們通常比簡(jiǎn)單的線性關(guān)系更好地?cái)M合數(shù)據(jù)。
 

  第三個(gè)要素是目標(biāo)函數(shù)。
 

  到目前為止,我們獲取了數(shù)據(jù),并將其輸入到模型中,并獲得了輸出。當(dāng)然,我們希望此輸出盡可能接近實(shí)際情況。這就是目標(biāo)函數(shù)出現(xiàn)的地方。它估計(jì)平均而言,模型輸出的正確性。整個(gè)機(jī)器學(xué)習(xí)框架歸結(jié)為優(yōu)化此功能。例如,如果我們的函數(shù)正在測(cè)量模型的預(yù)測(cè)誤差,則我們希望將該誤差最小化,或者換句話說(shuō),將目標(biāo)函數(shù)最小化。
 

  我們最后的要素是優(yōu)化算法。它由機(jī)制組成,通過(guò)這些機(jī)制我們可以更改模型的參數(shù)以優(yōu)化目標(biāo)函數(shù)。例如,如果我們的天氣預(yù)報(bào)模型為:
 

  明天的天氣等于:W1乘以溫度,W2乘以濕度,優(yōu)化算法可能會(huì)經(jīng)過(guò)以下值:
 

機(jī)器學(xué)習(xí)


 

  W1和W2是將更改的參數(shù)。對(duì)于每組參數(shù),我們將計(jì)算目標(biāo)函數(shù)。然后,我們將選擇具有最高預(yù)測(cè)能力的模型。我們?cè)趺粗滥囊粋€(gè)最好?好吧,那將是具有最佳目標(biāo)函數(shù)的那個(gè)??,不是嗎?好的。大!
 

  您是否注意到我們說(shuō)了四個(gè)成分,而不是說(shuō)了四個(gè)步驟?這是有意的,因?yàn)闄C(jī)器學(xué)習(xí)過(guò)程是迭代的。我們將數(shù)據(jù)輸入模型,并通過(guò)目標(biāo)函數(shù)比較準(zhǔn)確性。然后,我們更改模型的參數(shù)并重復(fù)操作。當(dāng)我們達(dá)到無(wú)法再優(yōu)化或不需要優(yōu)化的程度時(shí),我們將停止,因?yàn)槲覀円呀?jīng)找到了解決問(wèn)題的足夠好的解決方案。



 

預(yù)約申請(qǐng)免費(fèi)試聽(tīng)課

填寫(xiě)下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽(tīng)!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動(dòng)者教育科技有限公司版權(quán)所有
備案號(hào):京ICP備12034770號(hào)

?2007-2022/ m.5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號(hào)

網(wǎng)站地圖