在大數(shù)據(jù)分析Python語音轉(zhuǎn)文字教程中,我將演示如何使用Python將語音轉(zhuǎn)換為文本。這可以借助“語音識(shí)別” API和“ PyAudio”庫(kù)來完成。
語音是最常見的交流手段,世界上大多數(shù)人口都依靠語音相互交流。語音識(shí)別系統(tǒng)基本上將口語翻譯成文本。語音識(shí)別系統(tǒng)有很多現(xiàn)實(shí)的例子。例如,Apple SIRI可以識(shí)別語音并將其截?cái)酁槲谋尽?br />
語音識(shí)別如何工作?
隱馬爾可夫模型(HMM)是一種深度神經(jīng)網(wǎng)絡(luò)模型,用于將音頻轉(zhuǎn)換為文本。完整的詳細(xì)過程已超出大數(shù)據(jù)分析Python語音轉(zhuǎn)文字教程的范圍。在大數(shù)據(jù)分析Python語音轉(zhuǎn)文字教程中,我將演示如何使用Python將語音轉(zhuǎn)換為文本。這可以借助“ 語音識(shí)別” API和“ PyAudio ”庫(kù)來完成。
語音識(shí)別API支持多個(gè)API,在大數(shù)據(jù)分析Python語音轉(zhuǎn)文字教程中,我使用了百度語音識(shí)別API。有關(guān)更多詳細(xì)信息,請(qǐng)檢查 此。它有助于將語音轉(zhuǎn)換為文本的翻譯。
Python庫(kù)
將音頻文件轉(zhuǎn)換為文本
腳步:
導(dǎo)入語音識(shí)別庫(kù)
初始化識(shí)別器類以識(shí)別語音。我們正在使用谷歌語音識(shí)別。
語音識(shí)別支持的音頻文件: wav,AIFF,AIFF-C,F(xiàn)LAC。 在此示例中,我使用了“ wav”文件
我用過“拍攝的”電影音頻剪輯,上面寫著 “我不知道你是誰,如果你要贖金,我不知道你想要什么,我可以告訴你我沒有錢”
默認(rèn)情況下,百度識(shí)別器會(huì)讀取英語。它支持不同的語言,有關(guān)更多詳細(xì)信息,請(qǐng)參閱此文檔。
碼
輸出量
如何轉(zhuǎn)換不同的音頻語言?
例如,如果我們要閱讀法語音頻文件,則需要在recogonize_百度中添加語言選項(xiàng)。其余代碼保持不變。請(qǐng)參考更多 文檔
輸出量
麥克風(fēng)語音轉(zhuǎn)換成文字
腳步:
1、我們需要安裝PyAudio庫(kù),該庫(kù)用于通過麥克風(fēng)和揚(yáng)聲器接收音頻輸入和輸出?;旧希兄谑刮覀兊穆曇敉ㄟ^麥克風(fēng)傳播。
2、代替音頻文件源,我們必須使用Microphone類。其余步驟相同。
碼
我剛剛說過“你好嗎?”
輸出量
用另一種語言說話怎么樣?
同樣,我們需要在Recognize_百度()中添加所需的語言選項(xiàng)。我正在用泰米爾語(印度語)交談,并在語言選項(xiàng)中添加“ ta-IN”。
我只是在泰米爾語中說“你好”,它準(zhǔn)確地在泰米爾語中打印了文字。
輸出量
注意:
百度語音識(shí)別API是將語音轉(zhuǎn)換為文本的簡(jiǎn)便方法,但需要互聯(lián)網(wǎng)連接才能運(yùn)行。
在大數(shù)據(jù)分析Python語音轉(zhuǎn)文字教程中,我們了解了如何使用百度語音識(shí)別API將語音轉(zhuǎn)換為文本。這對(duì)于NLP項(xiàng)目尤其是處理音頻筆錄數(shù)據(jù)非常有幫助。如果您要添加任何內(nèi)容,請(qǐng)隨時(shí)發(fā)表評(píng)論!
填寫下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!
?2007-2022/ m.5wd995.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc