當(dāng)前位置: 首頁(yè) > 工業(yè)電子產(chǎn)品 > 其他電子產(chǎn)品 > 麥克風(fēng)
發(fā)布日期:2022-10-09 點(diǎn)擊率:139
亞馬遜Echo和谷歌Home爭(zhēng)奇斗艷,除了云端服務(wù),他們?cè)谟布系降子心男┎町悾课覀兿葘cho和Home兩款音箱拆開(kāi)來(lái)看,區(qū)別最大的還是麥克風(fēng)陣列技術(shù)。Amazon Echo采用的是環(huán)形6+1麥克風(fēng)陣列,而Google Home(包括Surface Studio)只采用了2麥克風(fēng)陣列。這里想稍微深入談?wù)匊溈孙L(fēng)陣列技術(shù),以及智能語(yǔ)音交互設(shè)備到底應(yīng)該選用怎樣的方案。
什么是麥克風(fēng)陣列技術(shù)?
學(xué)術(shù)上有個(gè)概念是“傳聲器陣列”,主要由一定數(shù)目的聲學(xué)傳感器組成,用來(lái)對(duì)聲場(chǎng)的空間特性進(jìn)行采樣并處理的系統(tǒng)。而這篇文章講到的麥克風(fēng)陣列是其中一個(gè)狹義概念,特指應(yīng)用于語(yǔ)音處理的按一定規(guī)則排列的多個(gè)麥克風(fēng)系統(tǒng),也可以簡(jiǎn)單理解為2個(gè)以上麥克風(fēng)組成的錄音系統(tǒng)。
麥克風(fēng)陣列一般來(lái)說(shuō)有線(xiàn)形、環(huán)形和球形之分,嚴(yán)謹(jǐn)?shù)膽?yīng)該說(shuō)成一字、十字、平面、螺旋、球形及無(wú)規(guī)則陣列等。至于麥克風(fēng)陣列的陣元數(shù)量,也就是麥克風(fēng)數(shù)量,可以從2個(gè)到上千個(gè)不等。這樣說(shuō)來(lái),麥克風(fēng)陣列真的好復(fù)雜,別擔(dān)心,復(fù)雜的麥克風(fēng)陣列主要應(yīng)用于工業(yè)和國(guó)防領(lǐng)域,消費(fèi)領(lǐng)域考慮到成本會(huì)簡(jiǎn)化很多。
為什么需要麥克風(fēng)陣列?
消費(fèi)級(jí)麥克風(fēng)陣列的興起得益于語(yǔ)音交互的市場(chǎng)火熱,主要解決遠(yuǎn)距離語(yǔ)音識(shí)別的問(wèn)題,以保證真實(shí)場(chǎng)景下的語(yǔ)音識(shí)別率。這涉及了語(yǔ)音交互用戶(hù)場(chǎng)景的變化,當(dāng)用戶(hù)從手機(jī)切換到類(lèi)似Echo智能音箱或者機(jī)器人的時(shí)候,實(shí)際上麥克風(fēng)面臨的環(huán)境就完全變了,這就如同兩個(gè)人竊竊私語(yǔ)和大聲嘶喊的區(qū)別。
前幾年,語(yǔ)音交互應(yīng)用最為普遍的就是以Siri為代表的智能手機(jī),這個(gè)場(chǎng)景一般都是采用單麥克風(fēng)系統(tǒng)。單麥克風(fēng)系統(tǒng)可以在低噪聲、無(wú)混響、距離聲源很近的情況下獲得符合語(yǔ)音識(shí)別需求的聲音信號(hào)。但是,若聲源距離麥克風(fēng)距離較遠(yuǎn),并且真實(shí)環(huán)境存在大量的噪聲、多徑反射和混響,導(dǎo)致拾取信號(hào)的質(zhì)量下降,這會(huì)嚴(yán)重影響語(yǔ)音識(shí)別率。而且,單麥克風(fēng)接收的信號(hào),是由多個(gè)聲源和環(huán)境噪聲疊加的,很難實(shí)現(xiàn)各個(gè)聲源的分離。這樣就無(wú)法實(shí)現(xiàn)聲源定位和分離,這很重要,因?yàn)檫€有一類(lèi)聲音的疊加并非噪聲,但是在語(yǔ)音識(shí)別中也要抑制,就是人聲的干擾,語(yǔ)音識(shí)別顯然不能同時(shí)識(shí)別兩個(gè)以上的聲音。
顯然,當(dāng)語(yǔ)音交互的場(chǎng)景過(guò)渡到以Echo、機(jī)器人或者汽車(chē)為主要場(chǎng)景的時(shí)候,單麥克風(fēng)的局限就凸顯出來(lái)。為了解決單麥克風(fēng)的這些局限性,利用麥克風(fēng)陣列進(jìn)行語(yǔ)音處理的方法應(yīng)時(shí)而生。麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)(常用線(xiàn)形、環(huán)形)擺放的麥克風(fēng)組成,對(duì)采集的不同空間方向的聲音信號(hào)進(jìn)行空時(shí)處理,實(shí)現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測(cè)向、聲源跟蹤、陣列增益等功能,進(jìn)而提高語(yǔ)音信號(hào)處理質(zhì)量,以提高真實(shí)環(huán)境下的語(yǔ)音識(shí)別率。
下一篇: PLC、DCS、FCS三大控
上一篇: 索爾維全系列Solef?PV