首頁(yè) 資訊 語(yǔ)音識(shí)別——智能硬件產(chǎn)品人機(jī)交互模式之一

語(yǔ)音識(shí)別——智能硬件產(chǎn)品人機(jī)交互模式之一

來(lái)源:泰然健康網(wǎng) 時(shí)間:2024年12月20日 21:40

語(yǔ)音識(shí)別是以語(yǔ)音為研究對(duì)象,通過(guò)語(yǔ)音信號(hào)處理和模式識(shí)別讓機(jī)器自動(dòng)識(shí)別和理解人類(lèi)口述的語(yǔ)言。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語(yǔ)音識(shí)別是一門(mén)涉及面很廣的交叉學(xué)科,它與聲學(xué)、語(yǔ)音學(xué)、語(yǔ)言學(xué)、信息理論、模式識(shí)別理論以及神經(jīng)生物學(xué)等學(xué)科都有非常密切的關(guān)系。語(yǔ)音識(shí)別技術(shù)正逐步成為計(jì)算機(jī)信息處理技術(shù)中的關(guān)鍵技術(shù),語(yǔ)音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。

  近兩年人工智能快速發(fā)展,語(yǔ)音識(shí)別開(kāi)始成為很多設(shè)備的標(biāo)配,以語(yǔ)音識(shí)別為技術(shù)基礎(chǔ)的硬件設(shè)備成為新的風(fēng)口,尤其是智能音箱的出現(xiàn)受到行業(yè)及消費(fèi)者的普遍歡迎。國(guó)外微軟、蘋(píng)果、谷歌、nuance,國(guó)內(nèi)的科大訊飛、思必馳等廠商都在研發(fā)語(yǔ)音識(shí)別新策略新算法,似乎人類(lèi)與語(yǔ)音的自然交互漸行漸近。

  語(yǔ)音識(shí)別是以語(yǔ)音為研究對(duì)象,通過(guò)語(yǔ)音信號(hào)處理和模式識(shí)別讓機(jī)器自動(dòng)識(shí)別和理解人類(lèi)口述的語(yǔ)言。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語(yǔ)音識(shí)別是一門(mén)涉及面很廣的交叉學(xué)科,它與聲學(xué)、語(yǔ)音學(xué)、語(yǔ)言學(xué)、信息理論、模式識(shí)別理論以及神經(jīng)生物學(xué)等學(xué)科都有非常密切的關(guān)系。語(yǔ)音識(shí)別技術(shù)正逐步成為計(jì)算機(jī)信息處理技術(shù)中的關(guān)鍵技術(shù),語(yǔ)音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。

  所謂“語(yǔ)音識(shí)別”,就是利用電子計(jì)算機(jī)等機(jī)械裝置來(lái)識(shí)別人講話的意義和內(nèi)容。20世紀(jì)50代,就有人提出“口授打印機(jī)”的設(shè)恕??梢哉f(shuō),這是有關(guān)語(yǔ)音識(shí)別技術(shù)最早構(gòu)想。

  語(yǔ)音識(shí)別技術(shù)經(jīng)歷了語(yǔ)音識(shí)別、語(yǔ)音合成以及自然語(yǔ)音合成3個(gè)階段。從原理上講,似乎讓計(jì)算機(jī)識(shí)別人的語(yǔ)言并不難,其實(shí)困難還是不少的。例如,不同的人讀同一個(gè)詞所發(fā)出的音在聲學(xué)特征上卻不完全相同;即便是同一個(gè)人,右不同情況下對(duì)同一個(gè)字的發(fā)音也不相同。加上人們講話時(shí)常有不合語(yǔ)法規(guī)律的情況,有時(shí)還夾雜些俗語(yǔ),或省略一些詞語(yǔ),而且語(yǔ)速變化不定。所有這些,在我們聽(tīng)別人講話時(shí)似乎都不成為問(wèn)題,但讓機(jī)器理解則很是困難。近年來(lái),由于計(jì)算機(jī)功能的日益強(qiáng)大,存儲(chǔ)技術(shù)、語(yǔ)音算法技術(shù)和信號(hào)處理技術(shù)的長(zhǎng)足進(jìn)步,以及軟件編程水平的提高,語(yǔ)音識(shí)別技術(shù)已經(jīng)取得突破性的進(jìn)展,使它的廣泛應(yīng)用成為可能。

  語(yǔ)音識(shí)別技術(shù)的應(yīng)用主要有以下兩個(gè)方面。一是用于人機(jī)交流。目前這方面應(yīng)用的呼聲很高,因?yàn)槭褂面I盤(pán)、鼠標(biāo)與電子計(jì)算機(jī)進(jìn)行交流的這種方式,使許多非專業(yè)人員,特別是不懂英語(yǔ)或不熟悉漢語(yǔ)拼音的人被拒之于門(mén)外,影響到電子計(jì)算機(jī)的進(jìn)一步普及。語(yǔ)音識(shí)別技術(shù)的采用,改變了人與計(jì)算機(jī)的互動(dòng)模式,人們只需動(dòng)動(dòng)口,就能打開(kāi)或關(guān)閉程序,改變工作界面。這種使電腦人性化的結(jié)果是使人的雙手得到解放,使每個(gè)人都能操作和應(yīng)用計(jì)算機(jī)。電話仍是目前使用最為普遍的通信工具,通過(guò)電話與語(yǔ)音識(shí)別系統(tǒng)的協(xié)同工作,可以實(shí)現(xiàn)語(yǔ)音撥號(hào)、電話購(gòu)物以及通過(guò)電話辦理銀行業(yè)務(wù)、炒股、上網(wǎng)檢索信息或處理電子件等。不久,能按主人口令接通電話、打開(kāi)收音機(jī),以及通過(guò)聲紋識(shí)別來(lái)者身份的安全系統(tǒng)也將獲得應(yīng)用。

  語(yǔ)音識(shí)別技術(shù)的另一方面應(yīng)用便是語(yǔ)音輸入和合成語(yǔ)音輸出?,F(xiàn)在,已經(jīng)出現(xiàn)能將口述的文稿輸入計(jì)算機(jī)并按指定格式編排的語(yǔ)音軟件,它比通過(guò)鍵盤(pán)輸入在速度上要提高2~4倍。裝有語(yǔ)音軟件的電腦還能通過(guò)語(yǔ)音合成把計(jì)算機(jī)里的文件用各種語(yǔ)言“讀”出來(lái),這將大大推進(jìn)遠(yuǎn)程通信和網(wǎng)絡(luò)電話的發(fā)展。

  在現(xiàn)階段,語(yǔ)音技術(shù)主要用于電子商務(wù)、客戶服務(wù)和教育培訓(xùn)等領(lǐng)域,它對(duì)于節(jié)省人力、時(shí)間,提高工作效率將起到明顯的作用。能實(shí)現(xiàn)自動(dòng)翻譯的語(yǔ)音識(shí)別系統(tǒng)目前也正在研究、完善之中。

  隨著技術(shù)不斷發(fā)展突破,語(yǔ)音識(shí)別在國(guó)內(nèi)外市場(chǎng)將獲得更大發(fā)展空間。拓墣產(chǎn)業(yè)研究院研究指出,全球語(yǔ)音辨識(shí)產(chǎn)值將呈現(xiàn)高速成長(zhǎng),自2016年的26.13億美元,至2021年成長(zhǎng)為159.79億美元,年復(fù)合成長(zhǎng)率達(dá)43.64%;國(guó)內(nèi)市場(chǎng)方面,據(jù)前瞻產(chǎn)業(yè)研究院預(yù)計(jì),到2021年,中國(guó)生物識(shí)別行業(yè)的市場(chǎng)規(guī)模將突破340億元,其中語(yǔ)音識(shí)別占比將達(dá)到22.4%。

  因此,語(yǔ)音識(shí)別可以說(shuō)是生物識(shí)別領(lǐng)域中技術(shù)較成熟、商業(yè)化程度較高的細(xì)分領(lǐng)域之一,語(yǔ)音識(shí)別技術(shù)憑借成本與算法復(fù)雜程度低,采集方便等優(yōu)勢(shì),在許多行業(yè)得到了應(yīng)用。人工智能時(shí)代的語(yǔ)音識(shí)別技術(shù)也給安防行業(yè)帶來(lái)了“新鮮血液”。

  在監(jiān)控領(lǐng)域,隨著平安城市項(xiàng)目建設(shè)的推進(jìn),音頻監(jiān)控在城市安防系統(tǒng)中的應(yīng)用越來(lái)越多。音頻監(jiān)控作為安防行業(yè)近年來(lái)迅速發(fā)展的一個(gè)分支,目前已展現(xiàn)出前所未有的勃勃生機(jī),人們開(kāi)始從能夠看見(jiàn)和聽(tīng)見(jiàn)的需求轉(zhuǎn)向?qū)で蟾哔|(zhì)量的音視頻監(jiān)控。例如,公檢法機(jī)構(gòu)、機(jī)場(chǎng)、鐵路、銀行等領(lǐng)域的安防工程需要清晰、逼真的影音同步監(jiān)控系統(tǒng),以彌補(bǔ)視頻監(jiān)控的不足,音頻監(jiān)控的加入就使得監(jiān)控不再只是上演“無(wú)聲電影”,工作人員通過(guò)音頻監(jiān)控設(shè)備“聽(tīng)懂”周?chē)h(huán)境,對(duì)危險(xiǎn)事件和意外事件進(jìn)行安全防范。搭載語(yǔ)音識(shí)別技術(shù)的音頻監(jiān)控已經(jīng)成為安防行業(yè)的新亮點(diǎn)。

相關(guān)知識(shí)

智能語(yǔ)音交互
語(yǔ)音識(shí)別控制芯片——開(kāi)啟智能交互的新時(shí)代
智能語(yǔ)音識(shí)別技術(shù):賦能人工智能應(yīng)用新篇章
智能語(yǔ)音交互系統(tǒng):讓溝通無(wú)界限的未來(lái)科技
百度醫(yī)生APP“語(yǔ)音導(dǎo)診”上線 開(kāi)啟智能識(shí)別導(dǎo)診新模式
語(yǔ)音識(shí)別
以人體健康數(shù)據(jù)、語(yǔ)音交互切入,可穿戴設(shè)備品牌「埃微」要讓產(chǎn)品更專業(yè)
什么是智能語(yǔ)音服務(wù)(智能語(yǔ)音服務(wù)介紹)
電銷(xiāo)機(jī)器人=AI人工智能+語(yǔ)音識(shí)別技術(shù)+語(yǔ)音知識(shí)庫(kù)+話術(shù)邏輯+智能學(xué)習(xí)
眼部按摩儀語(yǔ)音控制方案:NRK3301語(yǔ)音識(shí)別芯片

網(wǎng)址: 語(yǔ)音識(shí)別——智能硬件產(chǎn)品人機(jī)交互模式之一 http://m.jjxejuv.cn/newsview682445.html

推薦資訊