IT巨頭爭(zhēng)相布局智能語(yǔ)音新領(lǐng)域 產(chǎn)業(yè)將進(jìn)入爆發(fā)期
- 發(fā)布時(shí)間:2015-10-10 08:22:00 來(lái)源:人民網(wǎng) 責(zé)任編輯:湯婧
蘋果日前聲明稱,已收購(gòu)英國(guó)人工智能語(yǔ)音技術(shù)公司VocalIQ,雖具體收購(gòu)價(jià)格尚未公布,但業(yè)內(nèi)人士表示,此次收購(gòu)可能幫助蘋果改進(jìn)虛擬語(yǔ)音助手Siri,并有望進(jìn)一步推進(jìn)蘋果的汽車項(xiàng)目。
近幾年,日產(chǎn)、凱迪拉克等車企探索后視鏡智能,并通過(guò)依靠語(yǔ)音進(jìn)行操控,而這些智能語(yǔ)音方案是達(dá)訊偉業(yè)和科大訊飛深度合作的產(chǎn)物。在炙手可熱的智能家居市場(chǎng)中,以語(yǔ)音交互為基礎(chǔ)的人機(jī)互動(dòng)模式,也逐步成為標(biāo)準(zhǔn)性功能配置。
繼手動(dòng)人機(jī)交互之后,語(yǔ)音交互領(lǐng)域成為智能領(lǐng)域的另一入口,被各大巨頭爭(zhēng)相搶奪。
巨頭持續(xù)投入
VocalIQ源于劍橋大學(xué)旗下Dialogue Systems Group(對(duì)話系統(tǒng)集團(tuán)),專注于自然語(yǔ)言的理解。其通過(guò)使用深度學(xué)習(xí)來(lái)改進(jìn)語(yǔ)言識(shí)別,試圖打造科幻影片《鋼鐵俠》中的Jarvis或《她》中的Samantha。由此,VocalIQ的技術(shù)能改進(jìn)Siri、Google Now、Cortana、Alexa(亞馬遜)等一系列虛擬語(yǔ)音助手。
目前,蘋果公司的Siri等語(yǔ)音助手,主要依賴于腳本對(duì)話,對(duì)特定指令做出應(yīng)答。但通過(guò)VocalIQ技術(shù),可以使用戶以會(huì)話方式而非設(shè)備能理解的提示性語(yǔ)言與設(shè)備交互。蘋果收購(gòu)VocalIQ,顯然可以通過(guò)該技術(shù)改進(jìn)Siri。
更重要的是,收購(gòu)VocalIQ還可以推進(jìn)蘋果汽車項(xiàng)目的發(fā)展。據(jù)悉,今年年初,VocalIQ在官方博客中表示,“車載語(yǔ)音對(duì)話系統(tǒng)”能預(yù)防駕駛員在駕駛汽車時(shí),因注視車窗外景色而分心。而更早前,VocalIQ與通用汽車聯(lián)合開(kāi)發(fā)車載語(yǔ)音識(shí)別項(xiàng)目。
事實(shí)上,VocalIQ是蘋果“進(jìn)入”汽車市場(chǎng)收購(gòu)的第二家公司。今年9月份,蘋果以2500萬(wàn)美元收購(gòu)地圖可視化公司Mapsense,其主要業(yè)務(wù)是打造用來(lái)分析和可視化位置數(shù)據(jù)的工具。例如,不同于蘋果的Siri和微軟的Cortana的愈趨人性化反應(yīng),Google Now的“Ok, Google”語(yǔ)言搜尋引擎,一直在專注更準(zhǔn)確地分析使用者的話語(yǔ)。谷歌最新在其官方博客中,向我們解釋了他們最新應(yīng)用至其語(yǔ)言搜尋功能的演算法,能通過(guò)預(yù)測(cè)使用者說(shuō)話的音位(phoneme)來(lái)提升準(zhǔn)確度。
巨頭在智能語(yǔ)音領(lǐng)域沒(méi)少燒錢,從語(yǔ)音智能生態(tài)系統(tǒng)來(lái)看,主要有基于Nuance的蘋果Siri與三星S-Voice、谷歌Android的Google Now、微軟Windows Phone的Cortana三大版圖。
爭(zhēng)奪新智能入口
大佬的布局是為爭(zhēng)奪智能領(lǐng)域的另一入口。近年來(lái),科技創(chuàng)新帶來(lái)人機(jī)交互終端智能化程度的不斷提升,傳統(tǒng)的交互方式難以全方位滿足用戶需求,而以語(yǔ)音交互為基礎(chǔ)的包括圖像、體感在內(nèi)的第三代人際交互模式,正發(fā)揮著越來(lái)越顯著的作用。
但智能語(yǔ)音技術(shù)的技術(shù)壁壘很高,需要企業(yè)在統(tǒng)計(jì)學(xué)、聲學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)領(lǐng)域,具有較強(qiáng)綜合實(shí)力。同時(shí),智能語(yǔ)音技術(shù)研究周期長(zhǎng)、投入大,如IBM已在語(yǔ)音技術(shù)領(lǐng)域持續(xù)研發(fā)近30年。在全球范圍內(nèi)來(lái)看,僅有少數(shù)廠商在語(yǔ)音市場(chǎng)具備較強(qiáng)競(jìng)爭(zhēng)力,包括Nuance、IBM、微軟、Google等跨國(guó)IT企業(yè)。國(guó)內(nèi)語(yǔ)音技術(shù)市場(chǎng)則處于市場(chǎng)導(dǎo)入期。
現(xiàn)階段,智能語(yǔ)音其實(shí)并不夠智能,準(zhǔn)確率低、網(wǎng)絡(luò)依賴的一系列問(wèn)題,仍在很大程度上影響了語(yǔ)音交互的用戶體驗(yàn)。在語(yǔ)音輸入時(shí)必須有意字正腔圓地說(shuō)話,顯然這樣識(shí)別率更高,但人和人在真正交流時(shí)并不會(huì)如此,有時(shí)會(huì)說(shuō)得很快,有時(shí)聲音則會(huì)很低。同時(shí),在噪聲及使用方言等情況下,識(shí)別率會(huì)顯著降低。
同時(shí),智能化水平不高,不能理解做出思考的問(wèn)題更大。目前語(yǔ)音技術(shù)還難以實(shí)現(xiàn)對(duì)語(yǔ)義的深層次理解,只是將平臺(tái)的語(yǔ)音識(shí)別模塊嫁接到軟件中,并沒(méi)有解決語(yǔ)音識(shí)別后如何將內(nèi)容“翻譯”成機(jī)器理解的指令問(wèn)題。如果這一點(diǎn)沒(méi)有解決,語(yǔ)音技術(shù)也僅能起到聽(tīng)寫引擎的作用。
可喜的是,當(dāng)前,語(yǔ)音技術(shù)的應(yīng)用范圍正在不斷擴(kuò)寬,也衍生出一系列對(duì)語(yǔ)音交互存在剛性需求的場(chǎng)景。例如以可穿戴設(shè)備為代表的小型化、便攜式終端的交互;遠(yuǎn)距離、大屏幕終端交互,如智能電視、智能家居、消費(fèi)機(jī)器人等;汽車等不方便使用雙手的場(chǎng)景中人機(jī)交互。也就是說(shuō),應(yīng)用反向推動(dòng)技術(shù)的進(jìn)步。
產(chǎn)業(yè)即將進(jìn)入爆發(fā)期
由于智能可穿戴設(shè)備屏幕一般不會(huì)太大,甚至沒(méi)有觸控屏幕,因此更加便利的人機(jī)交互,就需使用語(yǔ)音進(jìn)行控制。比如,可穿戴設(shè)備的先驅(qū)谷歌眼鏡,就搭載了智能語(yǔ)音系統(tǒng),用戶通過(guò)fiOK Glassfl這句話就可以啟動(dòng)智能對(duì)話,然后通過(guò)語(yǔ)音就能獲得通知及提醒,并在網(wǎng)絡(luò)環(huán)境下,可以通過(guò)語(yǔ)音給別人發(fā)送短信。此外,包括索尼發(fā)布SWR30語(yǔ)音手環(huán),以及全球首款中文智能手表操作系統(tǒng)Moto 360智能手表,均以語(yǔ)音交互為其賣點(diǎn)。隨著可穿戴設(shè)備在未來(lái)滲透率的不斷提升,語(yǔ)音交互應(yīng)用領(lǐng)域?qū)⒉粩嗤貙挕?/p>
在大屏領(lǐng)域的應(yīng)用集中在智能電視,包括康佳、長(zhǎng)虹、TCL、LG、樂(lè)視等,均搭載非常強(qiáng)大語(yǔ)音交互功能,可以通過(guò)語(yǔ)音輸入,實(shí)現(xiàn)包括查收影視劇、聽(tīng)歌、發(fā)送微博、開(kāi)關(guān)電視等各種實(shí)用的功能。在智能家居中,搭載語(yǔ)音方案也是必不可少的,如蘋果發(fā)布的智能家居 HomeKit,也是采取與Siri協(xié)作的方式,用戶可以使用自然語(yǔ)句來(lái)發(fā)出各種命令,例如“關(guān)上我的前門”、“打開(kāi)廚房的燈”。Siri還能告訴用戶家里物品的狀態(tài),回答如“我的車庫(kù)是開(kāi)著嗎?”這樣的問(wèn)題。在未來(lái)家庭用的消費(fèi)人興起之后,語(yǔ)音技術(shù)還將面臨更大市場(chǎng)。
汽車領(lǐng)域則是另一爭(zhēng)奪的焦點(diǎn),由于在駕駛汽車的過(guò)程中,使用按鍵或觸控容易引發(fā)安全問(wèn)題,因此各大車廠在前裝控制系統(tǒng)中也均搭載了語(yǔ)音控制方案。
分析人士指出,語(yǔ)音技術(shù)水平的提升,與其商用價(jià)值的釋放,并未能呈現(xiàn)出完全的線性關(guān)系。雖語(yǔ)音技術(shù)發(fā)展已歷經(jīng)長(zhǎng)達(dá)數(shù)十年時(shí)間,但由于并未突破大規(guī)模商用的節(jié)點(diǎn),因此目前市場(chǎng)規(guī)模仍停留在十億量級(jí)。近年來(lái),隨著技術(shù)不斷沉淀,以及語(yǔ)音交互場(chǎng)景的不斷拓寬,也預(yù)示著語(yǔ)音商用價(jià)值的顯著提升,語(yǔ)音產(chǎn)業(yè)發(fā)展即將進(jìn)入爆發(fā)期。
- 股票名稱 最新價(jià) 漲跌幅
- 祥龍電業(yè) 6.77 10.08%
- 安彩高科 10.18 10.05%
- 傲農(nóng)生物 19.98 10.02%
- 振華股份 15.92 10.02%
- 東軟集團(tuán) 15.94 10.01%
- 世運(yùn)電路 18.15 10.00%
- 天鵝股份 23.65 10.00%
- 七一二 43.81 9.99%
- 愛(ài)嬰室 31.60 9.99%
- 西部黃金 21.48 9.98%
- 外媒:滴滴考慮2017年在美國(guó)上市
- 千家第三方支付企業(yè)被指無(wú)照經(jīng)營(yíng)
- 人人游戲私有化亂象:138名離職員工的期權(quán)去了哪
- 首例電競(jìng)直播侵權(quán)案終審宣判:斗魚被判賠110萬(wàn)元
- 人民日?qǐng)?bào)談小米平衡車傷人:標(biāo)準(zhǔn)缺乏產(chǎn)業(yè)野蠻生長(zhǎng)
- 國(guó)際反假聯(lián)盟暫停阿里會(huì)員資格 加入一月即被除名
- 微信支付高層地震 騰訊金融戰(zhàn)略層面領(lǐng)跑者缺位
- 慘被拋棄:諾基亞功能機(jī)業(yè)務(wù)被微軟關(guān)閉
- 蘋果投資滴滴背后的秘密 原來(lái)10億美元要這么花
- 中概股私有化大潮背后:PE散戶化 VC產(chǎn)業(yè)化