整個(gè)語(yǔ)音行業(yè)從2010年蘋(píng)果公司推出siri開(kāi)始,受到越來(lái)越多的關(guān)注。越來(lái)越多的業(yè)內人士認為,語(yǔ)音技術(shù)在兩三年內,會(huì )徹底改變當前的人機交互方式。北美最大的語(yǔ)音技術(shù)提供商nuance的高管最近就說(shuō):“語(yǔ)音和自然語(yǔ)義理解突然成為一門(mén)前沿科技,而我們正站在這個(gè)過(guò)渡點(diǎn)上。我認為語(yǔ)音識別將真正顛覆目前的計算機交互接口。”本文圍繞智能語(yǔ)音在智能交通、智能電網(wǎng)以及智能家居中的應用展開(kāi)探討。
智能語(yǔ)音技術(shù)改變傳統交互方式
智能語(yǔ)音交互首先改變的是移動(dòng)互聯(lián)網(wǎng)。以iphone中內置的siri為例,用戶(hù)以自然語(yǔ)言的方式對智能手機下達指令,而手機根據用戶(hù)語(yǔ)音和用戶(hù)當前的環(huán)境及上下文對用戶(hù)意圖進(jìn)行理解,并按照用戶(hù)意圖執行命令的過(guò)程。如用戶(hù)說(shuō)“查找附近的川菜館”,則手機會(huì )搜索用戶(hù)當前所在位置附近的川菜風(fēng)味餐廳,并將列表顯示出來(lái)供用戶(hù)選擇查看。
如今的語(yǔ)音搜索不同于傳統搜索模式,不是基于無(wú)關(guān)聯(lián)的幾個(gè)關(guān)鍵詞來(lái)反饋結果,而是能夠理解用戶(hù)指令,完成一項完整的任務(wù)。也就是說(shuō),語(yǔ)音搜索已經(jīng)不僅局限于將客戶(hù)需要的信息呈現出來(lái),還會(huì )將一些連鎖信息進(jìn)行反饋,自動(dòng)生成給客戶(hù)一套全面的服務(wù),基于這種高智能化的技術(shù)進(jìn)化,語(yǔ)音必將成為日后移動(dòng)互聯(lián)網(wǎng)的入口之一。
電視和機頂盒也是采用智能語(yǔ)音交互比較積極的行業(yè)。傳統的電視機和機頂盒的遙控操作都比較復雜,而采用智能語(yǔ)音交互技術(shù),只需對著(zhù)遙控器說(shuō)話(huà),就可以控制電視,輸入文字、打開(kāi)應用、播放視頻都可輕松實(shí)現。去年三星、lg和聯(lián)想等都發(fā)布了帶有專(zhuān)用語(yǔ)音輸入功能的遙控器,甚至有的還實(shí)現了類(lèi)似siri的語(yǔ)音助手的功能。
傳統行業(yè)利用智能語(yǔ)音交互技術(shù)進(jìn)行業(yè)務(wù)效率提升的意愿也比較強烈。比如傳統呼叫中心領(lǐng)域,需要投入大量資金、人力,甚至建設大面積的人工語(yǔ)音座席,每年投入上百億資金。國外早已普遍采用基于智能語(yǔ)音交互技術(shù)改造的呼叫中心,大量的用戶(hù)常見(jiàn)問(wèn)題、投訴和建議都可以被自動(dòng)識別和回復,節省了成本。而且這些呼叫中心每天收到大量的用戶(hù)語(yǔ)音數據,包含了龐大數量的用戶(hù)信息、偏好,都具有極大價(jià)值。但是如果不能利用智能語(yǔ)音技術(shù)進(jìn)行數據處理和挖掘,這些信息就如同儲量龐大的金礦,卻無(wú)法開(kāi)采。為了開(kāi)發(fā)這些數據,傳統呼叫中心都對投入智能語(yǔ)音交互技術(shù)抱有極大熱情。
另外,汽車(chē)、玩具、穿戴設備都對智能交互技術(shù)能提供的全新交互方式抱有很大的期待。語(yǔ)音技術(shù)作為一個(gè)已經(jīng)漸漸成熟的基礎技術(shù),隨著(zhù)使用面日漸擴大,必將越來(lái)越改變傳統的人機交互方式。
智能交通語(yǔ)音技術(shù)應用
定位服務(wù)又叫做移動(dòng)位置服務(wù)(locationbasedservice,lbs),它是通過(guò)電信移動(dòng)運營(yíng)商的網(wǎng)絡(luò )(如gsm網(wǎng)、cdma網(wǎng))獲取移動(dòng)終端用戶(hù)的位置信息,為用戶(hù)提供相應的位置服務(wù)。簡(jiǎn)單的說(shuō),就是你走到某個(gè)地方,就可以獲得這里周邊的各類(lèi)資料,不管是餐廳商廈還是便利店,一切資料盡在掌握。
基于智能語(yǔ)音技術(shù)的lbs系統,用戶(hù)通過(guò)語(yǔ)音就可以便捷的找到想要的定點(diǎn)信息,如附近餐館、咖啡廳、停車(chē)場(chǎng)、商貿中心或旅游景點(diǎn)等,系統借助語(yǔ)音識別技術(shù)識別用戶(hù)的需求,并按照距離用戶(hù)當前位置的遠近,搜索到滿(mǎn)足要求的定點(diǎn)信息詳細情況,并通過(guò)語(yǔ)音合成系統將相關(guān)信息播報給用戶(hù)。
有些用戶(hù),特別是經(jīng)常往返于固定線(xiàn)路的用戶(hù),可以在指定時(shí)間定制交通堵塞、交通事故、新建道路、道路施工、氣候變化及停車(chē)位等信息,當車(chē)輛行駛至該路線(xiàn)時(shí)給予相關(guān)動(dòng)態(tài)交通信息的語(yǔ)音提示。當然,用戶(hù)也可以通過(guò)數據庫中心(或服務(wù)熱線(xiàn))查詢(xún)指定線(xiàn)路的交通狀態(tài)信息?;谡Z(yǔ)音識別技術(shù),數據庫中心(或服務(wù)熱線(xiàn))能自動(dòng)解答用戶(hù)所需要的實(shí)時(shí)交通信息,幫助用戶(hù)及時(shí)到達目的地。
智能語(yǔ)音控制技術(shù)發(fā)力智能電網(wǎng)
對于出租車(chē)、公共汽車(chē)、高級公路客運、長(cháng)距離貨運、物流配送等運輸車(chē)輛,管理部門(mén)可隨時(shí)對車(chē)輛進(jìn)行跟蹤和監控,并通過(guò)語(yǔ)音播報了解車(chē)輛的運行軌跡,加強對車(chē)輛的集中管理和調度,提高交通運輸效率,有效改善城市交通狀況。例如出租車(chē)管理部門(mén)可以監控出租車(chē)的行車(chē)路線(xiàn),并以語(yǔ)音播報形式反饋出租車(chē)司機附近位置的搭乘信息,如果遇到陌生路線(xiàn),司機可以通過(guò)與數據庫中心的網(wǎng)絡(luò )連接進(jìn)行語(yǔ)音交互查詢(xún),順利找到目的地的具體位置。
目前,lbs廣泛應用于各國的智能交通領(lǐng)域,在日本東京用來(lái)緩解市區交通壓力,在韓國用于檢測實(shí)時(shí)交通狀況以減輕高速公路的瓶頸,在歐洲用于道路管理系統等等。憑借智能語(yǔ)音技術(shù),lbs在管理交通事務(wù)、處理緊急事故、提高道路的通行能力和安全系數等應用領(lǐng)域都將起到至關(guān)重要的作用。
智能語(yǔ)音控制技術(shù)發(fā)力智能電網(wǎng)
智能語(yǔ)音控制技術(shù)在電力行業(yè)的廣泛應用,是智能電網(wǎng)發(fā)展的必然趨勢。在未來(lái)的物聯(lián)網(wǎng)時(shí)代,“說(shuō)出需求得到反饋”的互動(dòng)模式將進(jìn)一步延伸,所有的電器都將擁有“聽(tīng)”,甚至是“說(shuō)”的能力,語(yǔ)音控制將成為構建智慧城市的重要手段,人們美好的生活將再次“傳為佳話(huà)”。
“出發(fā)!對1號主變進(jìn)行巡檢。”一聲令下,一個(gè)身高1米多的巡線(xiàn)機器人自動(dòng)啟動(dòng),沿著(zhù)變電站內的小路,根據指令開(kāi)始工作。未來(lái)變電站智能巡檢機器人工作將出現這樣一個(gè)場(chǎng)景。在山東電科院電力機器人技術(shù)重點(diǎn)實(shí)驗室里,機器人語(yǔ)音交互實(shí)驗平臺項目已列入了研究規劃。
“語(yǔ)音控制功能不但能夠有效利用用戶(hù)個(gè)性化的語(yǔ)音,提高系統的識別準確率;而且能夠提高用戶(hù)輸入詞表的方便性和靈活性。”山東電科院首席專(zhuān)業(yè)工程師王濱海介紹,“隨著(zhù)指令發(fā)出者年齡的變化,還可以選擇合適的語(yǔ)音替換用戶(hù)原來(lái)的語(yǔ)音模型,使得語(yǔ)音智能平臺具備更強的適應性,識別效果不會(huì )隨著(zhù)時(shí)間變久而變差。”
除了應用在智能機器人開(kāi)發(fā)領(lǐng)域,在智能家居建設方面,語(yǔ)音控制技術(shù)也保持著(zhù)極高的熱度。有朝一日,用戶(hù)只需躺在沙發(fā)上,對家里的各種電器下達命令,電器就能自動(dòng)完成操作,隨著(zhù)物聯(lián)網(wǎng)的發(fā)展成熟,這種看似奇幻的情景正逐漸變?yōu)楝F實(shí)。
“智能語(yǔ)音控制技術(shù)在智能家居領(lǐng)域的廣泛應用,將實(shí)現一加一大于二的效果。”北京國電通網(wǎng)絡(luò )技術(shù)有限公司李天杰說(shuō):“在未來(lái),語(yǔ)音控制技術(shù)將是智能家居設計方案中的主要部分。語(yǔ)音控制技術(shù)的成熟將為物聯(lián)網(wǎng)的快速發(fā)展奠定基礎。”李天杰提及的物聯(lián)網(wǎng),其技術(shù)核心是智能感知、識別技術(shù)與普適計算、泛在網(wǎng)絡(luò )的融合,而語(yǔ)音控制技術(shù)正是智能感知和識別技術(shù)的重要組成部分。
“雖然,目前語(yǔ)音控制還只是限于一些基本的操作,還不能完全替代按鍵操作,但是語(yǔ)音控制與消費者實(shí)現了生動(dòng)有趣的交談,有針對性地提供服務(wù)和幫助,真正意義上拉近了電器與消費者的距離。”李天杰說(shuō)。
智能語(yǔ)音識別能否引領(lǐng)智能家居聲控潮
語(yǔ)音識別在移動(dòng)終端上的應用最為火熱,語(yǔ)音對話(huà)機器人、語(yǔ)音助手、互動(dòng)工具等層出不窮,許多互聯(lián)網(wǎng)公司紛紛投入人力、物力和財力展開(kāi)此方面的研究和應用。在我們周?chē)?,最熟悉的就是蘋(píng)果的siri系統,這是一個(gè)很炫的功能,但真正使用這個(gè)語(yǔ)音系統的用戶(hù),卻寥寥無(wú)幾。
雖說(shuō)聲控系統的存在著(zhù)固有問(wèn)題,但是該技術(shù)在智能化行業(yè)應用將對行業(yè)掀起一陣波瀾,但由于以下特點(diǎn)注定其不能應用于各系統的上位控制:操作容易出錯;完全性較低;識別率錯誤率可能性較高(對于需要高精度要求尤其如此)。但是其控制特性,如簡(jiǎn)便性、易用性、互動(dòng)性、娛樂(lè )性對于智能家居領(lǐng)域的應用卻再適合不過(guò)了。
首先,作為基于云計算和語(yǔ)音識別技術(shù)的智能家居系統將會(huì )為現有的智能家居系統提供更多操作控制方式。目前智能家居系統的控制方式有以下三種:面板控制、原裝觸摸屏、第三方面板控制(ipad、智能手機等)。如采用基于云計算和語(yǔ)音識別技術(shù)的智能家居系統不僅是增加一種操作方式,更是智能家居領(lǐng)域的革命。在人機交流界面上,直接以語(yǔ)音進(jìn)行操作也無(wú)需面板的存在,同時(shí)采用云計算本地無(wú)需計算能力。因此控制端可以設計成便于隨身攜帶的,如手表,掛耳式耳機等更加方便的控制端形式。
其次,通過(guò)語(yǔ)音直接人機語(yǔ)音對話(huà)代表了更好的用戶(hù)的體驗度。通過(guò)語(yǔ)音直接人機語(yǔ)音對話(huà)方式即對人類(lèi)語(yǔ)音的詞匯語(yǔ)法的分解,并將內容轉換為計算機可讀的輸入,例如按鍵、二進(jìn)制編碼或字符序列。思維是人腦的機能,是對外部現實(shí)的反映;語(yǔ)言則是現實(shí)思維、鞏固和傳達思維成果即思想的工具。語(yǔ)言是思維本身的要素,思想的生命表現的要素;語(yǔ)言是思維的工具,是思想的直接現實(shí)。語(yǔ)言是人類(lèi)最方便、也最能理解的命令方式,除非未來(lái)傳感器可以直接作用于人腦,否則很難出現更方便快捷的方式。
再次,自然語(yǔ)言回答代表未來(lái)智能化的產(chǎn)品的終極形式?;谠朴嬎愕牡淖匀换卮鸸δ芙Y合智能家居系統在功能和應用上更是可以開(kāi)拓無(wú)數,如簡(jiǎn)單的對其下語(yǔ)音命令,“開(kāi)燈”、“拉窗簾”等,更可以利用云計算功能對其命令甚至是普通語(yǔ)言進(jìn)行深度理解。如“問(wèn):天太熱了。答:空調再開(kāi)下去要低于舒適溫度了,你確定真的要調低?”又如“問(wèn):我要輛車(chē),15分鐘能過(guò)來(lái)。智能家居自動(dòng)撥號,并訂車(chē)。”
雖說(shuō)智能家居系統中也早已有廠(chǎng)家將語(yǔ)音控制引入其中,并吹噓這將是未來(lái)主流方向,但是鑒于目前存在著(zhù)種種辨析度底、環(huán)境干擾度等因素的影響,致使語(yǔ)音系統并未能真正進(jìn)入智能家居系統,而所謂的引領(lǐng)智能家居聲控潮流,還為時(shí)尚早!唯有技術(shù)不斷升級及產(chǎn)品的更新方能真正讓聲控技術(shù)進(jìn)入智能家居市場(chǎng)。
責任編輯: 江曉蓓