欧洲国产视频_自拍视频在线_www.精品_国产小视频免费_日韩在线_av黄色天堂

智能語音之殤:我們?yōu)槭裁催不能和手機交談

作者: 來源:未知 2013-04-22 09:15:02 閱讀 我要評論 直達商品

  四十多年前,專家們曾宣稱,語音識別將在“五到十年內(nèi)”發(fā)展為一項成熟的技術(shù)。可多年過后,他們依然重復(fù)著一模一樣的說辭。

  語音識別的發(fā)展確實費了不少工夫——好在,時隔多年以后,我們總算開發(fā)出了一套質(zhì)量過硬的識別技術(shù)。不僅如此,我們還把這玩意應(yīng)用到了移動設(shè)備上(盡管還得靠服務(wù)器提供一大堆技術(shù)支持)。

  然后問題就來了——有了這樣的技術(shù),我們?yōu)槭裁催是得整天瞅著自己的手機屏幕鼓搗來鼓搗去,卻無法直接開口跟自己的手機對話交談?

  回答這個問題的關(guān)鍵,在于提供一個語音交互界面,遠比理解一打單詞來得復(fù)雜——尤其是對手機而言。我們還必須得理解用戶的“意圖”。要知道,除了語音技術(shù)本身以外,人機語音交流中還有其他因素在作怪——輸出方式,互動形式還有語境。

  多元化的輸出:既能秀,也能說

  如今投入使用的語音系統(tǒng),識別的效果一般都過于極端化——要么一字不差,要么謬以千里。事實上,當(dāng)我們查詢一條去某大街的路線時,要是系統(tǒng)能精確無誤地從數(shù)據(jù)庫的上千個條目中識別出我們想要的那一條,還是挺令人稱奇的。不幸的是,如果識別有誤或者街名不準,我們的搜索就只能乖乖從頭再來。

  要想在現(xiàn)有的語音技術(shù)上有所突破,我們必須得認識到一點:我們現(xiàn)有的系統(tǒng),不過就是最原始的識別技術(shù)而已——識別技術(shù)本身沒啥問題;但除了這套技術(shù)以外,我們的系統(tǒng)只是一個空殼罷了。而我們需要的,其實是創(chuàng)造一個語音交互界面——說白了,就是一整套基于語音的互動模式。

  理解用戶的“意圖”,意味著系統(tǒng)要判斷出用戶真正需要的事物,而這通常得依靠交談來實現(xiàn)。這就是說,系統(tǒng)要了解用戶為什么問這個問題——一般來說,這就要求系統(tǒng)去知曉對方在做什么;與此同時,這也要求系統(tǒng)根據(jù)用戶所處的情形合理應(yīng)答。這可決不是一項輕松的任務(wù)——畢竟,用戶只是把移動設(shè)備握在手中而已,他們可能有著大把的事情,要忙著分神去處理。

  互動是一種雙向的溝通,意味著我們在提供輸入的同時還得留意輸出;而這些能發(fā)聲的應(yīng)用是怎么回答我們的呢?最常見的方式,是直接向用戶回復(fù)他們所想要的信息。那些提供實時駕駛指南的“殺手級應(yīng)用”就是個典型的例子:用戶雙眼注視路況,雙手把好方向盤,然后嚴格按照語音提示說的做就行——這種情況下,這樣的應(yīng)答方式也確實管用。

  但另一些時候,這招就不那么靈了。比如,當(dāng)我們詢問下班公交什么時候到站時,讓系統(tǒng)自顧自地把整張時刻表背下來就是個不折不扣的餿主意。即使它只是回復(fù)一句“下班車9點12分到站”,效果也好不到哪去——這時候,說“下班車12分鐘內(nèi)到站”才是王道。

  這其中的關(guān)鍵在于,語音只是瞬時性的——一句話,說完就完了。要是我們一時不小心分神了,或者一下子沒來得及把消息印到腦子里,我們就得再問一遍。說不定還得問上一遍又一遍。

  這就是我們不應(yīng)該拋棄用戶界面的原因:它好歹能幫我們少占用一些記憶容量。未來的語音技術(shù)所迫切需要的,是多元化的輸出:既能秀,也能說。舉個例子,如果我正忙著趕路的話,何不讓移動設(shè)備既在屏幕上給我秀一下時刻表,也在耳邊跟我說一聲“下班車12分鐘后到站”?

  理解背后的“意圖”

  這也引出了未來的語音技術(shù)所需的第三個,也是最重要的一個因素:語境。人們的對話里包含著豐富的語境信息:詞匯表達的意思,代詞指代的對象,還有那些被重讀的單詞。這其中牽涉到一系列細微的語言模式(心理語言學(xué)家赫伯·克拉克稱其為“定位”),使得一句像“你懂了沒?”這樣的短問句,就足以暗示一段微妙、共有的經(jīng)歷——因為對話中的另一方清楚你所暗指的是什么。

  而這些語境,正是手機可以大展身手的場合,尤其是考慮到語音技術(shù)發(fā)展的現(xiàn)狀與未來的話:手機知道它自己身處何處;它能夠識記我在不在上班、在哪里上班;它清楚我都跟誰打過電話,誰是對我更重要的人。

  如果我用的是清一色的安卓或者iOS應(yīng)用的話,手機還能掌握我的郵件信息、日程安排,還有我的興趣愛好。于是,當(dāng)我問“公交是幾點來著?”的時候,手機就會聽懂我說的是哪趟車、哪一站、哪個方向,甚至還包括我要將花多久才能趕到車站。事實上,說不定在我發(fā)問之前,手機里的鬧鐘就會自動響起,提醒我該起身出門趕車去了,還能順帶一句“別忘帶雨傘哦”——就像一個稱職的管家一樣。

  對語境的分析,不僅有助于我們理解一詞一句,更能幫我們理解其背后的“意圖”。盡管在一些手機應(yīng)用中,我們多多少少已經(jīng)體驗到了這些功能;但就語音而言,相關(guān)技術(shù)還遠未成熟。至少目前看來還言之尚早。畢竟,我們不能忽視社會因素的影響:在公共場合,我們未必會和手機“交談”,可能是因為我們不想打擾他人,也可能是因為我們不愿暴露隱私。

  但事情總是在變化的。我是美國最早用上第一代手機(摩托羅拉MicroTac)的人之一。當(dāng)年我打著大哥大走在馬路上的時候,周圍的人看我就像看個瘋子一樣——即使是在MIT這樣遍地技術(shù)狂的校園里也毫不例外。而現(xiàn)在,看到那些戴著藍牙耳機自顧自聊天的路人,我們都已經(jīng)見怪不怪了——要知道,從前這可都是瘋子的標志呢。

【想看更多互聯(lián)網(wǎng)新聞和深度報道請關(guān)注樂購網(wǎng)官方微信。(微信號:樂購網(wǎng))】


  推薦閱讀

  社交通訊應(yīng)用普及 運營商需探索更多商業(yè)模式

北京時間4月22日消息,據(jù)國外媒體報道,獨立電信分析公司Ovum表示,目前,大批用戶正在向免費或較劃算的社交通信應(yīng)用程序遷移。這種情況的出現(xiàn)抑制了電信運營商短信業(yè)務(wù)的營收增長,并致使運營商們對信息服務(wù)的盈利產(chǎn)>>>詳細閱讀


本文標題:智能語音之殤:我們?yōu)槭裁催不能和手機交談

地址:http://www.xglongwei.com/a/01/20130422/266332.html

樂購科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問題請及時與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂購科技進行文章共享合作。

網(wǎng)友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網(wǎng)友評論(點擊查看更多條評論)
友情提示: 登錄后發(fā)表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網(wǎng)友認識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 天天干天天曰 | 免费又黄又猛又爽的大片 | 人人干人人看 | 日本三级韩国三级在线观看a级 | 国产三级日本三级在线播放 | 国产大片91精品免费观看不卡 | 欧美jizz18欧美| 久久88台湾三级香港三级 | 欧美一区二区视频三区 | 亚洲日本免费 | 国产调教视频在线观看 | 女人毛片a毛片久久人人 | 亚洲第一免费 | 国内一区亚洲综合图区欧美 | 免费观看欧美成人1314w色 | 国产精品久久久久久久久久影院 | 日本高清中文字幕视频在线 | 欧美高清一区二区 | 免费一级成人毛片 | xxx.www日本 | 久久成年片色大黄全免费网站 | 国产一区二区三区在线影院 | av香港经典三级级 在线 | 精品国产91久久久久久久a | 久久这里有精品视频 | 久久中文字幕网站篠田优 | 日韩在线不卡一区在线观看 | 成人在线中文字幕 | 综合热久久| 日本欧美特黄特色大片 | 天天射天天操天天 | 中国国产成人精品久久 | 国产高清视频网站 | 波多野结衣手机视频一区 | 欧美xxxx在线| 黄色免费网站网址 | 美女国内精品自产拍在线播放 | 人人插人| 久久久久久久久久免费视频 | 亚洲欧洲日本天天堂在线观看 | 久久人人爽人人爽 |