斑馬智行率先進入車載智能助手時代,跳出“內卷”
你是否羨慕鋼鐵俠擁有Javis,一個具有獨立思考能力的智能AI,能管理和應付主人的一切問題。如果有這樣的智能助手,讓你的愛車秒變Javis,你是否會怦然心動呢?
在2021廣州車展上,斑馬智行基于AliOS打造的最新智能座艙系統(tǒng)——洛神智能座艙系統(tǒng)實現量產落地,并率先搭載于即將上市的全新榮威RX5 MAX與名爵MG ONE。在該系統(tǒng)中,斑馬智行語音在技術與產品層面再一次全面融合創(chuàng)新,即將為每個車主打造屬于他們的Javis。
作為業(yè)內首個將語音定義為車內第一交互方式的頭部玩家,斑馬智行在語音交互上不斷打怪升級,跳出原有桎梏,從指令式交互,到自然對話交互,再到自然對話2.0的升級,一直引領行業(yè)發(fā)展。而這一次,洛神智能座艙系統(tǒng)的出現更是意味著斑馬智行率先進入了智能語音助手時代。
車載語音作為智能汽車核心交互方式擁有巨大潛力,斑馬智行不僅在產品體驗上,更是從產業(yè)層面,積極推動傳統(tǒng)車載語音行業(yè)以及主機廠商的創(chuàng)新變革。這一次,斑馬智行智能語音助手的出現,又將在車載語音掀起怎樣的革新浪潮呢?帶著一系列問題,獵云網獨家采訪了斑馬智行語音產品負責人吳曉敏。
越來越智能的車載語音,成為主流交互方式
眾所周知,語音交互功能,已經成為智能網聯(lián)汽車的“標配”,一直是車聯(lián)網公司和主機廠發(fā)力的重點領域。
“互聯(lián)網女皇”瑪麗·米克爾在其每年發(fā)布的《互聯(lián)網趨勢報告》中,多次強調:語音是最有效的計算輸入形式,將成為人機交互的新范式。語音即計算界面,其應用的三大場景是家里、車里、隨手,更快更方便就是用戶價值所在。
而被視作“第三空間”的汽車場景,通過自然對話完成人車之間的主動交互,正在成為現實。
直至今日,車載語音交互市場正在呈現出多元化的發(fā)展趨勢,本地+云端、自然語言理解、多元化內容及服務生態(tài)都在持續(xù)快速升級。
高工智能汽車研究院監(jiān)測數據顯示,2020年國內新車(合資+自主品牌)前裝搭載語音識別及交互功能上險量為1206.4萬輛,同比增長17.88%。車載語音已成為汽車繼中控屏外的第二交互手段。
在前裝搭載率方面,去年語音識別及交互功能前裝標配搭載率從2019年的49.82%提升至63.25%。而今年1-6月,這個數字繼續(xù)提升至68.01%。據公開數據統(tǒng)計,2020年中國前裝車載語音市場(包含軟硬件)規(guī)模約為17億元人民幣,到2025年,市場規(guī)模將增長至30億元人民幣。
隨著我國自主汽車操作系統(tǒng)在智能汽車時代的“翻盤”,以低價標準化產品占據車載語音市場高份額的訊飛、Cerence開始面臨挑戰(zhàn)。不止BAT、華為等實力企業(yè),造車新勢力也開始對這個市場“虎視眈眈”。
手機語音助手、智能音箱的出現讓大家對車載語音交互的智能要求更上一層,而將這樣的能力應用到車內場景絕非易事,面臨著聲學、自然語言處理、數字信號處理等多個復雜學科,以及網絡問題的挑戰(zhàn)。
據《2021麥肯錫汽車消費者洞察》顯示,80%消費者重視智能汽車技術,超過半數愿意為智能功能買單。這意味著在智能汽車時代,得“智能”者得天下,而其背后則是AI與算法的深度較量。
研發(fā)無設限,斑馬智行引領車載語音創(chuàng)新變革
歷經十年發(fā)展,斑馬智行自研AliOS,經過市場檢驗,在技術、體驗、效率方面實現“三大領先”。依托AliOS,斑馬智行以“智能車機-智能座艙-智能汽車”為戰(zhàn)略著力點,確立了從智能車載操作系統(tǒng)向智能座艙操作系統(tǒng)、整車智能操作系統(tǒng)演進的“OS三部曲”戰(zhàn)略。
而交互智能作為斑馬智行聚焦用戶體驗的三大方向之一,更是可以用“投入無上限”來形容。
事實上,在2016年之前,市面上所謂的語音交互都處于指令式交互的初始階段。汽車只懂產品經理寫的指令,所有的交互邏輯固化。用戶與汽車對話,需要遵循著一定的指令,不能在超出范圍之外發(fā)揮。
困于技術的限制,大量的車沒有配備語音交互的功能,即使配置了,用戶也不會去使用。車載語音市場被科大訊飛、Cerence兩大語音技術廠商瓜分大量份額,主機廠商把車載語音作為賣車的手段,用小成本購買標準化產品,而無視用戶體驗。
數據顯示,指令式交互系統(tǒng)的DAU基本上在10%以下,“不好用”、“雞肋”、“傻”幾乎成為車載語音的代名詞。
2016年,斑馬智行首次將自然對話技術引入到車內場景,給主機廠商和用戶帶來了全新的體驗:原來還可以用“你好,斑馬,我想看星星”這樣的對話來讓汽車自動打開天窗,更是開辟了行業(yè)的先河。榮威RX5語音開啟關閉天窗、調節(jié)空調溫度、播放音樂、開啟導航、語音搜索、天氣查詢成為驚艷亮點。
在開放合作、系統(tǒng)打通的背景下,斑馬智行在創(chuàng)新上事半功倍,于業(yè)內率先完成全場景全雙工全閉環(huán)的自然對話2.0產品。
斑馬智行語音產品負責人吳曉敏表示,與第一代自然對話系統(tǒng)不同,維納斯(VENUS)智能系統(tǒng)全場景語音實現了車內絕大部分功能都能通過自然對話去觸達;全雙工更是打破用戶與車的交互輪回,通過技術分解,在流式理解、語義拒識、語義打斷等核心能力的加持下,能夠實現用戶與車更自然的對話;全閉環(huán)則是針對斑馬智行的服務內容,用語音做到完全的閉環(huán),在車內甚至可以用語音完成電影票、咖啡的購買、支付和送達。
如果說斑馬的“語音開天窗”是打開了車載語音自然對話1.0時代的序幕,那么其在2020年推出的全場景、全雙工、全閉環(huán)的維納斯(VENUS)智能系統(tǒng)則是徹底吹響了車載語音交互方式變革的號角,語音的發(fā)展進入自然對話2.0時代。
在斑馬智行的先行后,全雙工、連續(xù)對話等技術,開始跑步進入車載市場。小鵬、理想、蔚來等新勢力廠商也將其作為新一代語音產品的研發(fā)理念。
而這也意味著各路玩家在產品和技術之間的邊界開始模糊,產品理念、用戶體驗逐漸趨同,市場在車載語音百花齊放的熱潮下,呈現階段性“內卷”的競爭態(tài)勢,產品和技術的發(fā)展陷入了停滯。
達摩院人工智能引擎驅動,小跟斑定義車載語音助手新時代
在汽車智能化演進的過程中,語音逐漸成為車內的第一交互方式,語音交互體驗的良好與否很大程度上決定了座艙整體交互感受,而搭載AliOS的智能座艙是斑馬智行的核心基座,其能力高度決定了智能助手發(fā)展的上限。
吳曉敏坦言,頭部廠商在自然對話交互上已不分伯仲,也都在陸續(xù)往智能助手的方向演進。然而廠商們所謂的智能助手卻仍在自然對話交互2.0的階段,淺層次的創(chuàng)新對行業(yè)發(fā)展推動作用微乎其微,儼然成為了一個“偽命題”。
對于斑馬智行而言,融合創(chuàng)新一直是其車載語音升級的關鍵詞。一方面,用戶跟車、系統(tǒng)進行融合;另一方面,語音引擎跟其他模塊融合。最后,設計出一個好的交互方式,來讓用戶覺得這是一個非常智能和友善的系統(tǒng)。
與傳統(tǒng)車廠、新勢力不同,斑馬智行在車載語音方面一直有“先天優(yōu)勢”,那就是可以基于天貓精靈和達摩院的能力,作為阿里車業(yè)務的重要輸出口,去進行車載場景的創(chuàng)新。
通過與天貓精靈的合作,斑馬智行實現了車和家居場景的打通,可以在車內完成天貓精靈的設備控制,甚至也可以在家通過天貓精靈去查看車輛的狀態(tài)。
二者相似場景和通用技能、數據的打通,讓天貓精靈3億級別的IoT設備互聯(lián)能力、自然豐富的語音交互系統(tǒng)也可以通過斑馬智行完成車業(yè)務的能力輸出。
而在國際大賽上屢次上榜的阿里達摩院語音技術,更是讓斑馬智行插上了阿里集團強大AI能力的翅膀,通過共同打造涵蓋聲學硬件和結構設計、前端信號處理(語音增強和分離)、VW(語音喚醒)、ASR(語音識別)、VPR(聲紋識別)、NLU(自然語音理解)、DM(對話管理)、NLG(自然語言生成)、TTS(語音合成)等在內的語音全鏈路引擎,為其語音交互提供強大的智能后盾,去做面向車場景的技術創(chuàng)新和落地。
為此,斑馬智行和達摩院一直在探索其語音助手的內涵,那就是不能讓所有的交互基于產品經理的定義,不讓用戶感覺到這只是一個替代他去操作的交互系統(tǒng),而是更像一個能理解用戶、具有一定認知力的智能體。
而這樣的智能助手,在斑馬智行看來第一步一定是要會“成長”,而這個成長必須讓用戶能感知。
“如果將AliOS智能座艙操作系統(tǒng)比作大腦,那么智能助手就是大腦里面裝的具體知識,只有在容量足夠大的時候,才能夠把足夠的知識、邏輯給塞進去;但只是大腦的容量足夠大還不行,唯有不斷學習才可以做大規(guī)模的創(chuàng)新?!?
吳曉敏表示,第二代自然交互系統(tǒng)的核心問題在于“用戶會認為一次講過,但下次仍無法明白其意圖”的系統(tǒng)“傻”,而通過自學習系統(tǒng),則可以讓智能助手的能力以指數級成長。
而這個“通過一定時間就可以明白上一次用戶所指示的功能和技能,并把學會的內容分享給其他用戶使用”的智能語音助手雖然領先行業(yè)半步,卻把一個能自我成長的鮮活產品呈現在用戶面前。在吳曉敏看來,這個半步的創(chuàng)新優(yōu)勢將為用戶提供完全不同的體感。
“屆時,斑馬語音助手基于AliOS的融合創(chuàng)新,就能夠把基座的能力發(fā)揮出來,通過用戶感知的渠道——語音,變成用戶可感知的產品能力?!?
為了滿足這一個“成長”的需求,斑馬智行在全新系統(tǒng)中首創(chuàng)養(yǎng)成式語音助理“小跟斑”?;凇斑_摩院”人工智能學習平臺提供的“達摩引擎”打造,集語音識別、合成、語義理解等技術于一身,并融入天貓精靈強大的語音交互能力、AI服務能力和生態(tài)資源,實現系統(tǒng)級語音能力實時迭代成長,讓語音助理真正做到“聽得懂、學得快、會得多”。
不僅如此,小跟斑在車載語音交互系統(tǒng)上的升級還體現在:
1.可以隨時交互,主駕不再需要喚醒斑馬;
2.多模態(tài)超強語義拒識:融合語音、視覺、車身感知等模態(tài),重新定義了拒識能力,性能是單模態(tài)語義拒識的10倍,無效語句直接過濾,結果也不會顯示在屏幕上;
3.多音區(qū)全場景交互。
吳曉敏認為,在智能助手發(fā)展的早期階段,斑馬智行開發(fā)“可成長”的智能能力只是一個開端,后面還會陸續(xù)進化出更多的能力,讓智能助手的產品能夠給用戶帶來更多智能的體驗。
據了解,小跟斑的成長可分成兩個部分,會針對用戶的個性化表達僅對單個用戶生效;也會將用戶都在問的共性問題作為通用知識放入大系統(tǒng)內,供所有用戶使用。
“斑馬智行通過跟達摩院合作車載語音交互的技術,深度打造一個能夠自學習、會用戶語言的系統(tǒng)。達摩院的核心算法,加上斑馬智行在車業(yè)務上的創(chuàng)新,可以構建整個學習閉環(huán),進行有效分工?!?
吳曉敏認為,在這樣的分工下面,讓整個研發(fā)效能得到了極大提升,而這也成為了斑馬智行不斷創(chuàng)新探索的原動力。
小跟斑的面世意味著車載語音的進一步發(fā)展方向,未來車載語音智能助手會迎來發(fā)展井噴時代,而自然對話交互2.0的系統(tǒng)則會像指令式交互一樣,被市場和用戶慢慢淘汰。
“智能座艙仍處于早期發(fā)展階段,很多廠商仍未有實力去達成這樣的基座,而這也成為了斑馬智行的機會。我們將以天瀑AI平臺開放所有的能力,去跟更多還處在追趕階段的廠商,去開發(fā)出屬于他們自己的智能助手系統(tǒng)?!?
吳曉敏透露,未來,除了洛神系統(tǒng)外,斑馬智行還會慢慢把這樣的一些能力開放更多的系統(tǒng)版本里面,同時也在開發(fā)下一代的版本小跟斑智能助手2.0。
未來十年,斑馬智行將賦能車企邁入語音交互的新智能時代。
猜你喜歡
斑馬智行的OS崛起之路,再融30億
“一件事情干十年,總是有它對的地方?;钍瓴蝗菀?。”斑馬智行聯(lián)席CEO張春暉感慨道。