新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)記者1月10日獲悉,商湯絕影與國內(nèi)知名車企聯(lián)手打造的行業(yè)首個(gè)原生流式多模態(tài)座艙產(chǎn)品已經(jīng)量產(chǎn)上車,并向用戶進(jìn)行OTA(在線升級(jí))推送。


兩個(gè)月前,商湯絕影首發(fā)了AI汽車創(chuàng)新產(chǎn)品“A New Member For U(你的家庭新成員)”,通過AI能力,該產(chǎn)品能夠“察言觀色”,例如會(huì)在注意到后排孩子睡覺時(shí)升高空調(diào)溫度,降低音樂聲量,調(diào)整駕駛模式為舒適等,原生流式多模態(tài)大模型是其能力核心所在。


如今,隨著多模態(tài)艙外識(shí)別功能量產(chǎn)上車,它已經(jīng)開始認(rèn)識(shí)并且理解世界。據(jù)了解,目前其已經(jīng)具備前車識(shí)別、交通標(biāo)志識(shí)別、沿途風(fēng)光識(shí)別三項(xiàng)基于AI的能力。


例如,前面如果有三輛車,左中右分別為紅黃藍(lán),如果問“藍(lán)色車輛是什么車”,傳統(tǒng)模型可能依舊會(huì)識(shí)別中間黃車,而原生流式大模型能精準(zhǔn)識(shí)別右前方的藍(lán)色車輛,甚至是偽裝車、無車標(biāo)等特殊外觀,通過尾燈、外形、構(gòu)造等品牌特點(diǎn)也可以識(shí)別。


識(shí)別前方藍(lán)色汽車 官方供圖


此外,其還能夠進(jìn)行車輛行駛途中的建筑物和景點(diǎn)的識(shí)別,并在此基礎(chǔ)上提供圖文介紹,詳細(xì)講解景點(diǎn)和建筑,相關(guān)的歷史典故、趣聞逸事等。


商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示,原生流式多模態(tài)大模型是讓文字、語音、視頻等模態(tài)一同輸入,模型統(tǒng)一處理后輸出相應(yīng)模態(tài)的信息。


“原生流式多模態(tài)是一種非常自然且新穎的交互方式,將會(huì)成為一個(gè)全新的直接接觸用戶的超級(jí)入口,而智能汽車是這個(gè)超級(jí)入口的最佳落地場(chǎng)景。依靠智能汽車內(nèi)外各種常開的攝像頭,用戶可以實(shí)時(shí)跟汽車通過多模態(tài)的方式進(jìn)行交互。同時(shí),智能汽車的保有量不斷增加,能夠產(chǎn)生豐富的終端用戶反饋和數(shù)據(jù)信息,讓模型不斷迭代成長?!蓖鯐詣傉f。


校對(duì) 盧茜