2月18日,階躍星辰和吉利汽車集團(tuán)聯(lián)合宣布:將雙方合作研發(fā)的兩款階躍 Step 系列多模態(tài)大模型向全球開發(fā)者開源。其中,包含目前全球范圍內(nèi)參數(shù)量最大、性能最好的開源視頻生成模型階躍Step-Video-T2V,以及行業(yè)內(nèi)首款產(chǎn)品級(jí)開源語音交互大模型階躍Step-Audio。兩款階躍Step系列多模態(tài)大模型的開源,為開源世界帶來了行業(yè)最強(qiáng)的多模態(tài)大模型能力,將顯著促進(jìn)大模型技術(shù)的共享與創(chuàng)新,推動(dòng)人工智能的普惠發(fā)展,為全球數(shù)字經(jīng)濟(jì)發(fā)展貢獻(xiàn)吉利方案與中國力量。
階躍星辰是吉利汽車集團(tuán)的科技生態(tài)戰(zhàn)略合作伙伴,擁有國際頂尖的算法團(tuán)隊(duì)。2023年開始,吉利便與階躍星辰在預(yù)訓(xùn)練大模型、垂直領(lǐng)域大模型、應(yīng)用場景設(shè)計(jì)、工程開發(fā)等方面展開了深度合作。其中,吉利牽頭了場景設(shè)計(jì)、模型測評(píng)、工程開發(fā)等業(yè)務(wù),階躍星辰主導(dǎo)了模型預(yù)訓(xùn)練等業(yè)務(wù),雙方優(yōu)勢互補(bǔ),顯著增強(qiáng)了兩款階躍Step系列多模態(tài)大模型的性能表現(xiàn)。
階躍Step-Video-T2V大模型參數(shù)量達(dá)到300 億,可以直接生成 204 幀、540P 分辨率的高質(zhì)量視頻,是當(dāng)前全球范圍內(nèi)參數(shù)量最大、性能最好的開源視頻生成大模型。階躍Step-Audio大模型能夠根據(jù)不同的場景需求,生成情緒、方言、語種、歌聲和個(gè)性化風(fēng)格的表達(dá),能和用戶自然地高質(zhì)量對(duì)話,是行業(yè)內(nèi)首個(gè)產(chǎn)品級(jí)的開源語音交互模型。
作為中國汽車全球領(lǐng)跑者,吉利致力于成為智能汽車AI科技的引領(lǐng)者和普及者。早在2021年,吉利就圍繞芯片、軟件操作系統(tǒng)、數(shù)據(jù)和衛(wèi)星網(wǎng)搭建了端到端的自研體系和生態(tài)聯(lián)盟,構(gòu)建了完善的“智能吉利科技生態(tài)網(wǎng)”,驅(qū)動(dòng)用戶在智能駕駛、智能座艙上的體驗(yàn)不斷進(jìn)化。2022年,吉利建成了全球車企首個(gè)“云、數(shù)、智”一體化的星睿智算中心。2023年,吉利發(fā)布了全球首個(gè)汽車行業(yè)全棧自研全場景AI大模型——星睿AI大模型,并獲得了中國通信院“4+級(jí)”行業(yè)最高評(píng)級(jí)。2025年,吉利發(fā)布了行業(yè)首個(gè)“智能汽車全域AI”技術(shù)體系。
在全球最強(qiáng)開源的階躍Step系列視頻生成大模型、語音交互大模型,以及汽車行業(yè)全場景大模型的綜合賦能下,吉利將在行車安全、緊急避險(xiǎn)、智慧泊車等全場景為用戶帶來自動(dòng)駕駛程度更高、更安全的高階智駕體驗(yàn),同時(shí)打造更加智能的汽車情感座艙,重新定義人車交互體驗(yàn),推動(dòng)AI科技在智能汽車領(lǐng)域的普及應(yīng)用。
吉利星睿AI大模型中的AI Drive大模型,具備強(qiáng)大場景生成與規(guī)劃能力,能夠根據(jù)雨雪等不同天氣光照條件、道路結(jié)構(gòu)、擁堵路況、立體車庫和不常見的交通目標(biāo),構(gòu)建出真實(shí)駕駛中難得一遇的極端駕駛場景?;谡鎸?shí)的駕駛視頻數(shù)據(jù)去優(yōu)化階躍Step-Video-T2V,可以將它變成一個(gè)自動(dòng)駕駛數(shù)據(jù)合成器。星睿AI大模型正在探索將這些豐富的合成場景轉(zhuǎn)換成“以假亂真”的訓(xùn)練數(shù)據(jù),相當(dāng)于自動(dòng)駕駛系統(tǒng)打造了一個(gè)豐富的"虛擬駕考考場",從而顯著提升車輛在智駕行駛時(shí)面對(duì)各種路況的應(yīng)變能力,保障行車安全。
在階躍Step-Audio大模型超強(qiáng)交互功能賦能下,吉利星睿AI大模型可以大幅提升語音指令響應(yīng)速度,以及交互過程的情感理解與表達(dá)能力。當(dāng)用戶說“導(dǎo)航,快遲到了”的時(shí)候,系統(tǒng)不僅會(huì)自動(dòng)規(guī)劃更快路線,還會(huì)主動(dòng)詢問是否需要播放輕音樂緩解情緒。同時(shí),系統(tǒng)不僅可識(shí)別粵語、四川話等豐富的方言,還支持個(gè)性化聲音定制,用戶既可以選擇系統(tǒng)提供的人聲音色,也能錄制孩子的笑聲制作專屬提示音,甚至讓車載AI模仿山澗流水聲營造車內(nèi)冥想空間,溫情陪伴每一次出行。
除此之外,吉利也是首家與DeepSeek完成深度融合的車企。通過攜手DeepSeek-R1模型,吉利將對(duì)星睿車控FunctionCall大模型、汽車主動(dòng)交互端側(cè)大模型等進(jìn)行蒸餾訓(xùn)練。屆時(shí),吉利智能汽車AI不僅能對(duì)用戶的模糊意圖實(shí)現(xiàn)精準(zhǔn)理解,進(jìn)而準(zhǔn)確調(diào)用約2000個(gè)車載接口,還能基于車內(nèi)外場景主動(dòng)分析用戶潛在需求,并為用戶主動(dòng)提供車輛控制、主動(dòng)對(duì)話、售后等服務(wù),智能交互體驗(yàn)將大幅提升,加速AI在智能汽車領(lǐng)域普及。
目前,基于“智能汽車全域AI”技術(shù)體系打造的AI銀河精靈、Flyme Auto 智能座艙、無界空間、AI云動(dòng)力、AI繪本、AI哨兵等一系列AI應(yīng)用,已在銀河E8、銀河E5、銀河星艦7EM-i等車型上搭載。今年3月初,吉利還將對(duì)外發(fā)布重磅AI智能化戰(zhàn)略,加速推動(dòng)AI數(shù)字底盤、高階智能駕駛等最新AI技術(shù)的逐步上車,為用戶帶來顛覆性的智能化體驗(yàn)。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。