“提示詞是‘輕舟已過(guò)萬(wàn)重山’?!彪S著(zhù)指令落下,不到15秒,一幅山水景致躍然屏幕之上,李白筆下的詩(shī)意被精準展現。5月21日,國內首個(gè)基于國產(chǎn)算力預訓練的視覺(jué)基座大模型——“橘洲”V1端側版在長(cháng)沙正式上線(xiàn),其在“斷網(wǎng)”條件下上演驚艷首秀,標志著(zhù)我國在視覺(jué)大模型領(lǐng)域實(shí)現從“云端依賴(lài)”到“端側自主”的跨越,并以“輕量化、高精度、強隱私”的技術(shù)突破,鏈接文生圖片與千行百業(yè)。
當前,全球AI競賽已進(jìn)入“端側部署”新階段。視覺(jué)基座大模型作為視覺(jué)人工智能生成的基礎設施,存在推理成本高、數據隱私缺乏保障、帶寬和時(shí)延要求嚴苛等弊端,端側通用視覺(jué)大模型成為破局關(guān)鍵。
作為湖南省100個(gè)標志性數字新基建項目,“橘洲”由湖南匯視威智能科技有限公司(以下簡(jiǎn)稱(chēng)“匯視威”)依托中科曙光算力自主研發(fā),是基于國產(chǎn)算力預訓練的視覺(jué)基座大模型。區別于當前主流的視覺(jué)生成大模型,“橘洲”既可以在飛行模式下,實(shí)現智能手機端1024×1024分辨率圖像的秒級生成,也能滿(mǎn)足在移動(dòng)端上的部署和推理需求。大大節省算力成本的同時(shí),徹底打破創(chuàng )作場(chǎng)景的時(shí)空限制,為視覺(jué)大模型在B端市場(chǎng)的落地應用帶來(lái)無(wú)限前景。
“傳統視覺(jué)大模型因參數龐大、算力需求高,長(cháng)期受困于云端部署等三大桎梏?!眳R視威創(chuàng )始人顧善植介紹,面對這一行業(yè)痛點(diǎn),其團隊以“極限蒸餾”與“架構重構”技術(shù),將解碼模型參數量壓縮為國外主流開(kāi)源模型的1/20。在實(shí)現數據隱私安全的基礎上,在安卓和IOS端均能做到秒級生成圖片,確保用戶(hù)的個(gè)人創(chuàng )作不受時(shí)間和空間限制。同時(shí),“橘洲”還具備移動(dòng)端生成高分辨率圖像的能力,移動(dòng)端文生圖的效果可達到國內行業(yè)先進(jìn)水平。
目前,“橘洲”已經(jīng)構建超4000萬(wàn)張高質(zhì)量圖文數據集,融入獨特的中國文化元素庫,使生成圖像更貼合國人審美與場(chǎng)景需求。
顧善植表示,未來(lái)匯視威將逐步拓展至文生視頻、視頻理解等領(lǐng)域,構建“端云協(xié)同”的智能生態(tài)。
?。ㄎ?王晗)