騰訊于5月14日宣布將混元文生圖大模型升級(jí)并公之于眾,已發(fā)布至Hugging Face以及Github之上,包括模型權(quán)重、推理代碼、模型算法等全方位數(shù)據(jù),均向企業(yè)與個(gè)人開(kāi)發(fā)者提供免費(fèi)商業(yè)使用權(quán)限。
升級(jí)版混元文生圖大模型采取了與Sora相同的DiT架構(gòu)設(shè)計(jì)。騰訊強(qiáng)調(diào),這是全球首個(gè)中英雙語(yǔ)DiT架構(gòu)。
基于Diffusion Transformer的混元DiT是一種文本到圖像生成模塊,具備中英細(xì)粒度理解能力,能與用戶進(jìn)行多輪對(duì)話,根據(jù)上下文生成并完善圖像。
此外,它還是業(yè)界首個(gè)中文原生DiT架構(gòu)文生圖開(kāi)源模型,支持中英文雙語(yǔ)輸入及理解,參數(shù)規(guī)模高達(dá)15億。
運(yùn)行該模型需配備支持CUDA的NVIDIA GPU,單次運(yùn)行混元DiT所需最低顯存為11GB;若要同時(shí)運(yùn)行DialogGen(騰訊推出的文本轉(zhuǎn)圖像多模態(tài)交互式對(duì)話系統(tǒng))和混元DiT,則至少需32GB顯存。騰訊表示,他們已在Linux環(huán)境下對(duì)NVIDIA的V100和A100 GPU進(jìn)行過(guò)測(cè)試。
國(guó)內(nèi)首次官方“大模型標(biāo)準(zhǔn)符合性評(píng)測(cè)”結(jié)果出爐,騰訊混元大模型成功入選首批通過(guò)評(píng)測(cè)的國(guó)產(chǎn)大模型行列,其他通過(guò)評(píng)測(cè)的大模型還包括阿里通義千問(wèn)、360智腦和百度文心一言。
-
算法
+關(guān)注
關(guān)注
23文章
4784瀏覽量
98060 -
圖像
+關(guān)注
關(guān)注
2文章
1096瀏覽量
42330 -
大模型
+關(guān)注
關(guān)注
2文章
3650瀏覽量
5185
發(fā)布評(píng)論請(qǐng)先 登錄
眾智FlagOS適配面壁智能開(kāi)源全模態(tài)大模型MiniCPM-o 4.5
百度正式發(fā)布并開(kāi)源新一代文檔解析模型PaddleOCR-VL-1.5
今日看點(diǎn):小米正式發(fā)布并開(kāi)源新模型 MiMo-V2-Flash;磷酸鐵鋰開(kāi)啟漲價(jià)潮
商湯科技正式發(fā)布并開(kāi)源全新多模態(tài)模型架構(gòu)NEO
今日看點(diǎn):象帝先推出首款量產(chǎn)Imagination DXD GPU顯卡;小米汽車(chē)?yán)塾?jì)交付突破 50 萬(wàn)臺(tái)
openDACS 2025 開(kāi)源EDA與芯片賽項(xiàng) 賽題七:基于大模型的生成式原理圖設(shè)計(jì)
大規(guī)模專(zhuān)家并行模型在TensorRT-LLM的設(shè)計(jì)
米爾RK3576部署端側(cè)多模態(tài)多輪對(duì)話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM
華為宣布開(kāi)源盤(pán)古7B稠密和72B混合專(zhuān)家模型
華為正式開(kāi)源盤(pán)古7B稠密和72B混合專(zhuān)家模型
華為助力中國(guó)石油發(fā)布3000億參數(shù)昆侖大模型
上新:小米首個(gè)推理大模型開(kāi)源 馬斯克:下周推出Grok 3.5
NVIDIA發(fā)布全球首個(gè)開(kāi)源人形機(jī)器人基礎(chǔ)模型Isaac GR00T N1
英偉達(dá)GROOT N1 全球首個(gè)開(kāi)源人形機(jī)器人基礎(chǔ)模型
NVIDIA 發(fā)布全球首個(gè)開(kāi)源人形機(jī)器人基礎(chǔ)模型 Isaac GR00T N1——并推出加速機(jī)器人開(kāi)發(fā)的仿真框架
微信大模型擴(kuò)容并開(kāi)源,推出首個(gè)中英雙語(yǔ)文生圖模型,參數(shù)規(guī)模達(dá)15億
評(píng)論