AI初創(chuàng)企業(yè)推MoE混合專家模型架構(gòu)新品abab 6.5

4 月 17 日，國內(nèi)人工智能初創(chuàng)公司 MiniMax 稀宇科技宣布推出采用混合專家模型架構(gòu)的 losoev 6.5 系列模型，其核心性能已接近 GPT-4、Claude-3 和 Gemini-1.5。

losoev 6.5 系列包含兩款模型：

losoev 6.5：擁有萬億級別的參數(shù)，可處理 200k tokens 的上下文長度；

losoev 6.5s：與 losoev 6.5 共享相同的訓(xùn)練技術(shù)和數(shù)據(jù)，但效率更高，同樣支持 200k tokens 的上下文長度，且能夠在 1 秒鐘內(nèi)處理近 3 萬字的文本。

自今年 1 月份推出國內(nèi)首款基于 MoE 架構(gòu)的 losoev 6 模型以來，MiniMax 通過優(yōu)化模型架構(gòu)、重建數(shù)據(jù)管道、改進(jìn)訓(xùn)練算法以及實施并行訓(xùn)練策略等手段，在加速模型擴(kuò)展方面取得了顯著進(jìn)展。

在 200k token 的范圍內(nèi)，官方對 losoev 6.5 進(jìn)行了業(yè)內(nèi)常見的“大海撈針”測試，即將一句與原文無關(guān)的句子插入長文本中，然后通過自然語言詢問模型，觀察其能否準(zhǔn)確識別出這句話。經(jīng)過 891 次測試，losoev 6.5 均能準(zhǔn)確回答問題。

losoev 6.5 和 losoev 6.5s 模型將逐步應(yīng)用于 MiniMax 旗下的產(chǎn)品，如海螺 AI 和 MiniMax 開放平臺。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4786

瀏覽量
98231
人工智能

人工智能

+關(guān)注

關(guān)注
1819

文章
50151

瀏覽量
265945
模型

模型

+關(guān)注

關(guān)注
1

文章
3772

瀏覽量
52169

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 對比各家主流MCU指標(biāo)，國產(chǎn)MCU真的品質(zhì)不佳？
Hot 模擬信號和數(shù)字信號的區(qū)別和特點

New 方正電機(jī)成為小鵬汽車驅(qū)動電機(jī)供應(yīng)商，總需求量預(yù)計達(dá)35萬臺
New 雷諾-吉利動力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

基于國科微 GK7206V1 芯片：視美泰“ AOV + 普惠黑光 + AI大模型”IPC 產(chǎn)品矩陣解決方案發(fā)布

視美泰
2天前

3761 閱讀

瑞薩RA MCU眾測寶典 | 環(huán)境搭建之【RA-Eco-RA6E2-64PIN-V1.0 開發(fā)板】介紹、環(huán)境搭建、工程測試

RA生態(tài)工作室
2天前

2448 閱讀

全新一代國產(chǎn)數(shù)據(jù)通信網(wǎng)關(guān)！飛凌嵌入式FCU1501嵌入式控制單元發(fā)布，含詳細(xì)參數(shù)

飛凌嵌入式
2天前

3806 閱讀

ANPC雙脈沖測試避坑指南

青銅劍技術(shù)
2天前

2458 閱讀

詳解電源時序配置方法

MPS芯源系統(tǒng)
2天前

2692 閱讀

電氣原理圖的設(shè)計方法實例介紹

空白zls
111 KB

免費

0下載

DS2784獨立式單節(jié)電池電量計

dplion
2.62 MB

免費

469下載

增加CAN總線節(jié)點數(shù)量的幾個方法

Hx
329KB

1積分

7下載

AlphaPlayer視頻動畫引擎

北冥有熊
5.87 MB

2積分

3下載

MSO1000Z/DS1000Z 系列數(shù)字示波器用戶手冊

DSHY2010
3.11 MB

10積分

1下載

《電子發(fā)燒友電子設(shè)計周報》聚焦硬科技領(lǐng)域核心價值 26年第5期：2026.3.16--2025.3.20

電子人steve
3天前

816 閱讀

【RA-Eco-RA4M2開發(fā)板評測】Zephyr之RTC適配與驗證

華仔stm32
3天前

1075 閱讀

Kicad9.0.8 PCB layout的時候卡死

jf_31850852
4天前

1103 閱讀

【飛凌嵌入式RV1126B開發(fā)板】+GPIO及其使用

jennyzhaojie
4天前

1164 閱讀

【RA-Eco-RA4M2開發(fā)板評測】適配Zephyr OS，快速驅(qū)動LED與串口

華仔stm32
4天前

1368 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

AI初創(chuàng)企業(yè)推MoE混合專家模型架構(gòu)新品abab 6.5

評論