91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于 Flexus X 實(shí)例云服務(wù)器的評(píng)測(cè) - 大模型對(duì)比評(píng)測(cè)

jf_21561199 ? 來(lái)源:jf_21561199 ? 作者:jf_21561199 ? 2024-12-24 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家好,我是雄雄,歡迎關(guān)注微信公眾號(hào):雄雄的小課堂

@TOC

寫在前面

華為云 828,領(lǐng) 8280 元上云禮券,買高性能服務(wù)器?。。?/p>

這不,手里就拿到了一臺(tái) 4 核 12G,10M 的 Flexus X 實(shí)例云服務(wù)器,拿到后,就想著測(cè)測(cè)它的性能,看看有沒有官網(wǎng)說(shuō)的那么神奇!??!

官網(wǎng)的活動(dòng)地址在這里,領(lǐng) 8280 元券:點(diǎn)我查看

服務(wù)器配置情況

下面,簡(jiǎn)單的給大家看看我手里的這臺(tái)服務(wù)器的配置,做個(gè)鋪墊,待會(huì)兒給大家上大招?。。?/p>

cpu 的情況

wKgZPGdqgBWAQa_FAABG5meIOQI667.png

內(nèi)存情況

wKgZO2dqgBaAE1EiAACACZJTFeQ271.png

硬盤情況

wKgZPGdqgBaAAaAeAACQxLZfkgM499.png

拿到服務(wù)器后,我不想再裝環(huán)境上浪費(fèi)時(shí)間,所以就安裝了個(gè)寶塔,這個(gè)面板在服務(wù)器中,占不了多少內(nèi)存,但是方便了裝環(huán)境,不用執(zhí)行裝環(huán)境的命令,只需要在軟件商店中,找到需要安裝的軟件,點(diǎn)擊后面的安裝即可。

評(píng)測(cè)之前環(huán)境準(zhǔn)備

在正式評(píng)測(cè)之前,我們需要準(zhǔn)備以下環(huán)境:

1.docker,不會(huì)安裝的可以自行百度

2.ollama,這個(gè)也很簡(jiǎn)單,執(zhí)行個(gè)命令就完事兒了

假使我們這兩個(gè)環(huán)境現(xiàn)在在云服務(wù)器上都安裝成功啦。

wKgZO2dqgBeAKcTDAAHaIAGiEMY107.png

wKgZPGdqgBiAX5TuAABlNLuykK4089.png

那么,現(xiàn)在我們開始正式評(píng)測(cè)?。。?/p>

華為云 Flexus X 實(shí)例大模型評(píng)測(cè)

下面,我們開始基于華為云的 Flexus X 實(shí)例云服務(wù)器評(píng)測(cè)一下大模型,因?yàn)槲覀儸F(xiàn)在還不知道這款服務(wù)器能跑多大的模型,所以我們就先從小模型開始跑。

先來(lái)個(gè)小模型,下面我們可以直接使用 ollama 開始跑模型,大家進(jìn)入 ollama 的官網(wǎng),點(diǎn)擊右上角的 model 菜單:

wKgZO2dqgBiAT5_vAADSxM4WYEY026.png

然后就能看到下面所有 ollama 支持的大模型啦。

找到 qwen2,我們可以看到下面的 tag 里面分別有:0.5B,1.5B,7B,72B,這幾種。

wKgZPGdqgBmANedaAAA3DT8ow_U767.png

千問(wèn) 0.5B 大模型

下面,我們先以最小的為例,試試看看:(注意,模型的質(zhì)量我們暫且不管,我們只評(píng)測(cè)響應(yīng)速度以及 CPU 和內(nèi)存的占用情況)

占用情況以寶塔面板上的統(tǒng)計(jì)圖為例,待會(huì)兒給大家截圖。

執(zhí)行下面的命令,開始跑 0.5B 的大模型:

ollama run qwen2:0.5b

運(yùn)行情況如下:

wKgZO2dqgBmAcnrOAAy9ecppnE8015.gif

占用情況如下:

wKgZPGdqgBqAEWfnAABnskGyHTY900.png

結(jié)論:0.5B 的大模型,可以看到,這個(gè)速度快的驚人,沒說(shuō)的,繼續(xù)測(cè)下個(gè)大模型。

千問(wèn) 1.5B 大模型

這次我們測(cè) 1.5B 的大模型,比 0.5B 的多 1,看看這款 Flexus X 實(shí)例云服務(wù)器的表現(xiàn)怎么樣。

同樣,執(zhí)行下面的命令:

ollama run qwen2:1.5b

wKgZO2dqgBqADn1_AAAnSkHwiZ4801.png

這里需要等待半天,讓下載。

下載過(guò)程中,我們可以看看寶塔上的內(nèi)存和 CPU 的占比情況。

wKgZPGdqgBuAKVk9AABaluelEcI813.png

基本上毫無(wú)壓力,繼續(xù)等待?。。?/p>

等待的過(guò)程有點(diǎn)漫長(zhǎng).....

wKgZO2dqgBuAWDQ9AABKAlY7z-M494.png

開測(cè)?。。?/p>

wKgZPGdqgByARiIlAAixulHx51M132.gif

看看占用情況:

wKgZO2dqgB2Aec23AABib0MZ_Zk345.png

結(jié)論:比較完美,感覺和 0.5B 的區(qū)別不是很大,就是下載的時(shí)候慢了點(diǎn),整體表現(xiàn)很棒。

gemma2 的 2b 大模型

0.5B 和 1.5B 的我們都測(cè)試過(guò)了,大家也可以從上圖中看的出來(lái),一點(diǎn)壓力都沒有,響應(yīng)速度也很快,嗖嗖的就回答完畢了,質(zhì)量也還行,而且最主要的是服務(wù)器的性能完全是過(guò)剩的,沒跑滿,所以,我們接著加大力度測(cè)試。

現(xiàn)在我們測(cè)測(cè) gemma2 的 2b 大模型,運(yùn)行如下命令:

ollama run gemma2:2b

又到了等待的過(guò)程中了,總是這么漫長(zhǎng)~

wKgZO2dqgB2AGog0AAAkD0IHIbo654.png

在下載模型的過(guò)程中,我們可以看看占用情況:

wKgZPGdqgB6AW8G1AABOby8sToY549.png

一點(diǎn)問(wèn)題都沒有,幾乎沒有占多少,現(xiàn)在我們繼續(xù)等待。

wKgZO2dqgB6ANv2xAAB0YWh8bRg214.png

等待完畢,開始問(wèn)個(gè)問(wèn)題測(cè)試一下:

效果展示情況:

wKgZPGdqgB-ADob1AAQRZSaqPnA213.gif

資源占用情況:

wKgZO2dqgB-AbCh6AABiubAQaas140.png

結(jié)論:通過(guò)效果圖 gif 中可以看的出來(lái),響應(yīng)要比 1.5B 的稍微慢了點(diǎn)兒,但是這個(gè)速度還是可以接受,不過(guò)內(nèi)存占用稍微偏高了,由原來(lái)的 27 增加到了 34,倒是也能接受,畢竟模型的大小由原來(lái)的 900 多 M 到現(xiàn)在的 1.4G 了。

千問(wèn) 7B 大模型

現(xiàn)在,我們繼續(xù)增大模型,看看表現(xiàn)效果怎么樣。

這次我們測(cè)一下千問(wèn)的 7B 大模型,這是 2B 的 3 倍多,看看這款 Flexus X 實(shí)例云服務(wù)器跑 7B 的模型是個(gè)什么情況。

同樣,執(zhí)行下面的命令:

ollama run qwen2:7b

繼續(xù)等待:

wKgZPGdqgB-AblfYAAAktnPqqLg614.png

7B 的模型,已經(jīng)到了 4G 多了,期待他能有個(gè)很好的表現(xiàn)。

現(xiàn)在是:2024 年 9 月 6 日 00:02:43,我的 7B 大模型還在下載中,已經(jīng)困的不行了....

wKgZO2dqgCCAZ2gaAAAkH_ElAHQ137.png

再等等....

wKgZPGdqgCCAesCYAABolZ7xrFY109.png

終于等它下載完啦,一共 4.4G,等的我都快做夢(mèng)啦。切記,如果有大文件上下傳的場(chǎng)景,買服務(wù)器的時(shí)候一定要選擇個(gè)大帶寬的,我的這個(gè)是 10M 的帶寬,感覺遇到大文件了,還是有點(diǎn)不足。

下面我們開始進(jìn)行評(píng)測(cè),首先還是老規(guī)矩,先運(yùn)行看看效果:

wKgZO2dqgCCAfj8OAAHZP_Ro8I4751.gif

資源占用情況:

wKgZPGdqgCGAYNriAABl4olLMgg640.png

結(jié)論:大家可以看看效果圖中,可以發(fā)現(xiàn),很明顯,相比起 2B 1.5B 的這種小模型來(lái)比,7B 的模型,在響應(yīng)方面確實(shí)是稍微慢了點(diǎn)兒,但是也沒有慢到一個(gè)字一個(gè)字的往出蹦,還是可以接受的。資源占用情況的話,CPU 占用上升到了 50.4% ,內(nèi)存在原來(lái)的 34 增加到了 49。也沒有跑滿服務(wù)器。

總結(jié)

先放一張各個(gè)大小的模型之間的對(duì)比吧,從 0.5B,到 1.5B,再到 7B,以及 72B。

wKgZO2dqgCGAAFczAABWijIM_Dw316.png

大家可以從上圖中看的出來(lái),模型越大,params 就越大,本文我們通過(guò)對(duì) 0.5b,1.5b,2b,7b 這幾個(gè)模型進(jìn)行評(píng)測(cè)對(duì)比,總體來(lái)說(shuō),比我預(yù)想的要好很多,我以為 7b 的會(huì)卡的很,結(jié)果表現(xiàn)的很棒,這么看來(lái),跑 8B 以內(nèi)的模型是沒有問(wèn)題的。

在往上的大模型,可能會(huì)吃力,不過(guò) 8B 以內(nèi),其實(shí)小微企業(yè)足矣?。?!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云服務(wù)器
    +關(guān)注

    關(guān)注

    0

    文章

    839

    瀏覽量

    14737
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3712

    瀏覽量

    5230
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    硬件通脹下的生存戰(zhàn)!華為Flexus X服務(wù)器,讓中小企業(yè)不做“接盤俠”

    通知”成了企業(yè)IT采購(gòu)的常態(tài)。 DRAM合同價(jià)同比暴漲171.8%,NAND Flash價(jià)格累計(jì)飆升246%,服務(wù)器整機(jī)采購(gòu)成本上升15%-20%。硬件市場(chǎng)的瘋狂漲價(jià),正讓無(wú)數(shù)中小企業(yè)面臨“買得起用不起、想買卻沒貨”的絕境。而__華為
    的頭像 發(fā)表于 12-31 13:05 ?350次閱讀

    DRAM 暴漲 171%! 171% 下的企業(yè)突圍:華為 Flexus X 服務(wù)器成 IT 成本管控利器

    Flexus X 服務(wù)器憑借獨(dú)有的柔性算力黑科技與智能調(diào)度能力,助力企業(yè)實(shí)現(xiàn)核心應(yīng)用性能最高達(dá)友商 6 倍、綜合成本降低 30% 的雙
    的頭像 發(fā)表于 12-31 13:00 ?313次閱讀

    什么是企業(yè)服務(wù)器-計(jì)算

    地?cái)U(kuò)展和管理其IT基礎(chǔ)設(shè)施。華納的企業(yè)服務(wù)器基于虛擬化技術(shù),在環(huán)境中運(yùn)行多個(gè)虛擬服務(wù)器實(shí)例
    的頭像 發(fā)表于 12-29 17:57 ?927次閱讀

    知聲山海醫(yī)療大模型問(wèn)鼎MedBench4.0三項(xiàng)榜首

    12月16日,中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái)MedBench4.0發(fā)布最新評(píng)測(cè)結(jié)果。知聲自主研發(fā)的“山海醫(yī)療大模型(UniGPT?Med)”展
    的頭像 發(fā)表于 12-29 14:35 ?3501次閱讀
    <b class='flag-5'>云</b>知聲山海醫(yī)療大<b class='flag-5'>模型</b>問(wèn)鼎MedBench4.0三項(xiàng)榜首

    服務(wù)器端口怎么開放?

    剛搭建好服務(wù)器,想部署網(wǎng)站、運(yùn)行應(yīng)用或開啟遠(yuǎn)程連接,卻發(fā)現(xiàn)外網(wǎng)始終無(wú)法訪問(wèn)?大概率是端口沒開放。端口就像服務(wù)器的門窗,默認(rèn)狀態(tài)下,服務(wù)器
    的頭像 發(fā)表于 11-11 15:43 ?982次閱讀

    如何快速在服務(wù)器上部署Web環(huán)境?

    如何快速在服務(wù)器上部署Web環(huán)境
    的頭像 發(fā)表于 10-14 14:16 ?759次閱讀

    DeepSeek模型如何在服務(wù)器上部署?

    隨著大型語(yǔ)言模型(LLM)的應(yīng)用日益普及,許多開發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型部署到自己的服務(wù)器上,以實(shí)現(xiàn)私有化、定制化服務(wù)
    的頭像 發(fā)表于 10-13 16:52 ?1037次閱讀

    輕量服務(wù)器服務(wù)器區(qū)別:2025年終極選擇指南

    輕量服務(wù)器服務(wù)器區(qū)別在于定位和性能保障。輕量服務(wù)器采用共享計(jì)算資源和突發(fā)性能模式,預(yù)配置
    的頭像 發(fā)表于 09-01 13:58 ?1459次閱讀
    輕量<b class='flag-5'>云</b><b class='flag-5'>服務(wù)器</b>和<b class='flag-5'>云</b><b class='flag-5'>服務(wù)器</b>區(qū)別:2025年終極選擇指南

    硅谷GPU服務(wù)器是什么意思?使用指南詳解

    硅谷GPU服務(wù)器本質(zhì)上是一種IaaS(基礎(chǔ)設(shè)施即服務(wù))產(chǎn)品,它將物理服務(wù)器上的GPU資源通過(guò)虛擬化技術(shù)分割成可彈性調(diào)配的
    的頭像 發(fā)表于 06-16 09:41 ?660次閱讀

    直播服務(wù)器對(duì)帶寬有什么要求?#直播服務(wù)器 #直播 #帶寬

    服務(wù)器
    jf_57681485
    發(fā)布于 :2025年05月30日 11:54:24

    服務(wù)器和獨(dú)立服務(wù)器的區(qū)別在哪?一文讀懂如何選擇

    面對(duì)服務(wù)器與獨(dú)立服務(wù)器的選擇,許多人常因概念模糊而糾結(jié)。服務(wù)器和獨(dú)立服務(wù)器的區(qū)別在于資源分配
    的頭像 發(fā)表于 05-19 10:19 ?743次閱讀

    存儲(chǔ)服務(wù)器租用的好處有哪些?

    隨著企業(yè)數(shù)字化轉(zhuǎn)型加速,存儲(chǔ)服務(wù)器租用成為越來(lái)越多企業(yè)的首選方案。存儲(chǔ)服務(wù)器租用的好處在于彈性靈活、成本可控、安全可靠,同時(shí)避免了傳統(tǒng)服務(wù)器
    的頭像 發(fā)表于 05-16 11:03 ?882次閱讀

    高防服務(wù)器哪家好?RAKsmart高防服務(wù)器全方位解析

    普通服務(wù)器缺乏專業(yè)防護(hù)能力,而高防服務(wù)器憑借高帶寬儲(chǔ)備、智能流量清洗機(jī)制和實(shí)時(shí)監(jiān)控系統(tǒng),能有效抵御攻擊,保障業(yè)務(wù)連續(xù)性。不過(guò),市場(chǎng)上高防服務(wù)器提供商眾多,哪家好呢?接下來(lái),小庫(kù)主機(jī)評(píng)測(cè)
    的頭像 發(fā)表于 05-12 09:28 ?1929次閱讀

    深蘭科技醫(yī)療大模型榮獲MedBench評(píng)測(cè)第一

    近日,國(guó)內(nèi)權(quán)威醫(yī)療大模型評(píng)測(cè)平臺(tái)MedBench在官網(wǎng)更新了榜單,多個(gè)知名醫(yī)療AI產(chǎn)品及研究團(tuán)隊(duì)入榜,其中深蘭DeepBlue-MR-v1醫(yī)療大模型以復(fù)雜醫(yī)學(xué)推理評(píng)測(cè)第一的成績(jī)領(lǐng)跑Me
    的頭像 發(fā)表于 04-30 16:08 ?980次閱讀

    PTP服務(wù)器與NTP服務(wù)器對(duì)比分析

    隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,時(shí)間同步在各個(gè)領(lǐng)域中的重要性日益凸顯。在眾多的時(shí)間同步解決方案中,PTP(精確時(shí)間協(xié)議)服務(wù)器和NTP(網(wǎng)絡(luò)時(shí)間協(xié)議)服務(wù)器是兩個(gè)常見的選擇。本文將對(duì)這兩種服務(wù)器進(jìn)行對(duì)比
    的頭像 發(fā)表于 04-27 17:15 ?1391次閱讀
    PTP<b class='flag-5'>服務(wù)器</b>與NTP<b class='flag-5'>服務(wù)器</b>的<b class='flag-5'>對(duì)比</b>分析