91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于 Flexus 云服務(wù)器 X 實(shí)例體驗(yàn)大模型部署體驗(yàn)測(cè)評(píng)

jf_81200783 ? 來(lái)源:jf_81200783 ? 作者:jf_81200783 ? 2024-12-24 12:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

當(dāng)下,各種大模型層出不窮,先有 openai 的 chatgpt,后有百度文心一言,再就是國(guó)內(nèi)大模型齊頭并進(jìn)的搶先發(fā)布。

讓普通的開(kāi)發(fā)者不必為不能體驗(yàn) chatgpt 而擔(dān)憂,國(guó)內(nèi)的大模型速度也很快。但是大家目前都是在體驗(yàn),能不能部署一下試試呢?

今天,我們就以華為云 Flexus 云服務(wù)器 X 實(shí)例來(lái)部署一下,順便測(cè)測(cè)其性能看看。

在華為云 828 B2B 企業(yè)節(jié)狂潮中,F(xiàn)lexus X 實(shí)例的限時(shí)大促銷震撼來(lái)襲,絕對(duì)是你不容錯(cuò)過(guò)的超級(jí)福利!對(duì)于那些追求極致算力、對(duì)自建 MySQL、Redis、Nginx 性能有著苛刻要求的技術(shù)極客們,這次活動(dòng)無(wú)疑是你們的專屬盛宴!趕緊抓住這個(gè)千載難逢的機(jī)會(huì),讓業(yè)務(wù)效能飛躍升級(jí)?。?!

注意:本文為高端局,對(duì)于還不知道怎么使用 shell 工具,不知道云服務(wù)器為何物?不知道大模型為何物的讀者可以退出啦,本文不太適合

部署千問(wèn)大模型

之前一直就想搞個(gè)大模型玩玩了,奈何電腦配置不打夠,所以只能是可望而不可及,今天,就單獨(dú)用這款華為云 Flexus 云服務(wù)器 X 實(shí)例來(lái)試試。

本文我們基于 Ollama 部署和運(yùn)行大模型,那么,何為 Ollama?

不過(guò)官網(wǎng)上都是洋文,看著比較吃力。我搜了些資料,給大家現(xiàn)個(gè)丑:

Ollama 是一個(gè)強(qiáng)大的框架,設(shè)計(jì)用于在 Docker 容器中部署 LLM。Ollama 的主要功能是在 Docker 容器內(nèi)部署和管理 LLM 的促進(jìn)者,它使該過(guò)程變得非常簡(jiǎn)單。它幫助用戶快速在本地運(yùn)行大模型,通過(guò)簡(jiǎn)單的安裝指令,可以讓用戶執(zhí)行一條命令就在本地運(yùn)行開(kāi)源大型語(yǔ)言模型,例如 Llama 2。

下面,我們來(lái)開(kāi)始實(shí)操!

wKgZPGdqOBSAFBglAAAUOzm0N4c547.png

我們可以直接從瀏覽器中輸入,然后會(huì)自動(dòng)下載,當(dāng)然,我們也可以直接從 shell 工具中下載,不過(guò)就是有點(diǎn)慢,他這個(gè)東西還很大。

wKgZO2dqOBSAGwFpAABAXtXHvrc737.png

等待的過(guò)程挺漫長(zhǎng),可以先去找點(diǎn)別的事兒去做。

接著等待....

終于在漫長(zhǎng)的等待過(guò)程中,我們將 ollama 下載下來(lái)了啦,下面我們就可以開(kāi)始體驗(yàn)了!??!

wKgZPGdqOBWAPOVdAADyteZuuIs192.png

1.啟動(dòng) ollama 的服務(wù)

當(dāng)我們服務(wù)器中有了 ollama 的服務(wù)后,我們需要啟動(dòng)他!命令如下:

systemctl start ollama.service

然后我們?cè)趫?zhí)行一下下面的命令,看看服務(wù)是否已經(jīng)啟動(dòng):

systemctl status ollama.service

wKgZO2dqOBWATmrSAAJ4qlTxKLI313.png

3. 設(shè)置服務(wù)開(kāi)機(jī)自啟動(dòng):

sudo systemctl enable ollama

1.查看內(nèi)存占用情況。

兩個(gè)方法都可以查看,第一是從寶塔面板中查看,第二就是直接輸入命令:

free -h

wKgZPGdqOBaAa9OBAAAZEayBzT4895.png

大家可以看的出來(lái),used 這一列,表示的是已使用,目前來(lái)看,并不多。

1.運(yùn)行大模型

我們先來(lái)看看 ollama 支持的大模型有哪些?

wKgZO2dqOBaAM_jmAAEW5u4RUZ8696.png

我們先跑個(gè)小點(diǎn)的千問(wèn)大模型吧,千問(wèn) 0.5B 的模型看看。

wKgZPGdqOBeAakKRAADdvTRFjE0652.png

輸入命令:

ollama run qwen2:0.5b

wKgZO2dqOBiAYKv3AAANQArwu7g712.png

還是繼續(xù)等待....等待的過(guò)程中,為了不浪費(fèi)時(shí)間,可以看看別的事兒。

wKgZPGdqOBiAdY2DAAAqQb9dIN0014.png

wKgZO2dqOBiAfy1YAACCFN4bmYQ141.png

等待完成,下面我們就可以看到:Send a message 這句話了,表示我們可以直接使用大模型提問(wèn)啦

1.體驗(yàn)大模型

我們輸入個(gè)問(wèn)題試試看看:

[MISSING IMAGE: , ]不知道為啥,他非要說(shuō)自己是李政保,還說(shuō)的有鼻子有眼的,質(zhì)量的問(wèn)題我們不管,我們看性能和速度問(wèn)題。

wKgZPGdqOBmAdB5YACYBlUqgAuI992.gif

簡(jiǎn)單的錄了個(gè)小視頻,這速度還是很快的。可見(jiàn)這服務(wù)器的性能還是不錯(cuò)的,感興趣的伙伴們,可以嘗試跑跑更大的模型試試。

總體來(lái)說(shuō),這次活動(dòng)的力度還是蠻大的,主要是服務(wù)器性能也確實(shí)可以,不用 GPU 也可以跑大模型了,本文就是我們單純的用 CPU 就行跑的,體驗(yàn)很好。

wKgZO2dqOBuATdF5AAMe6I92ToY076.png

至此,本文 over。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云服務(wù)器
    +關(guān)注

    關(guān)注

    0

    文章

    838

    瀏覽量

    14693
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2832

    瀏覽量

    19264
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3651

    瀏覽量

    5195
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    硬件通脹下的生存戰(zhàn)!華為Flexus X服務(wù)器,讓中小企業(yè)不做“接盤俠”

    通知”成了企業(yè)IT采購(gòu)的常態(tài)。 DRAM合同價(jià)同比暴漲171.8%,NAND Flash價(jià)格累計(jì)飆升246%,服務(wù)器整機(jī)采購(gòu)成本上升15%-20%。硬件市場(chǎng)的瘋狂漲價(jià),正讓無(wú)數(shù)中小企業(yè)面臨“買得起用不起、想買卻沒(méi)貨”的絕境。而__華為
    的頭像 發(fā)表于 12-31 13:05 ?301次閱讀

    DRAM 暴漲 171%! 171% 下的企業(yè)突圍:華為 Flexus X 服務(wù)器成 IT 成本管控利器

    Flexus X 服務(wù)器憑借獨(dú)有的柔性算力黑科技與智能調(diào)度能力,助力企業(yè)實(shí)現(xiàn)核心應(yīng)用性能最高達(dá)友商 6 倍、綜合成本降低 30% 的雙
    的頭像 發(fā)表于 12-31 13:00 ?259次閱讀

    什么是企業(yè)服務(wù)器-計(jì)算

    地?cái)U(kuò)展和管理其IT基礎(chǔ)設(shè)施。華納的企業(yè)服務(wù)器基于虛擬化技術(shù),在環(huán)境中運(yùn)行多個(gè)虛擬服務(wù)器實(shí)例
    的頭像 發(fā)表于 12-29 17:57 ?803次閱讀

    服務(wù)器端口怎么開(kāi)放?

    剛搭建好服務(wù)器,想部署網(wǎng)站、運(yùn)行應(yīng)用或開(kāi)啟遠(yuǎn)程連接,卻發(fā)現(xiàn)外網(wǎng)始終無(wú)法訪問(wèn)?大概率是端口沒(méi)開(kāi)放。端口就像服務(wù)器的門窗,默認(rèn)狀態(tài)下,
    的頭像 發(fā)表于 11-11 15:43 ?902次閱讀

    如何快速在服務(wù)器部署Web環(huán)境?

    如何快速在服務(wù)器部署Web環(huán)境
    的頭像 發(fā)表于 10-14 14:16 ?669次閱讀

    DeepSeek模型如何在服務(wù)器部署?

    隨著大型語(yǔ)言模型(LLM)的應(yīng)用日益普及,許多開(kāi)發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型部署到自己的服務(wù)器上,以實(shí)現(xiàn)私有化、定制化
    的頭像 發(fā)表于 10-13 16:52 ?955次閱讀

    Jtti服務(wù)器上怎么部署網(wǎng)站嗎

    在互聯(lián)網(wǎng)快速發(fā)展的今天,網(wǎng)站已經(jīng)成為公司和個(gè)人溝通和展示自我的重要渠道。無(wú)論是一個(gè)簡(jiǎn)單的個(gè)人博客,還是一個(gè)復(fù)雜的電子商務(wù)平臺(tái),部署網(wǎng)站的過(guò)程都是相似的。服務(wù)器因其高可用性、靈活性和經(jīng)濟(jì)性,成為
    的頭像 發(fā)表于 09-26 17:16 ?1190次閱讀

    HarmonyOS5服務(wù)技術(shù)分享--ArkTS開(kāi)發(fā)Node環(huán)境

    氣的方式探索這個(gè)功能,結(jié)尾還有實(shí)用總結(jié)和鼓勵(lì)彩蛋哦~? ? 一、HarmonyOS函數(shù)開(kāi)發(fā):核心能力與價(jià)值 HarmonyOS的函數(shù)(Serverless)為開(kāi)發(fā)者提供了??無(wú)服務(wù)器架構(gòu)??的便捷
    發(fā)表于 05-22 17:21

    服務(wù)器和獨(dú)立服務(wù)器的區(qū)別在哪?一文讀懂如何選擇

    面對(duì)服務(wù)器與獨(dú)立服務(wù)器的選擇,許多人常因概念模糊而糾結(jié)。服務(wù)器和獨(dú)立服務(wù)器的區(qū)別在于資源分配
    的頭像 發(fā)表于 05-19 10:19 ?689次閱讀

    電競(jìng)服務(wù)器 工作原理

    電競(jìng)服務(wù)器工作原理詳解 一、核心架構(gòu)原理 虛擬化資源池? 通過(guò) ?KVM/VMware? 等虛擬化技術(shù)將物理服務(wù)器(含NVIDIA GPU集群)抽象為可動(dòng)態(tài)分配的算力資源池,每個(gè)用戶獨(dú)享獨(dú)立虛擬機(jī)
    的頭像 發(fā)表于 05-14 07:44 ?614次閱讀
    <b class='flag-5'>云</b>電競(jìng)<b class='flag-5'>服務(wù)器</b> 工作原理

    基于RAKsmart服務(wù)器的AI大模型實(shí)時(shí)推理方案設(shè)計(jì)

    面對(duì)高并發(fā)請(qǐng)求、嚴(yán)格的響應(yīng)延遲要求及波動(dòng)的業(yè)務(wù)負(fù)載,傳統(tǒng)本地化部署的算力瓶頸愈發(fā)顯著。RAKsmart服務(wù)器憑借其彈性計(jì)算資源池、分布式網(wǎng)絡(luò)架構(gòu)與全棧AI加速能力,為AI大模型實(shí)時(shí)推
    的頭像 發(fā)表于 05-13 10:33 ?616次閱讀

    如何在RAKsmart服務(wù)器上實(shí)現(xiàn)企業(yè)AI模型部署

    AI模型的訓(xùn)練與部署需要強(qiáng)大的算力支持、穩(wěn)定的網(wǎng)絡(luò)環(huán)境和專業(yè)的技術(shù)管理。RAKsmart作為全球領(lǐng)先的服務(wù)器托管與計(jì)算服務(wù)提供商,已成為企
    的頭像 發(fā)表于 03-27 09:46 ?944次閱讀

    RAKsmart企業(yè)服務(wù)器部署DeepSeek編寫(xiě)運(yùn)行代碼

    在RAKsmart企業(yè)服務(wù)器部署并運(yùn)行DeepSeek模型的代碼示例和詳細(xì)步驟。假設(shè)使用 Python + Transformers庫(kù) + FastAPI實(shí)現(xiàn)一個(gè)基礎(chǔ)的AI服務(wù)。主機(jī)
    的頭像 發(fā)表于 03-25 10:39 ?709次閱讀

    DeepSeek企業(yè)級(jí)部署服務(wù)器資源計(jì)算 以raksmart裸機(jī)服務(wù)器為例

    以RakSmart裸機(jī)服務(wù)器為例,針對(duì)DeepSeek企業(yè)級(jí)部署服務(wù)器資源計(jì)算指南,涵蓋GPU/CPU/內(nèi)存/存儲(chǔ)/網(wǎng)絡(luò)等核心維度的詳細(xì)計(jì)算方法與配置推薦,主機(jī)推薦小編為您整理發(fā)布
    的頭像 發(fā)表于 03-21 10:17 ?1091次閱讀

    RAKsmart美國(guó)裸機(jī)服務(wù)器DeepSeek的高級(jí)定制化部署方案

    在RAKsmart美國(guó)裸機(jī)服務(wù)器上進(jìn)行DeepSeek的高級(jí)定制化部署,需結(jié)合高性能硬件與靈活的軟件配置,以實(shí)現(xiàn)模型優(yōu)化、多任務(wù)并行及安全性提升。以下是針對(duì)企業(yè)級(jí)需求的詳細(xì)方案,主機(jī)
    的頭像 發(fā)表于 03-13 11:55 ?908次閱讀