91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云服務(wù)器 Flexus X 實(shí)例:RAG 開源項(xiàng)目 FastGPT 部署,玩轉(zhuǎn)大模型

jf_81200783 ? 來源:jf_81200783 ? 作者:jf_81200783 ? 2025-01-08 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本篇文章主要通過 Flexus 云服務(wù)器 X 實(shí)例 部署 RAG 開源項(xiàng)目 FastGPT,通過 FastGPT 可以使用大模型生成用戶需要的內(nèi)容。 Flexus 云服務(wù)器 X 實(shí)例具有柔性算力,六倍性能,旗艦體驗(yàn),覆蓋高科技、零售、金融、游戲等行業(yè)大多數(shù)通用工作負(fù)載場景,完全可以支持 FastGPT 的部署、運(yùn)行和使用,而且,F(xiàn)lexus 云服務(wù)器 X 實(shí)例 能夠提供完備的產(chǎn)品能力,可以基于業(yè)務(wù)訴求靈活自定義拓?fù)浣M網(wǎng),支持靈活自定義 vCPU 和內(nèi)存配比,完全基于業(yè)務(wù)資源訴求選擇合適規(guī)格,節(jié)省資源開銷等優(yōu)勢,需要的小伙伴趕緊用起來吧!

wKgZPGd99a6Aa3PIAADwgfpW3mk902.png

一、FastGPT 簡介****

FastGPT 是一個(gè)基于 LLM 大語言模型的知識(shí)庫問答系統(tǒng),提供開箱即用的數(shù)據(jù)處理、模型調(diào)用等能力。同時(shí)可以通過 Flow 可視化進(jìn)行工作流編排,從而實(shí)現(xiàn)復(fù)雜的問答場景!

wKgZO2d99a6APMQ3AAGEQBdBRcI860.png

具有如下特性:

(1)專屬 AI 客服:通過導(dǎo)入文檔或已有問答對進(jìn)行訓(xùn)練,讓 AI 模型能根據(jù)你的文檔以交互式對話方式回答問題;

(2)簡單易用的可視化界面:FastGPT 采用直觀的可視化界面設(shè)計(jì),為各種應(yīng)用場景提供了豐富實(shí)用的功能。通過簡潔易懂的操作步驟,可以輕松完成 AI 客服的創(chuàng)建和訓(xùn)練流程;

(3)自動(dòng)數(shù)據(jù)預(yù)處理:提供手動(dòng)輸入、直接分段、LLM 自動(dòng)處理和 CSV 等多種數(shù)據(jù)導(dǎo)入途徑,其中“直接分段”支持通過 PDF、WORD、Markdown 和 CSV 文檔內(nèi)容作為上下文。FastGPT 會(huì)自動(dòng)對文本數(shù)據(jù)進(jìn)行預(yù)處理、向量化和 QA 分割,節(jié)省手動(dòng)訓(xùn)練時(shí)間,提升效能;

(4)工作流編排:基于 Flow 模塊的工作流編排,可以幫助你設(shè)計(jì)更加復(fù)雜的問答流程。例如查詢數(shù)據(jù)庫、查詢庫存、預(yù)約實(shí)驗(yàn)室等;

(5)強(qiáng)大的 API 集成:FastGPT 對外的 API 接口對齊了 OpenAI 官方接口,可以直接接入現(xiàn)有的 GPT 應(yīng)用,也可以輕松集成到企業(yè)微信、公眾號(hào)、飛書等平臺(tái)。

二、FastGPT 部署****

2.1 下載啟動(dòng)文件****

首先,創(chuàng)建一個(gè)目錄方便存儲(chǔ)部署的文件,執(zhí)行如下命令創(chuàng)建目錄。

root@flexusx-7305:~# mkdir fastgpt

進(jìn)入 fastgpt 目錄,下載 config.json 文件。

root@flexusx-7305:~# cd fastgpt

root@flexusx-7305:~/fastgpt# curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json

% Total % Received % Xferd Average Speed Time Time Time CurrentDload Upload Total Spent Left Speed

100 6637 100 6637 0 0 17283 0 --:--:-- --:--:-- --:--:-- 17283

root@flexusx-7305:~#

如上所示,下載成功。config.json 文件是用于配置 FastGPT,包括大模型、向量數(shù)據(jù)庫、重排模型等,config.json 文件部分內(nèi)容如下所示。

{

"feConfigs": {

"lafEnv": "https://laf.dev" // laf 環(huán)境。 https://laf.run (杭州阿里云) ,或者私有化的 laf 環(huán)境。如果使用 Laf openapi 功能,需要最新版的 laf 。

},

"systemEnv": {

"vectorMaxProcess": 15,

"qaMaxProcess": 15,

"pgHNSWEfSearch": 100 // 向量搜索參數(shù)。越大,搜索越精確,但是速度越慢。設(shè)置為 100,有 99%+精度。

},

"llmModels": [

{

"model": "gpt-4o-mini", // 模型名(對應(yīng) OneAPI 中渠道的模型名)

"name": "gpt-4o-mini", // 模型別名

"avatar": "/imgs/model/openai.svg", // 模型的 logo

"maxContext": 125000, // 最大上下文

"maxResponse": 16000, // 最大回復(fù)

"quoteMaxToken": 120000, // 最大引用內(nèi)容

"maxTemperature": 1.2, // 最大溫度

"charsPointsPrice": 0, // n 積分/1k token(商業(yè)版)

"censor": false, // 是否開啟敏感校驗(yàn)(商業(yè)版)

"vision": true, // 是否支持圖片輸入

"datasetProcess": true, // 是否設(shè)置為知識(shí)庫處理模型(QA),務(wù)必保證至少有一個(gè)為 true,否則知識(shí)庫會(huì)報(bào)錯(cuò)

"usedInClassify": true, // 是否用于問題分類(務(wù)必保證至少有一個(gè)為 true)

"usedInExtractFields": true, // 是否用于內(nèi)容提取(務(wù)必保證至少有一個(gè)為 true)

"usedInToolCall": true, // 是否用于工具調(diào)用(務(wù)必保證至少有一個(gè)為 true)

"usedInQueryExtension": true, // 是否用于問題優(yōu)化(務(wù)必保證至少有一個(gè)為 true)

"toolChoice": true, // 是否支持工具選擇(分類,內(nèi)容提取,工具調(diào)用會(huì)用到。目前只有 gpt 支持)

"functionCall": false, // 是否支持函數(shù)調(diào)用(分類,內(nèi)容提取,工具調(diào)用會(huì)用到。會(huì)優(yōu)先使用 toolChoice,如果為 false,則使用 functionCall,如果仍為 false,則使用提示詞模式)

"customCQPrompt": "", // 自定義文本分類提示詞(不支持工具和函數(shù)調(diào)用的模型

"customExtractPrompt": "", // 自定義內(nèi)容提取提示詞

"defaultSystemChatPrompt": "", // 對話默認(rèn)攜帶的系統(tǒng)提示詞

"defaultConfig": {}, // 請求 API 時(shí),挾帶一些默認(rèn)配置(比如 GLM4 的 top_p)

"fieldMap": {} // 字段映射(o1 模型需要把 max_tokens 映射為 max_completion_tokens)

},

{

"model": "gpt-4o",

"name": "gpt-4o",

"avatar": "/imgs/model/openai.svg",

"maxContext": 125000,

"maxResponse": 4000,

"quoteMaxToken": 120000,

"maxTemperature": 1.2,

"charsPointsPrice": 0,

"censor": false,

"vision": true,

"datasetProcess": false,

"usedInClassify": true,

"usedInExtractFields": true,

"usedInToolCall": true,

"usedInQueryExtension": true,

"toolChoice": true,

"functionCall": false,

"customCQPrompt": "",

"customExtractPrompt": "",

"defaultSystemChatPrompt": "",

"defaultConfig": {},

"fieldMap": {}

},

然后,下載 Docker yml 文件,執(zhí)行如下命令。

root@flexusx-7305:~/fastgpt# curl -o docker-compose.yml https://raw.githubusercontent.com/labring/FastGPT/main/files/docker/docker-compose-pgvector.yml

% Total % Received % Xferd Average Speed Time Time Time CurrentDload Upload Total Spent Left Speed

100 5577 100 5577 0 0 14448 0 --:--:-- --:--:-- --:--:-- 14448

root@flexusx-7305:~#

docker-compose.yml 里面的鏡像需要修改為國內(nèi)鏡像,如下所示。

version: '3.3'

services:

# db

pg:

#image: pgvector/pgvector:0.7.0-pg15 # docker hub

image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.7.0 # 阿里云

container_name: pg

restart: always

ports: # 生產(chǎn)環(huán)境建議不要暴露

- 5432:5432

networks:

- fastgpt

environment:

# 這里的配置只有首次運(yùn)行生效。修改后,重啟鏡像是不會(huì)生效的。需要把持久化數(shù)據(jù)刪除再重啟,才有效果

- POSTGRES_USER=username

- POSTGRES_PASSWORD=password

- POSTGRES_DB=postgres

volumes:

- ./pg/data:/var/lib/postgresql/data

mongo:

#image: mongo:5.0.18 # dockerhub

image: registry.cn-hangzhou.aliyuncs.com/fastgpt/mongo:5.0.18 # 阿里云

# image: mongo:4.4.29 # cpu 不支持 AVX 時(shí)候使用

container_name: mongo

restart: always

ports:

- 27017:27017

networks:

- fastgpt

command: mongod --keyFile /data/mongodb.key --replSet rs0

environment:

- MONGO_INITDB_ROOT_USERNAME=myusername

- MONGO_INITDB_ROOT_PASSWORD=mypassword

volumes:

- ./mongo/data:/data/db

entrypoint:

- bash

- -c

- |

openssl rand -base64 128 > /data/mongodb.key

chmod 400 /data/mongodb.key

chown 999:999 /data/mongodb.key

echo 'const isInited = rs.status().ok === 1

if(!isInited){

rs.initiate({

_id: "rs0",

members: [

{ _id: 0, host: "mongo:27017" }

]

})

}' > /data/initReplicaSet.js

# 啟動(dòng) MongoDB 服務(wù)

exec docker-entrypoint.sh "$$@" &

# 等待 MongoDB 服務(wù)啟動(dòng)

until mongo -u myusername -p mypassword --authenticationDatabase admin --eval "print('waited for connection')" > /dev/null 2>&1; do

echo "Waiting for MongoDB to start..."

sleep 2

done

# 執(zhí)行初始化副本集的腳本

mongo -u myusername -p mypassword --authenticationDatabase admin /data/initReplicaSet.js

# 等待 docker-entrypoint.sh 腳本執(zhí)行的 MongoDB 服務(wù)進(jìn)程

wait $$!

fastgpt

sandbox:

container_name: sandbox

#image: ghcr.io/labring/fastgpt-sandbox:latest # git

image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:latest # 阿里云

networks:

- fastgpt

restart: always

fastgpt:

container_name: fastgpt

#image: ghcr.io/labring/fastgpt:v4.8.9 # git

image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.8.9 # 阿里云

ports:

- 3000:3000

networks:

- fastgpt

depends_on:

- mongo

- pg

- sandbox

restart: always

environment:

# root 密碼,用戶名為: root。如果需要修改 root 密碼,直接修改這個(gè)環(huán)境變量,并重啟即可。

- DEFAULT_ROOT_PSW=1234

# AI 模型的 API 地址哦。務(wù)必加 /v1。這里默認(rèn)填寫了 OneApi 的訪問地址。

- OPENAI_BASE_URL=http://oneapi:3000/v1

# AI 模型的 API Key。(這里默認(rèn)填寫了 OneAPI 的快速默認(rèn) key,測試通后,務(wù)必及時(shí)修改)

- CHAT_API_KEY=sk-fastgpt

# 數(shù)據(jù)庫最大連接數(shù)

- DB_MAX_LINK=30

# 登錄憑證密鑰

- TOKEN_KEY=any

# root 的密鑰,常用于升級(jí)時(shí)候的初始化請求

- ROOT_KEY=root_key

# 文件閱讀加密

- FILE_TOKEN_KEY=filetoken

# MongoDB 連接參數(shù). 用戶名 myusername,密碼 mypassword。

- MONGODB_URI=mongodb://myusername:mypassword@mongo:27017/fastgpt?authSource=admin

# pg 連接參數(shù)

- PG_URL=postgresql://username:password@pg:5432/postgres

# sandbox 地址

- SANDBOX_URL=http://sandbox:3000

# 日志等級(jí): debug, info, warn, error

- LOG_LEVEL=info

- STORE_LOG_LEVEL=warn

volumes:

- ./config.json:/app/data/config.json

............

需要將對應(yīng)的鏡像(image 處)替換為國內(nèi)鏡像源。

2.2 開放端口權(quán)限****

FastGPT 需要使用 3000 端口,所以需要開放 3000 端口。

在基本信息中,點(diǎn)擊安全組,如下所示。

wKgZPGd99a-APrD7AACPn6-fcVY008.png

然后,點(diǎn)擊配置規(guī)則,配置對應(yīng)的端口,如下所示。

wKgZO2d99a-AFcY_AABDtaCTBsw522.png

然后,點(diǎn)擊入方向規(guī)則,如下所示。

wKgZPGd99a-AO-t7AABcsaIK7FI187.png

然后,點(diǎn)擊添加規(guī)則,如下所示。

wKgZO2d99a-AVUjDAACCVlGg-NY589.png

最后,填寫優(yōu)先級(jí)、策略、類型、協(xié)議端口、源地址等,點(diǎn)擊確定即可添加。

wKgZO2d99bqAAuWXAAD8vgDlRy4426.png

2.3啟動(dòng) FastGPT****

最后,執(zhí)行命令docker-compose up -d 啟動(dòng)容器,如下所示。

root@flexusx-7305:~/fastgpt# docker-compose up -d

Pulling pg (registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.7.0)...

v0.7.0: Pulling from fastgpt/pgvector

b0a0cf830b12: Pull complete

b311dac095c3: Pull complete

36163cea98c3: Pull complete

fe401a45083b: Pull complete

b4f63e66f657: Pull complete

9a8245430c33: Pull complete

74c893d239e5: Pull complete

789ed9a95b21: Pull complete

5b691e4e12b4: Pull complete

e502d5360f88: Pull complete

0292671f3c2d: Pull complete

5247a27db111: Pull complete

b3a42a5269c3: Pull complete

5fc19b802589: Pull complete

973f95d4f335: Pull complete

694339e21380: Pull complete

Digest: sha256:27df42f0d0be8d5623ff1aea5fea7134e175af1cdef62d9df00b322a3c85edc9

Status: Downloaded newer image for registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.7.0

Pulling mongo (registry.cn-hangzhou.aliyuncs.com/fastgpt/mongo:5.0.18)...

5.0.18: Pulling from fastgpt/mongo

99803d4b97f3: Pull complete

6653ceb22977: Pull complete

e067c5774dde: Pull complete

3f2512535c9b: Pull complete

95823dd64119: Pull complete

806644aafaf1: Pull complete

b6eb4ecca0a2: Pull complete

a85fb80d261c: Pull complete

b8e25023b418: Pull complete

Digest: sha256:2b7e5f3ddc4f4707cdf72bd55e50a0dbd34b5832e5e97d9fdf5adc19abebf068

Status: Downloaded newer image for registry.cn-hangzhou.aliyuncs.com/fastgpt/mongo:5.0.18

Pulling sandbox (registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:latest)...

latest: Pulling from fastgpt/fastgpt-sandbox

ec99f8b99825: Already exists

826542d541ab: Pull complete

dffcc26d5732: Pull complete

db472a6f05b5: Pull complete

ecd04a51a4f0: Pull complete

545ea84d560a: Pull complete

c58556c21eaf: Pull complete

Digest: sha256:713b33d3046df1dbad4d8a96e96d6768da40b37725aae51d62c65f78d142f7f0

Status: Downloaded newer image for registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:latest

Pulling fastgpt (registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.8.9)...

v4.8.9: Pulling from fastgpt/fastgpt

ec99f8b99825: Already exists

826542d541ab: Already exists

dffcc26d5732: Already exists

db472a6f05b5: Already exists

491fb52a5552: Pull complete

e976869203ad: Pull complete

3752adf5e588: Pull complete

4f4fb700ef54: Pull complete

16dac137804b: Pull complete

6e71790b1b02: Pull complete

182766849e9d: Pull complete

dcb3c7036667: Pull complete

953e3286d363: Pull complete

b07e2289cb81: Pull complete

12cd02b56be5: Pull complete

1cb02e13b272: Pull complete

bf8bf6a61713: Pull complete

ccd96c6d5426: Pull complete

303d7b560361: Pull complete

9b6e2c2688e6: Pull complete

d44f4ca5f7c4: Pull complete

Digest: sha256:91e1bc8349f477c0c70b25a0dbeb7394240aac515ee5dd9e8c7c6e44b2d3da4a

Status: Downloaded newer image for registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.8.9

Pulling mysql (registry.cn-hangzhou.aliyuncs.com/fastgpt/mysql:8.0.36)...

8.0.36: Pulling from fastgpt/mysql

bd37f6d99203: Pull complete

d2433cba0951: Pull complete

13702d9fe3c3: Pull complete

83bcc87284a1: Pull complete

c38d8660e1fa: Pull complete

7e1bc321f421: Pull complete

bddd54b9c549: Pull complete

4eaae1e844ac: Pull complete

5196e1e87d8f: Pull complete

6586d096303c: Pull complete

cf55ff1c80af: Pull complete

Digest: sha256:c57363379dee26561c2e554f82e70704be4c8129bd0d10e29252cc0a34774004

Status: Downloaded newer image for registry.cn-hangzhou.aliyuncs.com/fastgpt/mysql:8.0.36

Pulling oneapi (registry.cn-hangzhou.aliyuncs.com/fastgpt/one-api:v0.6.6)...

v0.6.6: Pulling from fastgpt/one-api

4abcf2066143: Already exists

17841cb3f506: Pull complete

4394f95d2b0d: Pull complete

7fcd5fcce5af: Pull complete

Digest: sha256:480a8d63af5057f7d81437dc138da941998657779b6c0150fd5e595b6ff72c71

Status: Downloaded newer image for registry.cn-hangzhou.aliyuncs.com/fastgpt/one-api:v0.6.6

Creating pg ... done

Creating mongo ... done

Creating sandbox ... done

Creating mysql ... done

如上所示,分別拉取了 pgvector、mongo、fastgpt-sandbox、fastgpt、mysql、one-api 鏡像。

通過 docker ps 查看當(dāng)前運(yùn)行的鏡像,如下所示。

root@flexusx-7305:~/fastgpt# docker ps

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES

68a1f9a73e58 registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.8.9 "sh -c 'node --max-o…" 22 hours ago Up 22 hours 0.0.0.0:3000->3000/tcp, :::3000->3000/tcp fastgpt

b57af8cd1b6b registry.cn-hangzhou.aliyuncs.com/fastgpt/one-api:v0.6.6 "/one-api" 22 hours ago Up 22 hours 0.0.0.0:3001->3000/tcp, [::]:3001->3000/tcp oneapi

2de37c379c6a registry.cn-hangzhou.aliyuncs.com/fastgpt/mysql:8.0.36 "docker-entrypoint.s…" 22 hours ago Up 22 hours 0.0.0.0:3306->3306/tcp, :::3306->3306/tcp, 33060/tcp mysql

9d7906452f26 registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:latest "docker-entrypoint.s…" 22 hours ago Up 22 hours sandbox

6f9c7f088d9d registry.cn-hangzhou.aliyuncs.com/fastgpt/mongo:5.0.18 "bash -c 'openssl ra…" 22 hours ago Up 22 hours 0.0.0.0:27017->27017/tcp, :::27017->27017/tcp mongo

3867cf7f6df9 registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.7.0 "docker-entrypoint.s…" 22 hours ago Up 22 hours 0.0.0.0:5432->5432/tcp, :::5432->5432/tcp pg

89bb9f7a3dd1 swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0 "/one-api" 2 days ago Up 23 hours 0.0.0.0:3002->3000/tcp, [::]:3002->3000/tcp one-api

65fe1c102df6 daocloud.io/library/mysql:8 "docker-entrypoint.s…" 4 days ago Up 23 hours 3306/tcp, 33060/tcp root_db_1

root@flexusx-7305:~/fastgpt#

三、FastGPT 運(yùn)行****

3.1 登錄 FastGPT****

在瀏覽器中訪問http://服務(wù)器 IP:3000,F(xiàn)astGPT 界面如下所示。

wKgZPGd99bqASzQtAAFWMTQQI5g370.png

默認(rèn)用戶是 root,密碼是 1234,登錄后如下所示。

wKgZO2d99bqAX76-AABEtsxN48A760.png

3.2 知識(shí)庫****

點(diǎn)擊知識(shí)庫,右上角點(diǎn)擊新建,如下所示。

wKgZPGd99buAcx5qAAC-gjvMgAc239.png

然后填寫知識(shí)庫名稱,創(chuàng)建完成,知識(shí)庫如下所示。

wKgZO2d99buAPBJuAABj3Pf6qyc597.png

然后,可以點(diǎn)擊新建/導(dǎo)入按鈕導(dǎo)入文檔。

3.3 應(yīng)用****

點(diǎn)擊工作臺(tái),點(diǎn)擊右上角新建,如下所示。

wKgZPGd99byAB_1WAAJBCUiPm0c552.png

輸入名稱,創(chuàng)建應(yīng)用完成,如下所示。

wKgZO2d99byAVM5bAAELT8qjEyM173.png

可以在 AI 配置中選擇模型,填寫提示詞,關(guān)聯(lián)知識(shí)庫,知識(shí)庫可以選擇 3.2 知識(shí)庫中創(chuàng)建的,如下所示。

wKgZPGd99byADPCDAACKWduBJqo425.png

配置完大模型后可以在右側(cè)聊天窗口開啟聊天。

四、總結(jié)****

通過本篇文章,使用 Flexus 云服務(wù)器 X 實(shí)例 實(shí)例部署 FastGPT,整個(gè)過程非常順利,包括:下載配置文件、拉取鏡像、啟動(dòng)容器、遠(yuǎn)程訪問 FastGPT 等,而且 Flexus 云服務(wù)器 X 實(shí)例 具有高安全性,開放端口需要配置對應(yīng)的規(guī)則,可以保障 FastGPT 的安全運(yùn)行,有需要的小伙伴趕緊用起來吧!

wKgZO2d99b2AdBMIAADq_xS-7y0638.png


審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 云服務(wù)器
    +關(guān)注

    關(guān)注

    0

    文章

    837

    瀏覽量

    14687
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2832

    瀏覽量

    19250
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    KubePi:開源Kubernetes可視化管理面板,讓集群管理如此簡單

    ;{.spec.ports[0].nodePort}\") # 獲取Address echo http://$NODE_IP:$NODE_PORT 3.4 在華為Flexus服務(wù)器
    發(fā)表于 02-11 12:53

    硬件通脹下的生存戰(zhàn)!華為Flexus X服務(wù)器,讓中小企業(yè)不做“接盤俠”

    通知”成了企業(yè)IT采購的常態(tài)。 DRAM合同價(jià)同比暴漲171.8%,NAND Flash價(jià)格累計(jì)飆升246%,服務(wù)器整機(jī)采購成本上升15%-20%。硬件市場的瘋狂漲價(jià),正讓無數(shù)中小企業(yè)面臨“買得起用不起、想買卻沒貨”的絕境。而__華為
    的頭像 發(fā)表于 12-31 13:05 ?285次閱讀

    DRAM 暴漲 171%! 171% 下的企業(yè)突圍:華為 Flexus X 服務(wù)器成 IT 成本管控利器

    Flexus X 服務(wù)器憑借獨(dú)有的柔性算力黑科技與智能調(diào)度能力,助力企業(yè)實(shí)現(xiàn)核心應(yīng)用性能最高達(dá)友商 6 倍、綜合成本降低 30% 的雙
    的頭像 發(fā)表于 12-31 13:00 ?253次閱讀

    什么是企業(yè)服務(wù)器-計(jì)算

    地?cái)U(kuò)展和管理其IT基礎(chǔ)設(shè)施。華納的企業(yè)服務(wù)器基于虛擬化技術(shù),在環(huán)境中運(yùn)行多個(gè)虛擬服務(wù)器實(shí)例
    的頭像 發(fā)表于 12-29 17:57 ?789次閱讀

    如何快速在服務(wù)器部署Web環(huán)境?

    如何快速在服務(wù)器部署Web環(huán)境
    的頭像 發(fā)表于 10-14 14:16 ?661次閱讀

    DeepSeek模型如何在服務(wù)器部署?

    隨著大型語言模型(LLM)的應(yīng)用日益普及,許多開發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型部署到自己的服務(wù)器上,以實(shí)現(xiàn)私有化、定制化
    的頭像 發(fā)表于 10-13 16:52 ?940次閱讀

    Jtti服務(wù)器上怎么部署網(wǎng)站嗎

    在互聯(lián)網(wǎng)快速發(fā)展的今天,網(wǎng)站已經(jīng)成為公司和個(gè)人溝通和展示自我的重要渠道。無論是一個(gè)簡單的個(gè)人博客,還是一個(gè)復(fù)雜的電子商務(wù)平臺(tái),部署網(wǎng)站的過程都是相似的。服務(wù)器因其高可用性、靈活性和經(jīng)濟(jì)性,成為
    的頭像 發(fā)表于 09-26 17:16 ?1179次閱讀

    HarmonyOS5服務(wù)技術(shù)分享--Serverless抽獎(jiǎng)模板部署

    活動(dòng)。不用寫復(fù)雜代碼,跟著步驟走就能搞定,文末還有部署避坑指南哦~ 一、前期準(zhǔn)備 1?? ??注冊賬號(hào)+創(chuàng)建項(xiàng)目?? 先到華為開發(fā)者平臺(tái)注冊賬號(hào) 創(chuàng)建新項(xiàng)目時(shí)記得勾選\"開發(fā)
    發(fā)表于 05-22 20:25

    HarmonyOS5服務(wù)技術(shù)分享--ArkTS開發(fā)Node環(huán)境

    氣的方式探索這個(gè)功能,結(jié)尾還有實(shí)用總結(jié)和鼓勵(lì)彩蛋哦~? ? 一、HarmonyOS函數(shù)開發(fā):核心能力與價(jià)值 HarmonyOS的函數(shù)(Serverless)為開發(fā)者提供了??無服務(wù)器架構(gòu)??的便捷
    發(fā)表于 05-22 17:21

    電競服務(wù)器 工作原理

    電競服務(wù)器工作原理詳解 一、核心架構(gòu)原理 虛擬化資源池? 通過 ?KVM/VMware? 等虛擬化技術(shù)將物理服務(wù)器(含NVIDIA GPU集群)抽象為可動(dòng)態(tài)分配的算力資源池,每個(gè)用戶獨(dú)享獨(dú)立虛擬機(jī)
    的頭像 發(fā)表于 05-14 07:44 ?601次閱讀
    <b class='flag-5'>云</b>電競<b class='flag-5'>服務(wù)器</b> 工作原理

    基于RAKsmart服務(wù)器的AI大模型實(shí)時(shí)推理方案設(shè)計(jì)

    面對高并發(fā)請求、嚴(yán)格的響應(yīng)延遲要求及波動(dòng)的業(yè)務(wù)負(fù)載,傳統(tǒng)本地化部署的算力瓶頸愈發(fā)顯著。RAKsmart服務(wù)器憑借其彈性計(jì)算資源池、分布式網(wǎng)絡(luò)架構(gòu)與全棧AI加速能力,為AI大模型實(shí)時(shí)推
    的頭像 發(fā)表于 05-13 10:33 ?607次閱讀

    如何在RAKsmart服務(wù)器上實(shí)現(xiàn)企業(yè)AI模型部署

    AI模型的訓(xùn)練與部署需要強(qiáng)大的算力支持、穩(wěn)定的網(wǎng)絡(luò)環(huán)境和專業(yè)的技術(shù)管理。RAKsmart作為全球領(lǐng)先的服務(wù)器托管與計(jì)算服務(wù)提供商,已成為企
    的頭像 發(fā)表于 03-27 09:46 ?938次閱讀

    DeepSeek企業(yè)級(jí)部署服務(wù)器資源計(jì)算 以raksmart裸機(jī)服務(wù)器為例

    以RakSmart裸機(jī)服務(wù)器為例,針對DeepSeek企業(yè)級(jí)部署服務(wù)器資源計(jì)算指南,涵蓋GPU/CPU/內(nèi)存/存儲(chǔ)/網(wǎng)絡(luò)等核心維度的詳細(xì)計(jì)算方法與配置推薦,主機(jī)推薦小編為您整理發(fā)布
    的頭像 發(fā)表于 03-21 10:17 ?1078次閱讀

    RAKsmart美國裸機(jī)服務(wù)器DeepSeek的高級(jí)定制化部署方案

    在RAKsmart美國裸機(jī)服務(wù)器上進(jìn)行DeepSeek的高級(jí)定制化部署,需結(jié)合高性能硬件與靈活的軟件配置,以實(shí)現(xiàn)模型優(yōu)化、多任務(wù)并行及安全性提升。以下是針對企業(yè)級(jí)需求的詳細(xì)方案,主機(jī)
    的頭像 發(fā)表于 03-13 11:55 ?901次閱讀

    《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識(shí)庫

    應(yīng)用。第六章深入探討了RAG架構(gòu)的工作原理,該技術(shù)通過在推理過程中實(shí)時(shí)檢索和注入外部知識(shí)來增強(qiáng)模型的生成能力。RAG架構(gòu)的核心是檢索和生成器兩大模塊,檢索
    發(fā)表于 03-07 19:49