英偉達近日宣布,其DeepSeek R1 671b版本已正式上線英偉達NIM(NVIDIA Inference Microservices)平臺,并以預覽版的形式在build.nvidia.com網(wǎng)站上發(fā)布。
據(jù)悉,DeepSeek R1 NIM微服務(wù)是英偉達在人工智能領(lǐng)域的一項重要創(chuàng)新,旨在為用戶提供高效、精準的推理服務(wù)。在單個英偉達HGX H200系統(tǒng)上,該微服務(wù)每秒最多可處理3872個token,展現(xiàn)出強大的處理能力和高效性。
此次上線的DeepSeek R1 NIM微服務(wù)預覽版,允許開發(fā)人員對其進行測試和實驗,以更好地了解其性能和功能。英偉達表示,未來該API將作為英偉達AI Enterprise軟件平臺的一部分,以可下載的NIM微服務(wù)形式正式推出,為用戶提供更加便捷、高效的使用體驗。
英偉達一直致力于推動人工智能技術(shù)的發(fā)展和應用,此次發(fā)布的DeepSeek R1 NIM微服務(wù)預覽版,不僅展示了英偉達在人工智能領(lǐng)域的強大技術(shù)實力,也為用戶提供了更加高效、精準的推理服務(wù)。
-
軟件
+關(guān)注
關(guān)注
69文章
5331瀏覽量
91561 -
NIM
+關(guān)注
關(guān)注
0文章
10瀏覽量
8254 -
人工智能
+關(guān)注
關(guān)注
1817文章
50091瀏覽量
265207 -
英偉達
+關(guān)注
關(guān)注
23文章
4084瀏覽量
99160 -
DeepSeek
+關(guān)注
關(guān)注
2文章
835瀏覽量
3249
發(fā)布評論請先 登錄
百度騰訊搶灘布局!DeepSeek-R1升級和開源背后,國產(chǎn)AI的逆襲之路
DeepSeek R1 MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化
如何在NVIDIA Blackwell GPU上優(yōu)化DeepSeek R1吞吐量
速看!EASY-EAI教你離線部署Deepseek R1大模型
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】書籍介紹+第一章讀后心得
DeepSeek開源新版R1 媲美OpenAI o3
DeepSeek創(chuàng)始人梁文鋒入選《時代》最具影響力100人
SL1680 SoC本地運行DeepSeek R1 1.5B大模型
科大訊飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本
英偉達、高通布局AI投資版圖,這些明星企業(yè)被收入囊中!
【幸狐Omni3576邊緣計算套件試用體驗】DeepSeek 部署及測試
顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本部署 DeepSeek R1 32B 蒸餾模型體驗
如何使用OpenVINO運行DeepSeek-R1蒸餾模型
英偉達發(fā)布DeepSeek R1于NIM平臺
評論