91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運行

英特爾物聯(lián)網(wǎng) ? 來源:OpenVINO 中文社區(qū) ? 2024-05-10 10:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大語言模型推理的改進

LLM 的發(fā)展仍保持著驚人的速度。盡管現(xiàn)有的 LLM 已經(jīng)具備強大的功能,但通過 OpenVINO 的優(yōu)化和推理加速,可以對這些復雜模型的執(zhí)行進行精煉,實現(xiàn)更快、更高效的處理,減少計算開銷并最大限度發(fā)揮硬件潛力,這將直接導致 LLM 實現(xiàn)更高的吞吐量和更低的延遲。

通過采用壓縮嵌入實現(xiàn)額外優(yōu)化,有效地縮減了 LLM 的編譯耗時與內(nèi)存占用。與此同時,基于英特爾銳炫GPU,以及英特爾高級矩陣擴展(Intel AMX)的第4代和第5代英特爾至強平臺之上,LLM 的第一個 token 處理性能得到了顯著提升。

通過 oneDNN 可實現(xiàn)更好的 LLM 壓縮與性能提升。如今,經(jīng)過量化或壓縮后的 INT4 和 INT8 精度的 LLM 可在英特爾銳炫GPU 上得到支持。在搭載集成 GPU 的英特爾酷睿Ultra 處理器上,針對部分小型 GenAI 模型顯著減少了內(nèi)存消耗。

此外,現(xiàn)在可以在 PyTorch 模型進行訓練后量化之后,對其進行微調(diào),以提高模型精度并簡化從訓練后量化過渡到訓練感知量化的過程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆蓋范圍和框架集成

進一步深入了解搭載 OpenVINO 的生成式 AI,該新版本拓寬了生成式AI的邊界,使其能夠覆蓋更廣泛的神經(jīng)網(wǎng)絡(luò)架構(gòu)與應用場景。

針對最新發(fā)布的最先進的 Llama 3 和 Phi3 模型, OpenVINO 對其實現(xiàn)了支持和優(yōu)化。

具備混合專家(MoE)架構(gòu)的 LLM 模型 Mixtral 以及 URLNet 模型,均針對英特爾至強處理器進行了性能提升優(yōu)化。

文生圖模型 Stable Diffusion 1.5,以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,則專為搭載了集成 GPU 的英特爾酷睿Ultra 處理器進行了推理速度的改進和優(yōu)化。

現(xiàn)在,OpenVINO 已支持 Falcon-7B-Instruct,這是一款即用型、具備優(yōu)秀性能指標的生成式AI大語言模型,適用于聊天與指令場景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及帶有 OpenVINO 和 LangChain 的 RAG 系統(tǒng)。

我們還在 OpenVINO Notebooks 存儲庫中提供了 Jupyter Notebook 示例。

新平臺的更改和現(xiàn)有平臺的增強

除了 PyPI 上的主 OpenVINO 軟件包外,英特爾酷睿Ultra 處理器的預覽 NPU 插件現(xiàn)在在 OpenVINO 開源 GitHub 存儲庫中可用。

現(xiàn)在,可以通過 npm 存儲庫更輕松地訪問 JavaScript API,使 JavaScript 開發(fā)人員能夠無縫訪問 OpenVINO API。我們擴展了文檔,可幫助開發(fā)人員將他們的 JavaScript 應用程序與 OpenVINO 集成。

現(xiàn)在,默認情況下已在 ARM 處理器上為卷積神經(jīng)網(wǎng)絡(luò)(CNN)啟用 FP16 推理。在多種 ARM 設(shè)備上,已顯著提升了眾多模型的性能。已實現(xiàn)與 CPU 架構(gòu)無關(guān)的構(gòu)建,旨在為不同 ARM 設(shè)備提供統(tǒng)一的二進制分發(fā)。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有價值的資源,用于展示如何利用 OpenVINO 在人工智能領(lǐng)域?qū)崿F(xiàn)重要進展。最近,我們對 OpenVINO notebooks 存儲庫做了一些改動,包括將默認分支從 'main' 更改為 'latest',以及對 "notebooks" 文件夾內(nèi) notebook 的命名結(jié)構(gòu)進行了改進。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6516
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    538

    瀏覽量

    1085
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    767

原文標題:解鎖 LLM 新高度,拓寬模型新邊界 —— OpenVINO? 2024.1 賦能生成式 AI 高效運行 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI定義座艙新高度|搭載天璣座艙S1 Ultra的奇瑞風云T9L

    」推向「AI 定義座艙」的新高度。 旗艦算力 構(gòu)建車載 AI 的基礎(chǔ) ? 風云 T9L 搭載的 MediaTek 天璣座艙 S1 Ultra 采用先進的 3nm 制程工藝,這是其能夠平穩(wěn)運行
    的頭像 發(fā)表于 02-12 16:19 ?2531次閱讀
    <b class='flag-5'>AI</b>定義座艙<b class='flag-5'>新高度</b>|搭載天璣座艙S1 Ultra的奇瑞風云T9L

    生成AI虛擬調(diào)試——fe.screen-sim的架構(gòu)價值

    生成AI虛擬調(diào)試——fe.screen-sim的架構(gòu)價值
    的頭像 發(fā)表于 12-04 14:59 ?974次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>賦</b><b class='flag-5'>能</b>虛擬調(diào)試——fe.screen-sim的架構(gòu)價值

    搭載新潔NCE1216,解鎖高效應用新可能

    在電子技術(shù)蓬勃發(fā)展的當下,功率半導體器件已成為推動電子系統(tǒng)高效運行的關(guān)鍵力量。搭載新潔NCE1216,以其卓越的性能和廣泛的應用場景,解鎖高效
    的頭像 發(fā)表于 10-25 16:05 ?671次閱讀
    搭載新潔<b class='flag-5'>能</b>NCE1216,<b class='flag-5'>解鎖</b><b class='flag-5'>高效</b>應用新可能

    AI6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    需求?傳統(tǒng)網(wǎng)絡(luò)會因流量激增而擁堵,而AI的6G網(wǎng)絡(luò)則能提前預測流量模式,動態(tài)調(diào)整資源分配。 AI算法能夠?qū)崟r分析海量數(shù)據(jù),包括用戶位置、網(wǎng)絡(luò)負載、歷史流量模式等。在2025年上海世
    發(fā)表于 10-11 16:01

    燃料電池負載均衡測試:解鎖高效密碼

    整理、繪圖,直觀呈現(xiàn)燃料電池在不同負載下的特性曲線。通過對比不同階段的數(shù)據(jù),精準定位潛在問題所在,為后續(xù)改進提供依據(jù)。 通過這套嚴謹?shù)呢撦d均衡測試方案,能夠全方位評估燃料電池的性能表現(xiàn),及時發(fā)現(xiàn)并解決隱患,助力燃料電池技術(shù)邁向新高度,在清潔能源應用中發(fā)揮更大效能。
    發(fā)表于 09-18 13:51

    AI生成的測試用例真的靠譜嗎?

    的身影無處不在。尤其在測試用例生成這一傳統(tǒng)上高度依賴人工經(jīng)驗的環(huán)節(jié),AI展現(xiàn)出令人驚艷的能力——快速、高效、“看起來很專業(yè)”。于是,很多測試團隊紛紛嘗試用
    的頭像 發(fā)表于 08-01 10:02 ?1743次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>生成</b>的測試用例真的靠譜嗎?

    使用 llm-agent-rag-llamaindex 筆記本時收到的 NPU 錯誤怎么解決?

    使用 conda create -n ov-nb-demos python=3.11 創(chuàng)建運行 llm-agent-rag-llamaindex notebook 的環(huán)境。 執(zhí)行“創(chuàng)建
    發(fā)表于 06-23 06:26

    vivo Pad5 Pro搭載MediaTek天璣9400處理器

    vivo Pad5 Pro 搭載天璣 9400 旗艦芯,實現(xiàn)效、AI 全面進階,解鎖平板體驗新高度
    的頭像 發(fā)表于 06-05 14:15 ?1353次閱讀

    利用NVIDIA 3D引導生成AI Blueprint控制圖像生成

    AI 的圖像生成技術(shù)突飛猛進,從早期模型會生成手指過多的人類圖像,到現(xiàn)在創(chuàng)造出令人驚嘆的逼
    的頭像 發(fā)表于 06-05 09:24 ?890次閱讀

    2.5MW全球首發(fā),綠慧充引領(lǐng)行業(yè)新高度!

    ,它以雙兆瓦級系統(tǒng)架構(gòu)與全場景兼容能力,革新大功率充電技術(shù)標準,引領(lǐng)行業(yè)新高度。01智能投切全場景功率適配產(chǎn)品單機功率達2.5MW,通過智能投切技術(shù)動態(tài)分配功率,
    的頭像 發(fā)表于 04-25 12:18 ?1187次閱讀
    2.5MW全球首發(fā),綠<b class='flag-5'>能</b>慧充引領(lǐng)行業(yè)<b class='flag-5'>新高度</b>!

    JH-ECT003疆鴻智能EtherCAT轉(zhuǎn)Modbus TCP協(xié)議網(wǎng)關(guān)高效醫(yī)療設(shè)備互聯(lián)

    TCP雙向互通能力,為醫(yī)療器械行業(yè)提供了一套靈活、可靠的數(shù)據(jù)整合方案,助力醫(yī)療設(shè)備邁向智能化新高度。 一、技術(shù):打破協(xié)議壁壘,構(gòu)建智能醫(yī)療網(wǎng)絡(luò) 醫(yī)療設(shè)備種類繁多,既有支持 EtherCAT協(xié)議 的高精度影像設(shè)備(如CT、M
    的頭像 發(fā)表于 04-17 15:40 ?602次閱讀
    JH-ECT003疆鴻智能EtherCAT轉(zhuǎn)Modbus TCP協(xié)議網(wǎng)關(guān)<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>高效</b>醫(yī)療設(shè)備互聯(lián)

    陶瓷圍壩:解鎖電子封裝領(lǐng)域防護新高度的關(guān)鍵

    電子封裝技術(shù)作為電子產(chǎn)業(yè)發(fā)展的基石,其防護性能直接關(guān)乎電子設(shè)備的可靠性與穩(wěn)定性。陶瓷圍壩憑借其獨特的材料特性和結(jié)構(gòu)優(yōu)勢,在電子封裝防護領(lǐng)域嶄露頭角,成為解鎖防護新高度的關(guān)鍵要素。本文深入剖析陶瓷圍壩在電子封裝中的作用、優(yōu)勢及發(fā)展趨勢,旨在揭示其對電子封裝領(lǐng)域的重要意義……
    的頭像 發(fā)表于 03-24 17:10 ?665次閱讀

    精準降噪,智控未來——振動噪聲測試儀LMS工業(yè)智造新高度

    在工業(yè)設(shè)備高速發(fā)展的今天,振動與噪聲問題已成為影響產(chǎn)品性能、用戶體驗及市場競爭力的關(guān)鍵因素。無論是新能源汽車電機異響、家電設(shè)備運行噪音,還是航空航天精密儀器的振動超標,高效精準的測試與分析技術(shù)是突破
    的頭像 發(fā)表于 03-20 10:36 ?1690次閱讀
    精準降噪,智控未來——振動噪聲測試儀LMS<b class='flag-5'>賦</b><b class='flag-5'>能</b>工業(yè)智造<b class='flag-5'>新高度</b>

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入開發(fā)

    助力 AI、智能制造和物聯(lián)網(wǎng)行業(yè)的發(fā)展。未來,Banana Pi 將繼續(xù)深化與Renesas的技術(shù)合作,推動更多高性能嵌入解決方案的落地。 ” BPI-AI2N開發(fā)板
    發(fā)表于 03-19 17:54

    利用OpenVINO GenAI解鎖LLM極速推理

    隨著 DeepSeek、 GPT 和 Llama 等大語言模型(LLMs)不斷推動人工智能的邊界,它們在高效部署方面也帶來了重大挑戰(zhàn)。這些模型在生成類似人類的文本方面具有革命性,但每生成一個
    的頭像 發(fā)表于 03-18 14:09 ?1100次閱讀
    利用<b class='flag-5'>OpenVINO</b> GenAI<b class='flag-5'>解鎖</b><b class='flag-5'>LLM</b>極速推理