91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高層次綜合在FPGA設計中的價值與局限

FPGA技術江湖 ? 來源:OpenFPGA ? 2026-02-27 15:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于OpenFPGA,作者碎碎思

在 FPGA 設計的世界里,有兩條常見的“修煉之路”:

一條是“硬核派”,直接用 Verilog/VHDL 寫 RTL,控制信號級細節(jié),精打細算每個資源。

另一條是“快刀派”,使用 HLS(High Level Synthesis,高層次綜合),用 C/C++/SystemC 甚至 Python 這樣的高級語言,快速描述算法,再交給工具自動生成 RTL。

這兩條路各有千秋。今天我們就來聊聊:HLS 到底能帶來什么價值?又有哪些局限?

一、HLS 的價值:讓算法更快上 FPGA

在很多場景下,HLS 是救命稻草。比如:

圖像處理

假設你想實現(xiàn)一個 3×3 卷積濾波。如果用 RTL 寫,你要手工管理 line buffer、滑動窗口、流水線延遲,寫起來又長又繁瑣。

但用 HLS,只需要一段 C 代碼:

for(i = 1; i < ROWS-1; i++) {
? ??for?(j = 1; j < COLS-1; j++) {
? ? ? ? sum = 0;
? ? ? ??for?(m = -1; m <= 1; m++) {
? ? ? ? ? ??for?(n = -1; n <= 1; n++) {
? ? ? ? ? ? ? ? sum += img[i+m][j+n] * kernel[m+1][n+1];
? ? ? ? ? ? }
? ? ? ? }
? ? ? ? out[i][j] = sum;
? ? }
}

再加幾句 pragma(比如#pragmaHLS PIPELINE、#pragmaHLS ARRAY_PARTITION),工具就能幫你生成流水線化的 RTL。

算法驗證速度快

用 C 級別的仿真,速度可能比 RTL 仿真快 100~1000 倍。比如 FFT、矩陣乘法這種大規(guī)模計算,用 RTL 仿真等一下午,用 HLS 可能幾分鐘就能跑完。

縮短產品迭代周期

很多團隊用 HLS 來快速驗證算法可行性,甚至直接拿 HLS 輸出的 RTL 投產。對于初創(chuàng)公司或者科研項目,能快點出 Demo,就是最大的價值。

二、HLS 的局限:不是萬能的鑰匙

不過,HLS 并不是“寫幾行 C 代碼,點點按鈕就能跑滿資源”的神器,它有幾個明顯的局限:

資源和性能不可控

RTL 設計師可以明確指定每個寄存器、DSP、BRAM 的用途;

HLS 則依賴工具的推斷。結果可能多用了 20% 的 LUT,或者時鐘頻率達不到要求。

舉個例子:

用 HLS 寫 AES 加密核,綜合后時鐘頻率只有 120MHz;換成手寫 RTL,同樣邏輯能跑到 250MHz,且資源下降一半。

算法友好,接口復雜就麻煩

HLS 擅長描述算法,比如矩陣運算、濾波、信號處理;

但當你要和 AXI 總線交互,或者寫 PCIe 協(xié)議棧時,HLS 就顯得力不從心。工具雖然支持 AXI4 接口自動生成,但復雜協(xié)議邏輯(比如 TLP 解碼)還是 RTL 更適合。

調優(yōu)需要經驗

新手寫 HLS,可能以為“C 代碼跑得快 = FPGA 上也快”。

結果綜合出來的電路一片 stall,性能還不如 CPU。

想寫出高效 HLS,需要了解流水線、并行度、內存帶寬等硬件特性,這一點和寫 RTL 沒本質區(qū)別。

三、實際項目中的選擇

我們可以總結成一句話:

HLS 用來加速“算法類模塊”,RTL 用來保證“接口和系統(tǒng)級可靠性”。

比如一個視頻處理系統(tǒng):

圖像濾波、邊緣檢測 → HLS 最快上手,改 kernel 換算法也方便;

AXI-Stream 視頻數(shù)據(jù)搬運、時序控制 → RTL 最靠譜,避免 HLS 生成一堆“黑盒”邏輯導致調試困難。

再比如機器學習推理:

矩陣乘法、卷積核 → HLS 表達簡潔,容易改數(shù)據(jù)寬度或并行度;

DDR 控制器接口、PCIe DMA 引擎 → RTL 手寫更穩(wěn)。

四、未來趨勢:HLS 與 RTL 融合

目前業(yè)界主流的做法是:

算法級 → HLS 實現(xiàn),減少開發(fā)時間;

接口/控制級 → RTL 手寫,保證系統(tǒng)穩(wěn)定;

最終在同一個 Vivado/Quartus 工程里,把 HLS 輸出的 IP 和手寫 RTL 混合使用。

像 Xilinx 的 Vitis HLS 就是這種思路:讓軟件工程師快速寫出硬件加速核,再交給硬件工程師接入系統(tǒng)。

總結

HLS 幫助我們 快:快速建模、快速驗證、快速迭代。

RTL 幫助我們 準:精確控制、極致性能、穩(wěn)定接口。

在實際項目里,兩者不是對立的,而是 互補的搭檔。

如果你是軟件背景,HLS 是進入 FPGA 世界的捷徑; 如果你是硬件老兵,HLS 也能成為你提高效率的工具,但不能替代 RTL 的價值。

問題留給大家: 你們項目里有嘗試過用 HLS 嗎?最后是堅持用,還是又回到 RTL?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22406

    瀏覽量

    636073
  • python
    +關注

    關注

    57

    文章

    4876

    瀏覽量

    90012
  • HLS
    HLS
    +關注

    關注

    1

    文章

    135

    瀏覽量

    25823

原文標題:從 HLS 到 RTL:高層次綜合在 FPGA 設計中的價值與局限

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    HLS設計的BRAM使用優(yōu)勢

    高層次綜合(HLS)是一種將高級編程語言(如C、C++或SystemC)轉換為硬件描述語言(HDL)的設計方法。在FPGA設計,設計者可以靈活地利用
    的頭像 發(fā)表于 01-28 14:36 ?235次閱讀

    通過vivado HLS設計一個FIR低通濾波器

    Vivado HLS是一款強大的高層次綜合工具,可將C/C++代碼轉換為硬件描述語言(HDL),顯著提升FPGA開發(fā)效率。
    的頭像 發(fā)表于 01-20 16:19 ?295次閱讀
    通過vivado HLS設計一個FIR低通濾波器

    使用三菱Q系列和FX2N系列進行CC-Link通訊

    CC-Link(Control &Communication Link,控制與通信鏈路系統(tǒng)),是三菱電機推出的開放式現(xiàn)場總線,其數(shù)據(jù)容量大,通信速度多級可選擇,而且它是一個以設備層為主的網絡,同時也可覆蓋較高層次的控制層和較低層次的傳感層。
    的頭像 發(fā)表于 01-12 16:20 ?2318次閱讀
    使用三菱Q系列和FX2N系列進行CC-Link通訊

    智能光伏時代:&quot;四可&quot;技術如何提升電站綜合價值

    當光伏產業(yè)從“規(guī)模擴張”邁入“質量競爭”的智能時代,電站的價值評價標準已不再局限于裝機容量與發(fā)電量,而是延伸至安全可靠性、能源利用效率、多元收益能力與運維管理水平構成的“綜合價值體系”
    的頭像 發(fā)表于 11-28 16:35 ?2013次閱讀
    智能光伏時代:&quot;四可&quot;技術如何提升電站<b class='flag-5'>綜合</b><b class='flag-5'>價值</b>

    開源RISC-V處理器(蜂鳥E203)學習(二)修改FPGA綜合環(huán)境(移植到自己的Xilinx FPGA板卡)

    移植到自己的板卡上。 2.運行原FPGA工程 進入到FPGA目錄下; gvim打開“README.md”文件,下面就是FPGA綜合的命令。 這里以最后一個:artydevkit
    發(fā)表于 10-31 08:46

    一些神經網絡加速器的設計優(yōu)化方案

    的 200 倍,所以設計多層次訪存的目的也是為了減少高層次數(shù)據(jù)訪問的開銷。 如果一個輸入數(shù)據(jù)值被重復用于許多操作,理想情況下,該值從 DRAM 移到 RF 一次, ALU 從 RF 多次讀取。然后
    發(fā)表于 10-31 07:14

    FPGA開發(fā)板vivado綜合、下載程序問題匯總

    在做vivado綜合時和FPGA下載程序時,我們碰到以下問題,并找出了對應的解決方案。 1.could not open include file”e203_defines.v”問題 在做
    發(fā)表于 10-24 07:12

    龍芯中科攜手中西部高校構筑人才培養(yǎng)高地

    如何面向未來科技發(fā)展趨勢和國家重大戰(zhàn)略需求,為中西部地區(qū)培養(yǎng)能夠突破關鍵領域“卡脖子”難題的高層次人才?近日,龍芯中科攜手中西部高校,給出了自己的回答。
    的頭像 發(fā)表于 10-09 14:04 ?586次閱讀

    實現(xiàn)電纜綜合在線監(jiān)測的方法

    在線監(jiān)測這種方法相較于定期檢測,能更及時、有效并提前發(fā)現(xiàn)設備在運行存在的隱患問題。電纜綜合監(jiān)測實現(xiàn)了從傳統(tǒng)定期檢測到實時在線監(jiān)測的轉變,這種轉變在很大程度上提升了運維效率和系統(tǒng)可靠性,因此在
    的頭像 發(fā)表于 07-29 09:46 ?1049次閱讀
    實現(xiàn)電纜<b class='flag-5'>綜合在</b>線監(jiān)測的方法

    適用于SystemC/C++驗證的形式化解決方案

    雖然 SystemC/C++ 編程風格已使用多年,但最近出現(xiàn)了一些特定使用模式,它們推動工程團隊采用共同的設計流程。這包括抽象算法設計代碼用作高層次綜合 (HLS) 工具的輸入,虛擬平臺模型用于早期軟件測試,可配置的知識產權 (IP) 模塊,等等。
    的頭像 發(fā)表于 06-24 11:07 ?1263次閱讀
    適用于SystemC/C++驗證的形式化解決方案

    停止將AI局限于個人效率提升的用途

    停止將AI局限于個人效率提升的用途:60%的領導者轉向代理自動化,實現(xiàn)真正的企業(yè)價值 新研究證實Copilot成本效益局限,推動市場對加速自動化進程的受治理、流程化AI解決方案的需求 加州圣何塞
    的頭像 發(fā)表于 06-23 09:36 ?407次閱讀

    EDA是什么,有哪些方面

    仿真、時序分析等工具驗證設計正確性,避免實際制造的錯誤]。 邏輯綜合與優(yōu)化:將高層次設計轉換為門級網表,進行邏輯優(yōu)化、功耗分析和時序約束處理,提升設計性能。 物理設計:包括布局布線、版圖設計、設計規(guī)則
    發(fā)表于 06-23 07:59

    一等獎獎金30萬元!江西省首屆高層次人才創(chuàng)新創(chuàng)業(yè)大賽新能源(未來能源)專題賽火熱報名

    江西省首屆高層次人才創(chuàng)新創(chuàng)業(yè)大賽 新能源(未來能源)專題賽 才聚江西·創(chuàng)贏未來 為大力推進以賽引才,根據(jù)全省統(tǒng)一部署,宜春市將承辦江西省首屆高層次人才創(chuàng)新創(chuàng)業(yè)大賽新能源(未來能源)專題賽。具體情況
    的頭像 發(fā)表于 06-16 17:19 ?746次閱讀

    【「零基礎開發(fā)AI Agent」閱讀體驗】+ 入門篇學習

    +主動規(guī)劃+工具使用 2.AI Agent是高層次的AI應用 3.提示詞萬能公式=角色+角色技能+任務的核心關鍵詞+任務目標+任務背景+任務范圍+任務解決與否判定+任務限定條件+輸出格式/形式+輸出量
    發(fā)表于 05-02 09:26

    四創(chuàng)電子召開人工智能應用研究中心成立大會

    近日,四創(chuàng)電子召開人工智能應用研究中心成立大會暨揭牌儀式,公司黨委、經營班子成員,子公司、各部門負責人,高層次人才及相關員工代表參加會議。
    的頭像 發(fā)表于 04-18 17:12 ?1107次閱讀