一区二区三四五区日日骚,天堂AV网址一区二区三区

各式各樣的加速器在當(dāng)下的計算架構(gòu)中越來越普遍，HPC、數(shù)據(jù)中心等高端應(yīng)用開始追求更高的峰值性能，用到了專業(yè)GPU、AI加速器，而手機(jī)、嵌入式系統(tǒng)開始追求更高的能效，也在其SoC、MCU中加入一定的嵌入式加速硬件。但與此同時，這樣復(fù)雜的多廠商、多架構(gòu)和多硬件生態(tài)，為編程帶來了巨大的難題。但CUDA作為只面向英偉達(dá)GPU的封閉軟件生態(tài)，其熱度卻水漲船高。

?
提及各大編程語言的論文數(shù)量/ 谷歌學(xué)術(shù)

在軟件開發(fā)中，一個開放的標(biāo)準(zhǔn)層就是開發(fā)者產(chǎn)品方案的接口規(guī)范，同樣的，處理器開發(fā)商們可以使用基于開放標(biāo)準(zhǔn)層的底層軟件驅(qū)動創(chuàng)造解決方案。如此一來軟件開發(fā)者們無需捆綁在特定的硬件方案上，硬件開發(fā)者的硬件不僅可以兼顧自己維護(hù)的軟件，還能支持到更多的軟件開發(fā)人員。而且在普及之后，開發(fā)人員的技能更加具有普適性，他們可以方便地使用自己熟悉的開發(fā)工具。

對使用開放標(biāo)準(zhǔn)的軟硬件公司來說，此舉可以加快產(chǎn)品上市時間，減少長期維護(hù)工作，而且在軟件方案廠商日益劇增的當(dāng)下，業(yè)界已經(jīng)普遍接受了開放標(biāo)準(zhǔn)，就像RISC-V一樣，英特爾、AMD甚至是英偉達(dá)也都對開放標(biāo)準(zhǔn)的定義做出了貢獻(xiàn)，對于一些初創(chuàng)企業(yè)來說就更是如此了。

SYCL出世

從市場反饋來看，開發(fā)者的需求很明顯了，他們想要一個標(biāo)準(zhǔn)的編程模型，擁有標(biāo)準(zhǔn)運(yùn)算庫、對Pytorch、Tensorflow等AI框架的支持、性能分析工具，以及對多個廠商不同硬件架構(gòu)的支持，而這些需求匯聚在一起，使得開放標(biāo)準(zhǔn)聯(lián)盟Khronos Group聯(lián)合旗下成員打造出了SYCL這一編程語言。

SYCL作為跨越CPU、GPU、FPGA和AI加速器等多種架構(gòu)的一致性編程語言，每個架構(gòu)能單獨或整合編程。SYCL編程語言與其API擴(kuò)展能用于不同的開發(fā)用例，比如負(fù)載加速或異構(gòu)計算應(yīng)用，將現(xiàn)有的C、C++或其他加速器語言代碼轉(zhuǎn)換成SYCL代碼。

?
SYCL的支持情況/ Khronos Group

在不同廠商的支持下，SYCL的實施方式有多種，他們增加了對OpenCL以外不同加速API后端的支持，比如Codeplay的ComputeCpp、英特爾的DPC++、AMD的hipSYCL以及Xilinx的triSYCL等。

英特爾的SYCL之路

英特爾對于SYCL的重視可以說顯而易見了，自從宣布轉(zhuǎn)向XPU+oneAPI的路線之后，英特爾就已經(jīng)與SYCL深度綁定了。不僅微軟、谷歌等巨頭宣布支持oneAPI，英特爾也和中科院計算所在內(nèi)的大型研究所、國家實驗室和大學(xué)合作成立了oneAPI卓越中心，借助他們的oneAPI開源代碼，進(jìn)一步擴(kuò)展oneAPI產(chǎn)品與規(guī)范。

oneAPI的核心則是其編程語言DPC++，英特爾的DPC++可以說是SYCL的超集，不僅包含了SYCL標(biāo)準(zhǔn)，還包含一些功能擴(kuò)展，比如統(tǒng)一共享內(nèi)存等，不過目前其中不少擴(kuò)展也已經(jīng)并入了SYCL新版規(guī)范中。

不過SYCL遠(yuǎn)不僅是為了方便英特爾建設(shè)其跨架構(gòu)的軟件生態(tài)，而是為了打破CUDA的統(tǒng)治，打造一個更加開放的軟硬件生態(tài)，這點從英特爾在oneAPI的開發(fā)動向就能看出。

此前英特爾對于CUDA并沒有任何動作，反倒是其競爭對手AMD推出了HIP，幫助開發(fā)者將CUDA代碼移植至AMD平臺上，畢竟AMD還得發(fā)展GPU生態(tài)。但隨著英特爾的硬件路線已經(jīng)不單單是CPU，而是CPU、GPU、FPGA、IPU和AI加速器的多硬件異構(gòu)生態(tài)，這時候打造一個CUDA之外的軟件生態(tài)是提升其產(chǎn)品競爭力的必經(jīng)之路了。

為了更好實現(xiàn)對CUDA代碼的移植，英特爾推出了DPC++兼容性工具（DPCT），目前版本的DPCT已經(jīng)可以將90%到95%的CUDA代碼轉(zhuǎn)換成SYCL。不過這只是一個理想范圍，具體數(shù)值還是取決于代碼對應(yīng)的工作負(fù)載。對于簡單的CUDA程序來說，完成DPC++的移植只需要對CUDA源文件運(yùn)行這一轉(zhuǎn)換工具即可，相對復(fù)雜的CUDA程序還是需要一定的手動編程優(yōu)化。

今年6月，英特爾公布消息，決定收購Codeplay公司。要說對SYCL的研究，除了英特爾以外，最深入的當(dāng)屬Codeplay了，畢竟就連SYCL工作組的主席也是來自Codeplay的杰出工程師MichaelWong。Codeplay不僅提供了多種處理器上SYCL的支持，也支持將CUDA代碼移植為SYCL，同時保證SYCL代碼在英偉達(dá)GPU上的繼續(xù)運(yùn)行，還能調(diào)用一些CUDA庫。

Codeplay的方案支持覆蓋英特爾、AMD、英偉達(dá)的處理器，而且他們也開始了對汽車ADAS（瑞薩R-Car）、邊緣計算設(shè)備（ImaginationPowerVR）與RISC-V處理器（晶心科技NX27V）的支持開發(fā)工作。后三者恰好是SYCL當(dāng)前未曾開拓的市場，但卻是英特爾正在發(fā)力的三大市場，加上Codeplay本身在HPC、AI上的軟件開發(fā)實力，如此看來，英特爾收購Codeplay完全符合其戰(zhàn)略目標(biāo)。

結(jié)語

盡管SYCL的構(gòu)想是好的，其發(fā)展路線也是傾向于開發(fā)者，但這并不代表著就一定能取代CUDA的位置，畢竟SYCL其實也才誕生沒多久，與CUDA、OpenCL或OpenMP相比生態(tài)發(fā)展還沒有成熟。再者就是統(tǒng)一各種硬件的編程并沒有那么簡單，正如英偉達(dá)CEO黃仁勛曾經(jīng)提出的質(zhì)疑：時間會揭曉一個編程方法是否能兼容七種不同的處理器，至少歷史上從未出現(xiàn)過。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴