摘要
HyperLink為兩個KeyStone架構(gòu)DSP之間提供了一種高速,低延遲,引腳數(shù)量少的通信接口。HyperLink的用戶手冊已經(jīng)詳細的對其進行了描述。本文主要是為HyperLink的編程提供了一些額外的補充信息。
同時本文還討論了HyperLink的性能,提供了在各種操作條件下的性能測試數(shù)據(jù)。對影響HyperLink性能的一些參數(shù)進行了討論。
文章的最后附上對應(yīng)本文的應(yīng)用代碼。
1、HyperLink介紹
HyperLink為兩片DSP之間提供一種高速、低延遲,引腳數(shù)少的通信連接接口。
HyperLink的設(shè)計速度最高速率支持12.5Gbps,目前在大部分的KeyStone DSPs上,由于受限于SerDes和板級布線,速度接近為10Gbps.HyperLink是TI專有的外設(shè)接口。相對于用于高速Serdes接口的傳統(tǒng)的8b10b編碼方式,HyperLink減少了編碼冗余,編碼方式等效于8b9b.單片DSP為HyperLink提供4個SerDes通道,所以10Gbps的HyperLink理論吞吐率為10*4*(8/9)= 35.5Gbps= 4.44GB/s.
HyperLink使用了PCIE類似的內(nèi)存映射機制,但它為多核DSP提供了一些更靈活的特性。本文將會使用幾個范例來詳細解釋這一點。
本文還討論了HyperLink的性能,提供了在各種操作條件下的性能測試數(shù)據(jù)。對影響HyperLink性能的一些因素進行了討論。
2、HyperLink配置
本節(jié)提供了一些配置HyperLink模塊的補充信息。
2.1 Serdes配置
Serdes必須配置成期望的鏈接速度。圖1表示了輸入?yún)⒖?a href="http://m.makelele.cn/tags/時鐘/" target="_blank">時鐘和輸出時鐘之間的關(guān)系。

輸入?yún)⒖紩r鐘建議限制在156.25MHz ~312.5MHz范圍內(nèi)。Serdes PLL的倍頻系數(shù)必須合理配置生成的內(nèi)部時鐘(internal clock)限制在1.5625GHz ~ 3.125GHz范圍內(nèi)。
最后的鏈接速度由內(nèi)部時鐘(internal clock)驅(qū)動,通過link rate配置來得到。
2.2 HyperLink存儲映射配置
HyperLink的存儲映射非常的靈活。HyperLink的用戶手冊對此作了詳細的描述。本節(jié)將用兩個例子來詳細的解釋它。圖2是第一個例子。

圖2通過HyperLink窗口映射到遠端不同類型的存儲空間
在這個例子里面,DSP1的存儲空間映射到了DSP0的存儲空間窗口0x40000000~0x50000000DSP0可以訪問DSP1的所有內(nèi)存空間,包括LL2,SL2,DDR,就像訪問自己的本地的存儲空間一樣。在DSP0上,所有的Master都可以通過以0x40000000起始的Outbound窗口地址來訪問DSP1的存儲空間,但是不同master事實上可能訪問到DSP1上不同的存儲空間。原因是HyperLink發(fā)送側(cè)傳輸數(shù)據(jù)時,會將PrivID一起傳輸。接受側(cè)通過PrivID值,可以建立不同的地址映射表
對DSP0與DSP1的內(nèi)存映射關(guān)系總結(jié)在下表(表1)。

通過上表的配置,可知當DSP0的core 0/1訪問0x40800000,它事實上訪問了DSP1上的LL2地址空間。
當DSP0的core0訪問0x4D000000,它事實上訪問了DSP1上DDR的地址空間0x8C000000當DSP0的core1訪問0x4D000000,它事實上訪問了DSP1上DDR的地址空間0x8F000000與本文檔對應(yīng)的范例工程將HyperLink配置成上述的內(nèi)存映射關(guān)系。下面是關(guān)鍵部分的配置代碼。


對于一些簡單的應(yīng)用,可能只是想訪問遠程DSP的DDR空間,那么下面的例子用于這種情況。存儲映射關(guān)系如下圖所示。

圖3通過HyperLink窗口只映射到遠端的DDR空間
這是最簡單的例子,但是卻可以訪問遠端DSP的大塊存儲空間。DSP0上的每個master(core或者其他外設(shè))都可以可以訪問DSP1上256MB DDR空間。下表描述了core0和core1的對remote DSP DDR存儲映射。

3、HyperLink性能考慮
本節(jié)將讓設(shè)計者對HyperLink訪問遠程存儲空間的性能評估有基本的認識。同時提供了在不同的操作條件下獲得的性能測試數(shù)據(jù)。大部分測試是在最理想的測試條件進行,以評估可以獲得的最大吞吐量。
本文所描述的絕大部分性能數(shù)據(jù)是在C6670EVM上獲得。C6670 EVM上DDR配置成64bit位寬1333M,HyperLink速率配置成10Gbit.
一些影響HyperLink訪問性能的因素在本節(jié)中將會被討論到。
3.1通過HyperLink實現(xiàn)存儲拷貝的性能
下表(表3)描述了使用HyperLink在LL2與遠程大塊線性存儲空間進行數(shù)據(jù)傳送測試獲得的傳輸帶寬。傳輸塊的大小為64KB.帶寬的計算是通過計算傳輸總的字節(jié)數(shù)除以傳輸所用的時間獲得。

電子發(fā)燒友App






評論