91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種在分布式環(huán)境下實現(xiàn)冪迭代聚類的方法

大小:0.69 MB 人氣: 2017-12-11 需要積分:1

  為解決冪迭代聚類算法并行實現(xiàn)中存在的編程繁瑣、效率低下等問題,基于Spark大規(guī)模數(shù)據(jù)通用計算引擎及其GraphX組件,提出了一種在分布式環(huán)境下實現(xiàn)冪迭代聚類的方法。首先,利用某種相似性度量方法,將原始數(shù)據(jù)轉換成一個可以視為圖的親和矩陣;然后,通過頂點切割,把行歸一化后的親和矩陣切分成若干個小圖,分別存儲在不同的機器上;最后,利用Spark基于內存計算的特點,對存儲在集群中的圖進行多次迭代計算,得到這個圖的一個切割,圖的每一個劃分子圖對應一個類簇。在不同規(guī)模的數(shù)據(jù)集和不同executor個數(shù)下進行的實驗結果表明,基于GraphX的分布式冪迭代聚類算法具有良好的可擴展性,算法運行時間與executor個數(shù)呈負相關的線性關系,在6個executor下,與單個executor相比,算法的加速比達到了2.09到3.77。同時,通過與基于Hadoop的冪迭代聚類進行對比,在新聞數(shù)量為40000篇時,運行時間降低了6l%。

一種在分布式環(huán)境下實現(xiàn)冪迭代聚類的方法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?