完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > spark
Apache Spark 是專(zhuān)為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎。Spark是UC Berkeley AMP lab (加州大學(xué)伯克利分校的AMP實(shí)驗(yàn)室)所開(kāi)源的類(lèi)Hadoop MapReduce的通用并行框架,Spark,擁有Hadoop MapReduce所具有的優(yōu)點(diǎn);
文章:63個(gè) 瀏覽:21245次 帖子:53個(gè)
NVIDIA DGX Spark系統(tǒng)恢復(fù)過(guò)程與步驟
在使用 NVIDIA DGX Spark 的過(guò)程中,可能會(huì)出現(xiàn)配置故障,而導(dǎo)致開(kāi)發(fā)中斷的問(wèn)題,本篇教程將帶大家了解如何一步步完成系統(tǒng)恢復(fù)。
2025-11-28 標(biāo)簽:NVIDIA操作系統(tǒng)SSD 5.2k 0
在NVIDIA DGX Spark平臺(tái)上對(duì)NVIDIA ConnectX-7 200G網(wǎng)卡配置教程
在 NVIDIA DGX Spark 平臺(tái)上對(duì) NVIDIA ConnectX-7 200G 網(wǎng)卡進(jìn)行配置時(shí),會(huì)遇到“4 個(gè)邏輯端口”現(xiàn)象。理解背后的真...
基于DPU云盤(pán)掛載的Spark優(yōu)化解決方案
1.? 方案背景和挑戰(zhàn) Apache Spark,作為當(dāng)今大數(shù)據(jù)處理領(lǐng)域的佼佼者,憑借其高效的分布式計(jì)算能力、內(nèi)存計(jì)算優(yōu)化以及強(qiáng)大的生態(tài)系統(tǒng)支持,已牢固...
“Spark+Hive”在DPU環(huán)境下的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫(kù)引擎選型白皮書(shū)(24版)DPU部分節(jié)選
在奇點(diǎn)云2024年版《OLAP數(shù)據(jù)庫(kù)引擎選型白皮書(shū)》中,中科馭數(shù)聯(lián)合奇點(diǎn)云針對(duì)Spark+Hive這類(lèi)大數(shù)據(jù)計(jì)算場(chǎng)景下的主力引擎,測(cè)評(píng)DPU環(huán)境下對(duì)比C...
2024-05-30 標(biāo)簽:數(shù)據(jù)庫(kù)DPUOLAP 1.4k 0
如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結(jié)篇
一、總體介紹 1.1 背景介紹 近年來(lái),隨著存儲(chǔ)硬件的革新與網(wǎng)絡(luò)技術(shù)的突飛猛進(jìn),如NVMe SSD和超高速網(wǎng)絡(luò)接口的普及應(yīng)用,I/O性能瓶頸已得到顯著改...
2024-04-02 標(biāo)簽:cpu網(wǎng)絡(luò)接口DPU 1.8k 0
RDMA技術(shù)在Apache Spark中的應(yīng)用
背景介紹 在當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,Apache?Spark已經(jīng)成為了處理大規(guī)模數(shù)據(jù)集的首選框架。作為一個(gè)開(kāi)源的分布式計(jì)算系統(tǒng),Spark因其高效的大數(shù)據(jù)處...
2024-03-25 標(biāo)簽:數(shù)據(jù)集RDMASPARK 2.5k 0
背景簡(jiǎn)介 Apache Spark(下文簡(jiǎn)稱(chēng)Spark)是一種開(kāi)源集群計(jì)算引擎,支持批/流計(jì)算、SQL分析、機(jī)器學(xué)習(xí)、圖計(jì)算等計(jì)算范式,以其強(qiáng)大的容錯(cuò)能...
Blaze: 用Rust重寫(xiě)Spark執(zhí)行層,平均提升30%算力
隨著機(jī)器硬件的發(fā)展,RAM的價(jià)格也大幅降低,這時(shí)Spark提出了彈性分布式數(shù)據(jù)集(RDD),這是一種分布式內(nèi)存抽象,可以讓程序員以容錯(cuò)的方式在大型集群上...
分析Hive與Spark分區(qū)策略的異同點(diǎn)
隨著技術(shù)的不斷的發(fā)展,大數(shù)據(jù)領(lǐng)域?qū)τ诤A繑?shù)據(jù)的存儲(chǔ)和處理的技術(shù)框架越來(lái)越多。在離線數(shù)據(jù)處理生態(tài)系統(tǒng)最具代表性的分布式處理引擎當(dāng)屬Hive和Spark,它...
2023-04-11 標(biāo)簽:數(shù)據(jù)存儲(chǔ)IOPsHDFS 1.8k 0
MapReduce是一種編程模型,可用于大規(guī)模數(shù)據(jù)集(數(shù)據(jù)量大于1TB的數(shù)據(jù)集)的并行運(yùn)算。
這是數(shù)據(jù)處理引擎的發(fā)電站,它們正競(jìng)相定義下一個(gè)大數(shù)據(jù)時(shí)代 當(dāng)涉及到大數(shù)據(jù)時(shí),流計(jì)算和它所帶來(lái)的實(shí)時(shí)強(qiáng)大分析的重要性是不可避免的。此外,當(dāng)涉及到流計(jì)...
2023-02-24 標(biāo)簽:數(shù)據(jù)處理大數(shù)據(jù)SPARK 1.2k 0
Docker入門(mén)指南之Docker使用場(chǎng)景介紹
在大數(shù)據(jù)平臺(tái)型產(chǎn)品的開(kāi)發(fā)過(guò)程中,經(jīng)常要跟許多模塊打交道,包括Hadoop、Hive、Spark、Zookeeper……等多達(dá)幾十個(gè)開(kāi)源組件,為了不影響團(tuán)...
2023-02-06 標(biāo)簽:大數(shù)據(jù)SPARKDocker 1.2k 0
關(guān)于Spark on Kubernetes實(shí)現(xiàn)方案
存儲(chǔ)與計(jì)算分離架構(gòu),這是公認(rèn)的未來(lái)大方向,存算分離提供了獨(dú)立的擴(kuò)展性,客戶可以做到數(shù)據(jù)入湖,計(jì)算引擎按需擴(kuò)容,這樣的解耦方式會(huì)得到更高的性?xún)r(jià)比。
大數(shù)據(jù)分析中Spark,Hadoop,Hive框架該用哪種開(kāi)源分布式系統(tǒng)
眾所周知,大數(shù)據(jù)開(kāi)發(fā)和分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘中,都離不開(kāi)各種開(kāi)源分布式系統(tǒng)。最常見(jiàn)的就是 Hadoop、Hive、Spark這三個(gè)框架了。最近不少朋友...
2020-09-17 標(biāo)簽:SQL機(jī)器學(xué)習(xí)Hadoop 5.3k 0
來(lái)看看Spark和Flink各自的優(yōu)劣和主要區(qū)別
Flink是統(tǒng)一的流和批處理框架,基本數(shù)據(jù)模型是數(shù)據(jù)流,以及事件(Event)的序列,F(xiàn)link從設(shè)計(jì)之初秉持了一個(gè)觀點(diǎn):批是流的特例。每一條數(shù)據(jù)都可以...
2019-03-15 標(biāo)簽:gpu數(shù)據(jù)集SPARK 3.2萬(wàn) 0
工業(yè)大數(shù)據(jù)挖掘的利器——Spark MLlib
格物匯之前刊發(fā)的《工業(yè)大數(shù)據(jù)處理領(lǐng)域的網(wǎng)紅Apache Spark》中提到,在中國(guó)制造2025的技術(shù)路線圖中,工業(yè)大數(shù)據(jù)是作為重要突破點(diǎn)來(lái)規(guī)劃的,而在未...
2019-01-10 標(biāo)簽:智能制造工業(yè)互聯(lián)網(wǎng)SPARK 5.7k 0
基于Intel Analytics Zoo上分布式TensorFlow的美的/KUKA工業(yè)檢測(cè)平臺(tái)
背景 工業(yè)檢查(用于產(chǎn)品缺陷檢測(cè))是現(xiàn)代制造業(yè)的重要組成部分。隨著人工智能,計(jì)算機(jī)視覺(jué)和大數(shù)據(jù)技術(shù)的發(fā)展,我們可以建立先進(jìn)的工業(yè)檢測(cè)系統(tǒng)以實(shí)現(xiàn)和人類(lèi)水平...
寶信利用Spark Analytics Zoo對(duì)基于LSTM的時(shí)間序列異常檢測(cè)的探索
摘要:寶信和英特爾相關(guān)團(tuán)隊(duì)利用Analytics Zoo在無(wú)監(jiān)督的基于時(shí)間序列異常檢測(cè)用例上進(jìn)行了有益的合作探索,本文分享了合作項(xiàng)目的結(jié)果和經(jīng)驗(yàn)。 背景...
Spark和Flink的技術(shù)與場(chǎng)景進(jìn)行全面分析與對(duì)比
自從數(shù)據(jù)處理需求超過(guò)了傳統(tǒng)數(shù)據(jù)庫(kù)能有效處理的數(shù)據(jù)量之后,Hadoop 等各種基于 MapReduce 的海量數(shù)據(jù)處理系統(tǒng)應(yīng)運(yùn)而生。從 2004 年 Go...
2018-08-01 標(biāo)簽:數(shù)據(jù)處理機(jī)器學(xué)習(xí)Spark 3.0萬(wàn) 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專(zhuān)題
| 電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
| 伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |