91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Spark SQL性能實現(xiàn)17.7倍的提升,是如何做到的

獨愛72H ? 來源:砍柴網(wǎng) ? 作者:砍柴網(wǎng) ? 2019-11-14 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:砍柴網(wǎng))

Apache Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,常用來構(gòu)建大型、低延遲的數(shù)據(jù)分析應(yīng)用程序。Spark一個主要特點在于,其能夠在內(nèi)存中進(jìn)行計算,這使得其數(shù)據(jù)分析效率往往高于其它計算引擎,但是,服務(wù)器內(nèi)存資源的限制也使得其性能的擴展存在著一定的瓶頸,在超大規(guī)模負(fù)載中無法充分發(fā)揮其利用內(nèi)存進(jìn)行計算的性能優(yōu)勢。

某全球領(lǐng)先的語音識別服務(wù)提供商是最早將Spark應(yīng)用到生產(chǎn)環(huán)境的團(tuán)隊之一,該公司的語音云通過幾千臺服務(wù)器構(gòu)成的云計算平臺向用戶提供多樣的、實時語音處理能力,日均服務(wù)終端用戶超過15億,日增數(shù)據(jù)超過100TB。2014年該公司基于Spark和AI技術(shù)構(gòu)建了DMP大數(shù)據(jù)平臺(用戶數(shù)據(jù)管理平臺)。DMP平臺的主要功能就是收集、存儲、分析和挖掘龐大的用戶數(shù)據(jù),以實現(xiàn)廣告精準(zhǔn)投放。

Spark在該公司的大數(shù)據(jù)平臺中主要用于海量用戶數(shù)據(jù)分析,每天支撐穩(wěn)定運行的Spark SQL統(tǒng)計分析指標(biāo)和SQL腳本有幾千個。但是在將Spark SQL用于海量用戶數(shù)據(jù)分析的過程中,仍然面臨著一些痛點,這些都限制了該公司語音云的數(shù)據(jù)分析能力。

Spark的性能不僅受到CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤等硬件設(shè)備的制約,而且Spark SQL目前還不支持索引,也嚴(yán)重影響了Spark SQL在進(jìn)行大規(guī)模數(shù)據(jù)分析時的性能,索引能夠提升數(shù)據(jù)檢索的效率,降低硬盤的IO瓶頸。

隨著數(shù)據(jù)量越來越大,即席分析的需求越來越強烈,即席查詢是用戶根據(jù)用戶自己的需求,靈活選擇查詢條件,系統(tǒng)能夠根據(jù)用戶的選擇生成響應(yīng)的統(tǒng)計報表和結(jié)果集;在數(shù)據(jù)倉庫和大數(shù)據(jù)分析系統(tǒng)中,即席查詢使用的越多,對系統(tǒng)的性能要求也就越高,如果內(nèi)存能夠緩存更多的熱點數(shù)據(jù),能夠極大的提升即席查詢處理速度并降低響應(yīng)延遲。

數(shù)據(jù)既有隨機讀的需求(即席查詢-Ad-hoc),又有全表掃描的需求(機器學(xué)習(xí));機器學(xué)習(xí)就是通過特定算法從海量的歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本進(jìn)行分析并對未來做出預(yù)測,在模型訓(xùn)練的過程中會產(chǎn)生大量的中間結(jié)果數(shù)據(jù),通常情況下需要將中間結(jié)果數(shù)據(jù)持久化到文件系統(tǒng)上,如果內(nèi)存能夠緩存更多的中間結(jié)果數(shù)據(jù),可以提升模型訓(xùn)練的速度。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11343

    瀏覽量

    110158
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1313

    瀏覽量

    25778
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    北大團(tuán)隊最新研究:AI芯片算力提升數(shù)倍,能效提升超90

    首次實現(xiàn)后摩爾新器件異質(zhì)集成的多物理域融合傅里葉變換系統(tǒng)。 ? 這一全新計算架構(gòu)將傅里葉變換計算速度從當(dāng)前每秒約1300億次提升至每秒約5000億次,算力提升近4,能效
    的頭像 發(fā)表于 01-15 09:31 ?2073次閱讀

    全新軟件與模型優(yōu)化為NVIDIA DGX Spark注入強大動力

    自發(fā)布以來,NVIDIA 通過持續(xù)的軟件優(yōu)化以及與軟件合作伙伴和開源社區(qū)的緊密協(xié)作,不斷提升基于 Grace Blackwell 架構(gòu)的 DGX Spark性能。這些舉措在推理、訓(xùn)練和創(chuàng)意工作流方面都取得了顯著的成效。
    的頭像 發(fā)表于 01-09 10:17 ?670次閱讀

    17.7 GHz - 19.7 GHz低噪聲放大器ADL5725:特性、應(yīng)用與設(shè)計要點

    Devices推出的ADL5725,一款針對17.7 GHz - 19.7 GHz微波頻段優(yōu)化的窄帶、高性能低噪聲放大器。 文件下載: ADL5725.pdf 一、ADL5725的特性亮點 1.
    的頭像 發(fā)表于 01-05 16:10 ?247次閱讀

    如何在DGX Spark上運行NVIDIA Omniverse

    首先感謝 Vigor 同學(xué)第一時間的分享,以下是具體如何在 DGX Spark 上運行 Omniverse 的方法。
    的頭像 發(fā)表于 12-17 10:13 ?736次閱讀
    如何在DGX <b class='flag-5'>Spark</b>上運行NVIDIA Omniverse

    性能提升30:當(dāng)AI存儲沖刺“秒速”,誰為它的“出廠體檢”按下快門?

    SK 海力士與英偉達(dá)合作研發(fā)性能提升 30 的 AI NAND,凸顯現(xiàn)有測試驗證體系的 “代差” 危機。傳統(tǒng)測試難以滿足極端負(fù)載下的精準(zhǔn)性能檢測,面臨接口帶寬延遲、信號完整性、負(fù)載真
    的頭像 發(fā)表于 12-15 14:17 ?391次閱讀

    亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4

    Trainium 4的開發(fā)計劃。亞馬遜表示,這款芯片能夠比英偉達(dá)市場領(lǐng)先的圖形處理單元(GPU)更便宜、更高效地驅(qū)動AI模型背后的密集計算。 ? ? 作為亞馬遜首款3納米工藝AI芯片,Trainium3的核心突破在于性能、能效與擴展性的全面躍升。其計算性能較前代Train
    的頭像 發(fā)表于 12-09 08:37 ?8682次閱讀
    亞馬遜發(fā)布新一代AI芯片Trainium3,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG 開放模型集合無縫連接,這使您能夠在云端或本地環(huán)境中基于自己的數(shù)據(jù)構(gòu)建高性能
    的頭像 發(fā)表于 12-01 09:31 ?879次閱讀
    使用NVIDIA Nemotron RAG和Microsoft <b class='flag-5'>SQL</b> Server 2025構(gòu)建高<b class='flag-5'>性能</b>AI應(yīng)用

    NVIDIA DGX Spark快速入門指南

    NVIDIA DGX Spark 已正式向 AI 開發(fā)者交付,對于剛?cè)胧值娜?DGX Spark,該如何進(jìn)行初始化設(shè)置?本篇文章將引導(dǎo)您完成 DGX Spark 首次設(shè)置。在初始設(shè)置的過程中,您
    的頭像 發(fā)表于 11-17 14:11 ?6385次閱讀
    NVIDIA DGX <b class='flag-5'>Spark</b>快速入門指南

    不用編程不用聯(lián)網(wǎng),實現(xiàn)福(BECKHOFF)PLC對接SQL數(shù)據(jù)庫,上報和查詢數(shù)據(jù)的案例

    的數(shù)值;查看過程數(shù)據(jù)(工具->網(wǎng)關(guān)數(shù)據(jù)監(jiān)控):顯示當(dāng)前任務(wù)組對應(yīng)的過程數(shù)據(jù), 即SQL語句。 福PLC內(nèi)需要添加智能網(wǎng)關(guān)的IP地址,同時要確認(rèn)PLC的AMS ID,AMS網(wǎng)絡(luò)端口等參數(shù)
    發(fā)表于 10-10 11:14

    SQL 通用數(shù)據(jù)類型

    SQL 通用數(shù)據(jù)類型 數(shù)據(jù)庫表中的每個列都要求有名稱和數(shù)據(jù)類型。Each column in a database table is required to have a name and a
    的頭像 發(fā)表于 08-18 09:46 ?760次閱讀

    Text2SQL準(zhǔn)確率暴漲22.6%!3大維度全拆

    基于 BIRD 數(shù)據(jù)集展開。 方法:提出 J-Schema 呈現(xiàn)數(shù)據(jù)庫結(jié)構(gòu)并合理提供示例值,結(jié)合思維鏈引導(dǎo)模型推理。采用 Iterative DPO 迭代訓(xùn)練,多輪迭代提升性能。用自洽性方法,通過硬 / 軟投票從多個候選答案中選最優(yōu),軟投票更優(yōu)。 結(jié)果:解決 Text2
    的頭像 發(fā)表于 08-14 11:17 ?752次閱讀
    Text2<b class='flag-5'>SQL</b>準(zhǔn)確率暴漲22.6%!3大維度全拆

    Arm KleidiAI與XNNPack集成實現(xiàn)AI性能提升

    INT4 矩陣乘法 (matmul) 優(yōu)化以增強 Google Gemma 2 模型性能開始,到后續(xù)完成多項底層技術(shù)增強,Arm 在 XNNPack 上實現(xiàn)了顯著的性能提升。
    的頭像 發(fā)表于 08-08 15:19 ?2987次閱讀
    Arm KleidiAI與XNNPack集成<b class='flag-5'>實現(xiàn)</b>AI<b class='flag-5'>性能</b><b class='flag-5'>提升</b>

    快手上線鴻蒙應(yīng)用高性能解決方案:數(shù)據(jù)反序列化性能提升90%

    普通對象(如 JSON 數(shù)據(jù))與類實例進(jìn)行互轉(zhuǎn),是實現(xiàn)面向?qū)ο缶幊膛c數(shù)據(jù)序列化解耦的核心工具。隨著業(yè)務(wù)復(fù)雜度的提升,該庫在反序列化過程中逐漸暴露出性能瓶頸,影響用戶核心體驗。因此
    發(fā)表于 05-15 10:01

    艾體寶案例 9?測試效率 + 67%?成本下降,Boohoo 做對了什么?

    作為全球領(lǐng)先的線上時尚零售商,Boohoo 集團(tuán)在業(yè)務(wù)快速擴張的過程中,原有的測試體系面臨著成本高、擴展難等挑戰(zhàn)。通過引入 LambdaTest 云端測試平臺,Boohoo 成功實現(xiàn)了測試自動化、設(shè)備覆蓋率提升和顯著的成本控制。本案例將帶你了解他們是
    的頭像 發(fā)表于 05-08 10:52 ?549次閱讀

    1.9性能提升!英特爾至強6在MLPerf基準(zhǔn)測試中表現(xiàn)卓越

    關(guān)鍵項目中,性能表現(xiàn)卓越。測試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器的AI性能實現(xiàn)了高達(dá)1.9的顯著提升,這也充分顯示了至強6處理器作為現(xiàn)代
    的頭像 發(fā)表于 04-07 10:58 ?728次閱讀