本文主要主要介紹 Web 開(kāi)發(fā)中需要了解的內(nèi)存分析與內(nèi)存泄露定位手段。
無(wú)論是分布式計(jì)算系統(tǒng)、服務(wù)端應(yīng)用程序還是 iOS、Android 原生應(yīng)用都會(huì)存在內(nèi)存泄漏問(wèn)題,Web 應(yīng)用自然也不可避免地存在著類似的問(wèn)題。雖然因?yàn)榫W(wǎng)頁(yè)往往都是即用即走,較少地存在某個(gè)網(wǎng)頁(yè)長(zhǎng)期運(yùn)行的問(wèn)題,即使存在內(nèi)存泄漏可能表現(xiàn)地也不明顯;但是在某些數(shù)據(jù)展示型的,需要長(zhǎng)期運(yùn)行的頁(yè)面上,如果不及時(shí)解決內(nèi)存泄漏可能會(huì)導(dǎo)致網(wǎng)頁(yè)占據(jù)過(guò)大地內(nèi)存,不僅影響頁(yè)面性能,還可能導(dǎo)致整個(gè)系統(tǒng)的崩潰。前端每周清單推薦過(guò)的 How JavaScript works 就是非常不錯(cuò)地介紹 JavaScript 運(yùn)行機(jī)制的系列文章,其也對(duì)內(nèi)存管理與內(nèi)存泄漏有過(guò)分析,本文部分圖片與示例代碼即來(lái)自此系列。
類似于 C 這樣的語(yǔ)言提供了 malloc() 與 free() 這樣的底層內(nèi)存管理原子操作,開(kāi)發(fā)者需要顯式手動(dòng)地進(jìn)行內(nèi)存的申請(qǐng)與釋放;而 Java 這樣的語(yǔ)言則是提供了自動(dòng)化的內(nèi)存回收機(jī)制,筆者在垃圾回收算法與 JVM 垃圾回收器綜述一文中有過(guò)介紹。JavaScript 也是采用的自動(dòng)化內(nèi)存回收機(jī)制,無(wú)論是 Object、String 等都是由垃圾回收進(jìn)程自動(dòng)回收處理。自動(dòng)化內(nèi)存回收并不意味著我們就可以忽略內(nèi)存管理的相關(guān)操作,反而可能會(huì)導(dǎo)致更不易發(fā)現(xiàn)的內(nèi)存泄漏出現(xiàn)。
內(nèi)存分配與回收
JavaScript 的內(nèi)存模型,其主要也是由堆、棧、隊(duì)列三方面組成:
其中隊(duì)列指的是消息隊(duì)列、棧就是函數(shù)執(zhí)行棧,其基本結(jié)構(gòu)如下所示:

而主要的用戶創(chuàng)建的對(duì)象就存放在堆中,這也是我們內(nèi)存分析與內(nèi)存泄漏定位所需要關(guān)注的主要的區(qū)域。所謂內(nèi)存,從硬件的角度來(lái)看,就是無(wú)數(shù)觸發(fā)器的組合;每個(gè)觸發(fā)器能夠存放 1 bit 位的數(shù)據(jù),不同的觸發(fā)器由唯一的標(biāo)識(shí)符定位,開(kāi)發(fā)者可以根據(jù)該標(biāo)識(shí)符讀寫該觸發(fā)器。抽象來(lái)看,我們可以將內(nèi)存當(dāng)做比特?cái)?shù)組,而數(shù)據(jù)就是在內(nèi)存中順序排布:

JavaScript 中開(kāi)發(fā)者并不需要手動(dòng)地為對(duì)象申請(qǐng)內(nèi)存,只需要聲明變量,JavaScript Runtime 即可以自動(dòng)地分配內(nèi)存:

某個(gè)對(duì)象的內(nèi)存生命周期分為了內(nèi)存分配、內(nèi)存使用與內(nèi)存回收這三個(gè)步驟,當(dāng)某個(gè)對(duì)象不再被需要時(shí),它就應(yīng)該被清除回收;所謂的垃圾回收器,Garbage Collector 即是負(fù)責(zé)追蹤內(nèi)存分配情況、判斷某個(gè)被分配的內(nèi)存是否有用,并且自動(dòng)回收無(wú)用的內(nèi)存。大部分的垃圾回收器是根據(jù)引用(Reference)來(lái)判斷某個(gè)對(duì)象是否存活,所謂的引用即是某個(gè)對(duì)象是否依賴于其他對(duì)象,如果存在依賴關(guān)系即存在引用;譬如某個(gè) JavaScript 對(duì)象引用了它的原型對(duì)象。最簡(jiǎn)單的垃圾回收算法即是引用計(jì)數(shù)(Reference Counting),即清除所有零引用的對(duì)象:

不過(guò)這種算法往往受制于循環(huán)引用問(wèn)題,即兩個(gè)無(wú)用的對(duì)象相互引用:

稍為復(fù)雜的算法即是所謂的標(biāo)記-清除(Mark-Sweep)算法,其根據(jù)某個(gè)對(duì)象是否可達(dá)來(lái)判斷某個(gè)對(duì)象是否可用。標(biāo)記-清除算法會(huì)從某個(gè)根元素開(kāi)始,譬如 window 對(duì)象開(kāi)始,沿著引用樹(shù)向下遍歷,標(biāo)記所有可達(dá)的對(duì)象為可用,并且清除其他未被標(biāo)記的對(duì)象。

2012 年之后,幾乎所有的主流瀏覽器都實(shí)踐了基于標(biāo)記-清除算法的垃圾回收器,并且各自也進(jìn)行有針對(duì)性地優(yōu)化。
內(nèi)存泄漏
所謂的內(nèi)存泄漏,即是指某個(gè)對(duì)象被無(wú)意間添加了某條引用,導(dǎo)致雖然實(shí)際上并不需要了,但還是能一直被遍歷可達(dá),以致其內(nèi)存始終無(wú)法回收。本部分我們簡(jiǎn)要討論下 JavaScript 中常見(jiàn)的內(nèi)存泄漏情境與處理方法。在新版本的 Chrome 中我們可以使用 Performance Monitor 來(lái)動(dòng)態(tài)監(jiān)測(cè)網(wǎng)頁(yè)性能的變化:

上圖中各項(xiàng)指標(biāo)的含義為:
CPU usage - 當(dāng)前站點(diǎn)的 CPU 使用量;
JS heap size - 應(yīng)用的內(nèi)存占用量;
DOM Nodes - 內(nèi)存中 DOM 節(jié)點(diǎn)數(shù)目;
JS event listeners- 當(dāng)前頁(yè)面上注冊(cè)的 JavaScript 時(shí)間監(jiān)聽(tīng)器數(shù)目;
Documents - 當(dāng)前頁(yè)面中使用的樣式或者腳本文件數(shù)目;
Frames - 當(dāng)前頁(yè)面上的 Frames 數(shù)目,包括 iframe 與 workers;
Layouts / sec - 每秒的 DOM 重布局?jǐn)?shù)目;
Style recalcs / sec - 瀏覽器需要重新計(jì)算樣式的頻次;
當(dāng)發(fā)現(xiàn)某個(gè)時(shí)間點(diǎn)可能存在內(nèi)存泄漏時(shí),我們可以使用 Memory 標(biāo)簽頁(yè)將此時(shí)的堆分配情況打印下來(lái):


全局變量
JavaScript 會(huì)將所有的為聲明的變量當(dāng)做全局變量進(jìn)行處理,即將其掛載到 global 對(duì)象上;瀏覽器中這里的 global 對(duì)象就是 window:

一旦某個(gè)變量被掛載到了 window 對(duì)象,就意味著它永遠(yuǎn)是可達(dá)的。為了避免這種情況,我們應(yīng)該盡可能地添加 use strict 或者進(jìn)行模塊化編碼(參考 JavaScript 模塊演化簡(jiǎn)史)。我們也可以擴(kuò)展類似于下文的掃描函數(shù),來(lái)檢測(cè)出 window 對(duì)象的非原生屬性,并加以判斷:
5
定時(shí)器與閉包
我們經(jīng)常會(huì)使用 setInterval 來(lái)執(zhí)行定時(shí)任務(wù),很多的框架也提供了基于回調(diào)的異步執(zhí)行機(jī)制;這可能會(huì)導(dǎo)致回調(diào)中聲明了對(duì)于某個(gè)變量的依賴,譬如:

定時(shí)器保有對(duì)于 serverData 變量的引用,如果我們不手動(dòng)清除定時(shí)器話,那么該變量也就會(huì)一直可達(dá),不被回收。而這里的 serverData 也是閉包形式被引入到 setInterval 的回調(diào)作用域中;閉包也是常見(jiàn)的可能導(dǎo)致內(nèi)存泄漏的元兇之一:

上述代碼中 replaceThing 會(huì)定期執(zhí)行,并且創(chuàng)建大的數(shù)組與 someMethod 閉包賦值給 theThing。someMethod 作用域是與 unused 共享的,unused 又有一個(gè)指向 originalThing 的引用。盡管 unused 并未被實(shí)際使用,theThing 的 someMethod 方法卻有可能會(huì)被外部使用,也就導(dǎo)致了 unused 始終處于可達(dá)狀態(tài)。unused 又會(huì)反向依賴于 theThing,最終導(dǎo)致大數(shù)組始終無(wú)法被清除。
DOM 引用與監(jiān)聽(tīng)器
有時(shí)候我們可能會(huì)將 DOM 元素存放到數(shù)據(jù)結(jié)構(gòu)中,譬如當(dāng)我們需要頻繁更新某個(gè)數(shù)據(jù)列表時(shí),可能會(huì)將用到的數(shù)據(jù)列表存放在 JavaScript 數(shù)組中;這也就導(dǎo)致了每個(gè) DOM 元素存在了兩個(gè)引用,分別在 DOM 樹(shù)與 JavaScript 數(shù)組中:

此時(shí)我們就需要將 DOM 樹(shù)與 JavaScript 數(shù)組中的引用皆刪除,才能真實(shí)地清除該對(duì)象。類似的,在老版本的瀏覽器中,如果我們清除某個(gè) DOM 元素,我們需要首先移除其監(jiān)聽(tīng)器,否則瀏覽器并不會(huì)自動(dòng)地幫我們清除該監(jiān)聽(tīng)器,或者回收該監(jiān)聽(tīng)器引用的對(duì)象:

現(xiàn)代瀏覽器使用的現(xiàn)代垃圾回收器則會(huì)幫我們自動(dòng)地檢測(cè)這種循環(huán)依賴,并且予以清除;jQuery 等第三方庫(kù)也會(huì)在清除元素之前首先移除其監(jiān)聽(tīng)事件。
iframe
iframe 是常見(jiàn)的界面共享方式,不過(guò)如果我們?cè)诟附缑婊蛘咦咏缑嬷刑砑恿藢?duì)于父界面某對(duì)象的引用,譬如:

就有可能導(dǎo)致 iframe 卸載(移除元素)之后仍然有部分對(duì)象保留下來(lái),我們可以在移除 iframe 之前執(zhí)行強(qiáng)制的頁(yè)面重載:

或者手動(dòng)地執(zhí)行頁(yè)面清除操作:

Web Worker
現(xiàn)代瀏覽器中我們經(jīng)常使用 Web Worker 來(lái)運(yùn)行后臺(tái)任務(wù),不過(guò)有時(shí)候如果我們過(guò)于頻繁且不加容錯(cuò)地在主線程與工作線程之間傳遞數(shù)據(jù),可能會(huì)導(dǎo)致內(nèi)存泄漏:

在實(shí)際的代碼中我們應(yīng)該檢測(cè) Transferable Objects 是否正常工作:

電子發(fā)燒友App







































評(píng)論