解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　本文主要主要介紹 Web 開(kāi)發(fā)中需要了解的內(nèi)存分析與內(nèi)存泄露定位手段。

　　無(wú)論是分布式計(jì)算系統(tǒng)、服務(wù)端應(yīng)用程序還是 iOS、Android 原生應(yīng)用都會(huì)存在內(nèi)存泄漏問(wèn)題，Web 應(yīng)用自然也不可避免地存在著類似的問(wèn)題。雖然因?yàn)榫W(wǎng)頁(yè)往往都是即用即走，較少地存在某個(gè)網(wǎng)頁(yè)長(zhǎng)期運(yùn)行的問(wèn)題，即使存在內(nèi)存泄漏可能表現(xiàn)地也不明顯;但是在某些數(shù)據(jù)展示型的，需要長(zhǎng)期運(yùn)行的頁(yè)面上，如果不及時(shí)解決內(nèi)存泄漏可能會(huì)導(dǎo)致網(wǎng)頁(yè)占據(jù)過(guò)大地內(nèi)存，不僅影響頁(yè)面性能，還可能導(dǎo)致整個(gè)系統(tǒng)的崩潰。前端每周清單推薦過(guò)的 How JavaScript works 就是非常不錯(cuò)地介紹 JavaScript 運(yùn)行機(jī)制的系列文章，其也對(duì)內(nèi)存管理與內(nèi)存泄漏有過(guò)分析，本文部分圖片與示例代碼即來(lái)自此系列。

　　類似于 C 這樣的語(yǔ)言提供了 malloc（）與 free（）這樣的底層內(nèi)存管理原子操作，開(kāi)發(fā)者需要顯式手動(dòng)地進(jìn)行內(nèi)存的申請(qǐng)與釋放;而 Java 這樣的語(yǔ)言則是提供了自動(dòng)化的內(nèi)存回收機(jī)制，筆者在垃圾回收算法與 JVM 垃圾回收器綜述一文中有過(guò)介紹。JavaScript 也是采用的自動(dòng)化內(nèi)存回收機(jī)制，無(wú)論是 Object、String 等都是由垃圾回收進(jìn)程自動(dòng)回收處理。自動(dòng)化內(nèi)存回收并不意味著我們就可以忽略內(nèi)存管理的相關(guān)操作，反而可能會(huì)導(dǎo)致更不易發(fā)現(xiàn)的內(nèi)存泄漏出現(xiàn)。

　　內(nèi)存分配與回收

　 JavaScript 的內(nèi)存模型，其主要也是由堆、棧、隊(duì)列三方面組成：

　　其中隊(duì)列指的是消息隊(duì)列、棧就是函數(shù)執(zhí)行棧，其基本結(jié)構(gòu)如下所示：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　而主要的用戶創(chuàng)建的對(duì)象就存放在堆中，這也是我們內(nèi)存分析與內(nèi)存泄漏定位所需要關(guān)注的主要的區(qū)域。所謂內(nèi)存，從硬件的角度來(lái)看，就是無(wú)數(shù)觸發(fā)器的組合;每個(gè)觸發(fā)器能夠存放 1 bit 位的數(shù)據(jù)，不同的觸發(fā)器由唯一的標(biāo)識(shí)符定位，開(kāi)發(fā)者可以根據(jù)該標(biāo)識(shí)符讀寫該觸發(fā)器。抽象來(lái)看，我們可以將內(nèi)存當(dāng)做比特?cái)?shù)組，而數(shù)據(jù)就是在內(nèi)存中順序排布：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　JavaScript 中開(kāi)發(fā)者并不需要手動(dòng)地為對(duì)象申請(qǐng)內(nèi)存，只需要聲明變量，JavaScript Runtime 即可以自動(dòng)地分配內(nèi)存：

　解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　某個(gè)對(duì)象的內(nèi)存生命周期分為了內(nèi)存分配、內(nèi)存使用與內(nèi)存回收這三個(gè)步驟，當(dāng)某個(gè)對(duì)象不再被需要時(shí)，它就應(yīng)該被清除回收;所謂的垃圾回收器，Garbage Collector 即是負(fù)責(zé)追蹤內(nèi)存分配情況、判斷某個(gè)被分配的內(nèi)存是否有用，并且自動(dòng)回收無(wú)用的內(nèi)存。大部分的垃圾回收器是根據(jù)引用（Reference）來(lái)判斷某個(gè)對(duì)象是否存活，所謂的引用即是某個(gè)對(duì)象是否依賴于其他對(duì)象，如果存在依賴關(guān)系即存在引用;譬如某個(gè) JavaScript 對(duì)象引用了它的原型對(duì)象。最簡(jiǎn)單的垃圾回收算法即是引用計(jì)數(shù)（Reference Counting），即清除所有零引用的對(duì)象：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　不過(guò)這種算法往往受制于循環(huán)引用問(wèn)題，即兩個(gè)無(wú)用的對(duì)象相互引用：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　稍為復(fù)雜的算法即是所謂的標(biāo)記-清除（Mark-Sweep）算法，其根據(jù)某個(gè)對(duì)象是否可達(dá)來(lái)判斷某個(gè)對(duì)象是否可用。標(biāo)記-清除算法會(huì)從某個(gè)根元素開(kāi)始，譬如 window 對(duì)象開(kāi)始，沿著引用樹(shù)向下遍歷，標(biāo)記所有可達(dá)的對(duì)象為可用，并且清除其他未被標(biāo)記的對(duì)象。

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　2012 年之后，幾乎所有的主流瀏覽器都實(shí)踐了基于標(biāo)記-清除算法的垃圾回收器，并且各自也進(jìn)行有針對(duì)性地優(yōu)化。

　　內(nèi)存泄漏

　　所謂的內(nèi)存泄漏，即是指某個(gè)對(duì)象被無(wú)意間添加了某條引用，導(dǎo)致雖然實(shí)際上并不需要了，但還是能一直被遍歷可達(dá)，以致其內(nèi)存始終無(wú)法回收。本部分我們簡(jiǎn)要討論下 JavaScript 中常見(jiàn)的內(nèi)存泄漏情境與處理方法。在新版本的 Chrome 中我們可以使用 Performance Monitor 來(lái)動(dòng)態(tài)監(jiān)測(cè)網(wǎng)頁(yè)性能的變化：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　上圖中各項(xiàng)指標(biāo)的含義為：

　　CPU usage - 當(dāng)前站點(diǎn)的 CPU 使用量;

　　JS heap size - 應(yīng)用的內(nèi)存占用量;

　　DOM Nodes - 內(nèi)存中 DOM 節(jié)點(diǎn)數(shù)目;

　　JS event listeners- 當(dāng)前頁(yè)面上注冊(cè)的 JavaScript 時(shí)間監(jiān)聽(tīng)器數(shù)目;

　　Documents - 當(dāng)前頁(yè)面中使用的樣式或者腳本文件數(shù)目;

　　Frames - 當(dāng)前頁(yè)面上的 Frames 數(shù)目，包括 iframe 與 workers;

　　Layouts / sec - 每秒的 DOM 重布局?jǐn)?shù)目;

　　Style recalcs / sec - 瀏覽器需要重新計(jì)算樣式的頻次;

　　當(dāng)發(fā)現(xiàn)某個(gè)時(shí)間點(diǎn)可能存在內(nèi)存泄漏時(shí)，我們可以使用 Memory 標(biāo)簽頁(yè)將此時(shí)的堆分配情況打印下來(lái)：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　全局變量

　　JavaScript 會(huì)將所有的為聲明的變量當(dāng)做全局變量進(jìn)行處理，即將其掛載到 global 對(duì)象上;瀏覽器中這里的 global 對(duì)象就是 window：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　一旦某個(gè)變量被掛載到了 window 對(duì)象，就意味著它永遠(yuǎn)是可達(dá)的。為了避免這種情況，我們應(yīng)該盡可能地添加 use strict 或者進(jìn)行模塊化編碼（參考 JavaScript 模塊演化簡(jiǎn)史）。我們也可以擴(kuò)展類似于下文的掃描函數(shù)，來(lái)檢測(cè)出 window 對(duì)象的非原生屬性，并加以判斷：

　　定時(shí)器與閉包

　　我們經(jīng)常會(huì)使用 setInterval 來(lái)執(zhí)行定時(shí)任務(wù)，很多的框架也提供了基于回調(diào)的異步執(zhí)行機(jī)制;這可能會(huì)導(dǎo)致回調(diào)中聲明了對(duì)于某個(gè)變量的依賴，譬如：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　定時(shí)器保有對(duì)于 serverData 變量的引用，如果我們不手動(dòng)清除定時(shí)器話，那么該變量也就會(huì)一直可達(dá)，不被回收。而這里的 serverData 也是閉包形式被引入到 setInterval 的回調(diào)作用域中;閉包也是常見(jiàn)的可能導(dǎo)致內(nèi)存泄漏的元兇之一：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　上述代碼中 replaceThing 會(huì)定期執(zhí)行，并且創(chuàng)建大的數(shù)組與 someMethod 閉包賦值給 theThing。someMethod 作用域是與 unused 共享的，unused 又有一個(gè)指向 originalThing 的引用。盡管 unused 并未被實(shí)際使用，theThing 的 someMethod 方法卻有可能會(huì)被外部使用，也就導(dǎo)致了 unused 始終處于可達(dá)狀態(tài)。unused 又會(huì)反向依賴于 theThing，最終導(dǎo)致大數(shù)組始終無(wú)法被清除。

　　DOM 引用與監(jiān)聽(tīng)器

　　有時(shí)候我們可能會(huì)將 DOM 元素存放到數(shù)據(jù)結(jié)構(gòu)中，譬如當(dāng)我們需要頻繁更新某個(gè)數(shù)據(jù)列表時(shí)，可能會(huì)將用到的數(shù)據(jù)列表存放在 JavaScript 數(shù)組中;這也就導(dǎo)致了每個(gè) DOM 元素存在了兩個(gè)引用，分別在 DOM 樹(shù)與 JavaScript 數(shù)組中：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　此時(shí)我們就需要將 DOM 樹(shù)與 JavaScript 數(shù)組中的引用皆刪除，才能真實(shí)地清除該對(duì)象。類似的，在老版本的瀏覽器中，如果我們清除某個(gè) DOM 元素，我們需要首先移除其監(jiān)聽(tīng)器，否則瀏覽器并不會(huì)自動(dòng)地幫我們清除該監(jiān)聽(tīng)器，或者回收該監(jiān)聽(tīng)器引用的對(duì)象：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　現(xiàn)代瀏覽器使用的現(xiàn)代垃圾回收器則會(huì)幫我們自動(dòng)地檢測(cè)這種循環(huán)依賴，并且予以清除;jQuery 等第三方庫(kù)也會(huì)在清除元素之前首先移除其監(jiān)聽(tīng)事件。

　　iframe

　　iframe 是常見(jiàn)的界面共享方式，不過(guò)如果我們?cè)诟附缑婊蛘咦咏缑嬷刑砑恿藢?duì)于父界面某對(duì)象的引用，譬如：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　就有可能導(dǎo)致 iframe 卸載（移除元素）之后仍然有部分對(duì)象保留下來(lái)，我們可以在移除 iframe 之前執(zhí)行強(qiáng)制的頁(yè)面重載：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　或者手動(dòng)地執(zhí)行頁(yè)面清除操作：

解析Web內(nèi)存分析與內(nèi)存泄漏定位

　　Web Worker

　　現(xiàn)代瀏覽器中我們經(jīng)常使用 Web Worker 來(lái)運(yùn)行后臺(tái)任務(wù)，不過(guò)有時(shí)候如果我們過(guò)于頻繁且不加容錯(cuò)地在主線程與工作線程之間傳遞數(shù)據(jù)，可能會(huì)導(dǎo)致內(nèi)存泄漏：

解析Web內(nèi)存分析與內(nèi)存泄漏定位