91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在命令行模式下使用已有的Linux性能分析

電子設(shè)計 ? 來源:騰訊技術(shù)工程 ? 作者:helightxu ? 2021-02-17 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)你登陸一臺 Linux 服務(wù)器之后,因為一個問題要做性能分析時:你會在第 1 分鐘內(nèi)做哪些檢測呢?

在 Netflix,我們有很多 EC2 的 Linux 機器,并且也需要很多性能分析工具來監(jiān)控和檢查它們的性能。包括有針對云上的監(jiān)控工具 Atlas,和按需要進行實例分析的 Vector。雖然這些工具能幫助我們解決大多數(shù)問題,但是我們有時候還需要登陸機器實例去運行一些標(biāo)準(zhǔn)的 Linux 性能分析工具。

最開始的 60 秒:總結(jié)在這篇文章中,Netflix 的性能分析工程師團隊會給你展示在最開始的 60 秒內(nèi),如何在命令行模式下使用已有的 Linux 標(biāo)準(zhǔn)工具進行性能優(yōu)化檢測。在 60 秒內(nèi)只需要通過運行下面的 10 個命令就可以對系統(tǒng)資源使用和運行進程有一個很高程度的了解。尋找錯誤信息和飽和度指標(biāo),并且可以顯示為請求隊列的長度,或者等待時長。因為它們都很容易理解,然后就是資源利用率。飽和度是指一個資源已經(jīng)超過了它自己的負(fù)荷能力。

有些命令需要安裝 sysstat 工具包。這些命令展示的指標(biāo)會幫助你完成一些 USE(Utilization,Saturation,Errors) 方法:定位性能瓶頸的方法論。包括了檢查使用率(Utilization),飽和度(Saturation),所有資源(比如 CPU,內(nèi)存,磁盤等)的錯誤指標(biāo)(Errors)。同樣也要關(guān)注你什么時候檢查和排除一個資源問題,因為通過排除可以縮小分析范圍,同時也指導(dǎo)了任何后續(xù)的檢查。

下面的章節(jié)將會通過一個生產(chǎn)系統(tǒng)中的例子來介紹這些命令。要了解更多這些工具的信息,也可以查看它們的幫助手冊。

1. uptime

$ uptime

23:51:26 up 21:31, 1 user, load average: 30.02, 26.43, 19.02

這是一個快速展示系統(tǒng)平均負(fù)載的方法,這也指出了等待運行進程的數(shù)量。在 Linux 系統(tǒng)中,這些數(shù)字包括等待 CPU 運行的進程數(shù),也包括了被不可中斷 I/O(通常是磁盤 I/O)阻塞的進程。這給出了資源負(fù)載的很直接的展示,可以在沒有其它工具的幫助下更好的理解這些數(shù)據(jù)。它是唯一快捷的查看系統(tǒng)負(fù)載的方式。

這三個數(shù)字是以遞減的方式統(tǒng)計了過去 1 分鐘,5 分鐘和 15 分鐘常數(shù)的平均數(shù)。這三個數(shù)字給我們直觀展示了隨著時間的變化系統(tǒng)負(fù)載如何變化。例如,如果你被叫去查看一個有問題的服務(wù)器,并且 1 分鐘的所代表的值比 15 分鐘的值低很多,那么你可能由于太遲登陸機器而錯過了問題發(fā)生的時間點。

在上面的例子中,平均負(fù)載顯示是在不斷增加的,1 分鐘的值是 30,相比 15 分鐘的值 19 來說是增加了。這個數(shù)字這么大就意味著有事情發(fā)生了:可能是 CPU 需求;vmstat 或者 mpstat 會幫助確認(rèn)到底是什么,這些命令會在本系列的第 3 和第 4 個命令中介紹。

2. dmesg | tail

這里展示的是最近 10 條系統(tǒng)消息日志,如果系統(tǒng)消息沒有就不會展示。主要是看由于性能問題導(dǎo)致的錯誤。上面這個例子中包含了殺死 OOM 問題的進程,丟棄 TCP 請求的問題。

所以要記得使用這個命令, dmesg 命令值得一用。

3. vmstat 1

對虛擬內(nèi)存統(tǒng)計的簡短展示,vmstat 是一個常用工具(最早是幾十年前為 BSD 創(chuàng)建的)。它每一行打印關(guān)鍵的服務(wù)信息統(tǒng)計摘要。

vmstat 使用參數(shù) 1 來運行的時候,是每 1 秒打印一條統(tǒng)計信息。在這個版本的 vmstat 中,輸出的第一行展示的是自從啟動后的平均值,而不是前一秒的統(tǒng)計。所以現(xiàn)在,可以跳過第一行,除非你要看一下抬頭的字段含義。

每列含義說明:

r: CPU 上的等待運行的可運行進程數(shù)。這個指標(biāo)提供了判斷 CPU 飽和度的數(shù)據(jù),因為它不包含 I/O 等待的進程??山忉尀椋骸皉” 的值比 CPU 數(shù)大的時候就是飽和的。

free:空閑內(nèi)存,單位是 k。如果這個數(shù)比較大,就說明你還有充足的空閑內(nèi)存?!癴ree -m” 和下面第 7 個命令,可以更詳細(xì)的分析空閑內(nèi)存的狀態(tài)。

si,so:交換進來和交換出去的數(shù)據(jù)量,如果這兩個值為非 0 值,那么就說明沒有內(nèi)存了。

us,sy,id,wa,st:這些是 CPU 時間的分解,是所有 CPU 的平均值。它們是用戶時間,系統(tǒng)時間(內(nèi)核),空閑,等待 I/O 時間,和被偷的時間(這里主要指其它的客戶,或者使用 Xen,這些客戶有自己獨立的操作域)。

CPU 時間的分解可以幫助確定 CPU 是不是非常忙(通過用戶時間和系統(tǒng)時間累加判斷)。持續(xù)的 I/O 等待則表明磁盤是瓶頸。這種情況下 CPU 是比較空閑的,因為任務(wù)都由于等待磁盤 I/O 而被阻塞。你可以把等待 I/O 看作是另外一種形式的 CPU 空閑,而這個命令給了為什么它們空閑的線索。

系統(tǒng)時間對于 I/O 處理來說是必須的。比較高的平均系統(tǒng)時間消耗,比如超過了 20%,就有必要進一步探索分析了:也有可能是內(nèi)核處理 I/O 效率不夠高導(dǎo)致。

在上面的例子中,CPU 時間幾乎都是用戶級別的,說明這是一個應(yīng)用級別的使用情況。如果 CPU 的使用率平均都超過了 90%。這不一定問題;可以使用 “r” 列來檢查使用飽和度。

4. mpstat -P ALL 1

這個命令分打印各個 CPU 的時間統(tǒng)計,可以看出整體 CPU 的使用是不是均衡的。有一個使用率明顯較高的 CPU 就可以明顯看出來這是一個單線程應(yīng)用。

5. pidstat 1

pidstat 命令有點像 top 命令中的為每個 CPU 統(tǒng)計信息功能,但是它是以不斷滾動更新的方式打印信息,而不是每次清屏打印。這個對于觀察隨時間變化的模式很有用,同時把你看到的信息(復(fù)制粘貼)記到你的調(diào)查記錄中。

上面的例子可以看出是 2 個 java 進程在消耗 CPU。%CPU 列是所有 CPU 的使用率;1591% 是說明這個 java 進程消耗了幾乎 16 個 CPU 核。

6. iostat -xz 1

這個工具對于理解塊設(shè)備(比如磁盤)很有用,展示了請求負(fù)載和性能數(shù)據(jù)。具體的數(shù)據(jù)看下面字段的解釋:

r/s, w/s, rkB/s, wkB/s:這些表示設(shè)備上每秒鐘的讀寫次數(shù)和讀寫的字節(jié)數(shù)(單位是 k 字節(jié))。這些可以看出設(shè)備的負(fù)載情況。性能問題可能就是簡單的因為大量的文件加載請求。

await:I/O 等待的平均時間(單位是毫秒)。這是應(yīng)用程序所等待的時間,包含了等待隊列中的時間和被調(diào)度服務(wù)的時間。過大的平均等待時間就預(yù)示著設(shè)備超負(fù)荷了或者說設(shè)備有問題了。

avgqu-sz:設(shè)備上請求的平均數(shù)。數(shù)值大于 1 可能表示設(shè)備飽和了(雖然設(shè)備通常都是可以支持并行請求的,特別是在背后掛了多個磁盤的虛擬設(shè)備)。

%util:設(shè)備利用率。是使用率的百分?jǐn)?shù),展示每秒鐘設(shè)備工作的時間。這個數(shù)值大于 60% 則會導(dǎo)致性能很低(可以在 await 中看),當(dāng)然這也取決于設(shè)備特點。這個數(shù)值接近 100% 則表示設(shè)備飽和了。

如果存儲設(shè)備是一個邏輯磁盤設(shè)備,后面掛載了多個磁盤,那么 100% 的利用率則只是表示有些 I/O 是在 100% 處理,然而后端的磁盤或許遠(yuǎn)遠(yuǎn)沒有飽和,還可以處理更多的請求。

請記住,磁盤 I/O 性能低不一定是應(yīng)用程序的問題。許多技術(shù)通常都被用來實現(xiàn)異步執(zhí)行 I/O,所以應(yīng)用程序不會直接阻塞和承受延時(比如:預(yù)讀取和寫緩沖技術(shù))。

7. free -m

右面兩列展示的是:

buffers:用于塊設(shè)備 I/O 緩沖的緩存。

cached:用于文件系統(tǒng)的頁緩存。

我們只想檢測這些緩存的數(shù)值是否接近 0 。不為 0 的可能導(dǎo)致較高的磁盤 I/O(通過 iostat 命令來確認(rèn))和較差的性能問題。上面的例子看起來沒問題,都還有很多 M 字節(jié)。

“-/+ buffers/cache” 這一行提供了對已使用和空閑內(nèi)存明確的統(tǒng)計。Linux 用空閑內(nèi)存作為緩存,如果應(yīng)用程序需要,可以快速拿回去。所以應(yīng)該包含空閑內(nèi)存那一列,這里就是這么統(tǒng)計的。甚至有一個網(wǎng)站專門來介紹 Linux 內(nèi)存消耗的問題:linuxatemyram。

如果在 Linux 上使用了 ZFS 文件系統(tǒng),則可能會更亂,因為當(dāng)我們在開發(fā)一些服務(wù)的時候,ZFS 有它自己的文件系統(tǒng)緩存,而這部分內(nèi)存的消耗是不會在 free -m 這個命令中合理的反映的。顯示了系統(tǒng)內(nèi)存不足,但是 ZFS 的這部分緩存是可以被應(yīng)用程序使用的。

8. sar -n DEV 1

使用這個工具是可以檢測網(wǎng)絡(luò)接口的吞吐:rxkB/s 和 txkB/s,作為收發(fā)數(shù)據(jù)負(fù)載的度量,也是檢測是否達(dá)到收發(fā)極限。在上面這個例子中,eth0 接收數(shù)據(jù)達(dá)到 22 M 字節(jié)/秒,也就是 176 Mbit/秒(網(wǎng)卡的上限是 1 Gbit/秒)。

這個版本的工具還有一個統(tǒng)計字段: %ifutil,用于統(tǒng)計設(shè)備利用率(全雙工雙向最大值),這個利用率也可以使用 Brendan 的 nicstat 工具來測量統(tǒng)計。在這個例子中 0.00 這種情況就似乎就是沒有統(tǒng)計,這個和 nicstat 一樣,這個值是比較難統(tǒng)計正確的。

9. sar -n TCP,ETCP 1

這是對 TCP 關(guān)鍵指標(biāo)的統(tǒng)計,它包含了以下內(nèi)容:

active/s:每秒本地發(fā)起的 TCP 連接數(shù)(例如通過 connect() 發(fā)起的連接)。

passive/s:每秒遠(yuǎn)程發(fā)起的連接數(shù)(例如通過 accept() 接受的連接)。

retrans/s:每秒 TCP 重傳數(shù)。

這種主動和被動統(tǒng)計數(shù)通常用作對系統(tǒng)負(fù)載的粗略估計:新接受連接數(shù)(被動),下游連接數(shù)(主動)。可以把主動看作是外部的,被動的是內(nèi)部,但是這個通常也不是非常準(zhǔn)確(例如:當(dāng)有本地到本地的連接時)。

重傳是網(wǎng)絡(luò)或者服務(wù)器有問題的一個信號;可能是一個不可靠的網(wǎng)絡(luò)(例如:公網(wǎng)),或者可能是因為服務(wù)器過載了開始丟包。上面這個例子可以看出是每秒新建一個 TCP 連接。

10. top

top 命令包含了很多我們前面提到的指標(biāo)。這個命令可以很容易看出指標(biāo)的變化表示負(fù)載的變化,這個看起來和前面的命令有很大不同。

top 的一個缺陷也比較明顯,很難看出變化趨勢,其它像 vmstat 和 pidstat 這樣的工具就會很清晰,它們是以滾動的方式輸出統(tǒng)計信息。所以如果你在看到有問題的信息時沒有及時的暫停下來(Ctrl-S 是暫停, Ctrl-Q 是繼續(xù)),那么這些有用的信息就會被清屏。

Follow-on Analysis還有很多可以使用來深挖系統(tǒng)問題的命令和技術(shù),可以看看 Brendan 在 2015 年講的 Linux 性能工具介紹 ,這里面講述了 40 多個命令,涵蓋了可觀測性,基準(zhǔn)測試,調(diào)優(yōu),靜態(tài)性能調(diào)優(yōu),分析和跟蹤等多個方面。

作者:helightxu,騰訊 IEG 開發(fā)工程師

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11279

    瀏覽量

    225015
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11760

    瀏覽量

    219042
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10253

    瀏覽量

    91496
  • Netflix
    +關(guān)注

    關(guān)注

    0

    文章

    90

    瀏覽量

    12003
  • 虛擬內(nèi)存
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    8459
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Kubernetes kubectl命令行工具詳解

    kubectl是Kubernetes官方提供的命令行工具,作為與Kubernetes集群交互的主要接口,它通過調(diào)用Kubernetes API Server實現(xiàn)對集群資源的全面管理。在生產(chǎn)環(huán)境中,運維工程師需要熟練掌握kubectl命令來完成日常的集群運維、應(yīng)用部署、故障
    的頭像 發(fā)表于 02-02 16:40 ?427次閱讀

    命令行阿里千問搭建過程

    克隆千問倉庫,安裝依賴; 下載模型權(quán)重; 命令行執(zhí)行啟動腳本,配置參數(shù)后運行推理。
    發(fā)表于 12-24 10:35

    學(xué)習(xí)Linux應(yīng)該從哪里開始?

    在工業(yè)控制、邊緣計算、人工智能這些領(lǐng)域,有一句幾乎約定俗成的話: “會不會 Linux,決定了你能走多遠(yuǎn)?!?但對很多剛?cè)腴T的工程師來說,Linux 看起來像個龐大又神秘的世界——命令行、驅(qū)動、內(nèi)核
    的頭像 發(fā)表于 10-16 09:51 ?456次閱讀
    學(xué)習(xí)<b class='flag-5'>Linux</b>應(yīng)該從哪里開始?

    所見即所得——Luban-Lite VS Code插件讓開發(fā)實現(xiàn)“命令行自由”

    NEWS所見即所得!Luban-LiteVSCode插件指南親愛的開發(fā)者朋友們,你是否還在為嵌入式開發(fā)中頻繁切換命令行而抓狂?配置環(huán)境參數(shù)如“走迷宮”,編譯燒錄還需切換AiBurn?今天,匠芯創(chuàng)為您
    的頭像 發(fā)表于 08-07 15:38 ?1104次閱讀
    所見即所得——Luban-Lite VS Code插件讓開發(fā)實現(xiàn)“<b class='flag-5'>命令行</b>自由”

    Linux系統(tǒng)安裝技巧與分區(qū)策略

    還記得第一次裝Linux系統(tǒng)時的忐忑嗎?面對fdisk命令行界面,不知道該如何下手。經(jīng)歷過無數(shù)次系統(tǒng)重裝、數(shù)據(jù)丟失的痛苦后,我總結(jié)出了這套"零事故"的分區(qū)方案。
    的頭像 發(fā)表于 08-06 17:51 ?1095次閱讀

    解析K8S實用命令

    前言: 作為運維工程師,掌握 Kubernetes 命令行工具是日常工作的核心技能。本文將深入解析 K8S 最實用的命令,從基礎(chǔ)操作到高級技巧,助你成為容器化集群管理專家。
    的頭像 發(fā)表于 07-24 14:07 ?874次閱讀

    已收藏!你需要知道的57個常用樹莓派命令!

    初次使用樹莓派并不總是那么容易,因為你可能還沒有使用命令行的習(xí)慣。然而,終端命令是必不可少的,而且通常比通過圖形用戶界面(GUI)操作更高效。那么,有哪些重要的命令是你應(yīng)該知道的呢?有相當(dāng)多的
    的頭像 發(fā)表于 07-23 18:36 ?1145次閱讀
    已收藏!你需要知道的57個常用樹莓派<b class='flag-5'>命令</b>!

    USB串行配置實用程序是否有可用的命令行版本?

    USB串行配置實用程序是否有可用的命令行版本?
    發(fā)表于 07-22 08:09

    淺談wsl --update` 命令行選項無效的解決方案

    PS C:\Users\Administrator> wsl --update >> 命令行選項無效: --update
    的頭像 發(fā)表于 06-27 10:28 ?1.1w次閱讀

    Linux常用命令大全

    Linux常用命令是指在Linux操作系統(tǒng)中廣泛使用的命令工具,這些命令工具可以完成各種不同的任務(wù),如管理文件和目錄、操作進程、網(wǎng)絡(luò)通信、軟
    的頭像 發(fā)表于 05-03 18:08 ?1866次閱讀

    aurix development studio無法用命令行編譯工程的原因?

    aurix development studio無法用命令行編譯工程
    發(fā)表于 04-18 06:50

    請問如何通過S32K312命令行構(gòu)建代碼?

    現(xiàn)在我們已經(jīng)通過 S32DS3.5 IDE 開發(fā)了固件,它也可以工作了。 最近,我們收到了通過命令行構(gòu)建代碼的要求,并且 我從 S32DS 幫助內(nèi)容中讀取了相關(guān)文檔,但這種情況會發(fā)生 有關(guān) JAVA
    發(fā)表于 04-09 07:48

    樹莓派新手必看!在樹莓派上編寫和運行 Shell 腳本!

    在本教程中,我將討論Shell腳本的基礎(chǔ)知識、它們的用途以及如何在RaspberryPi上編寫和運行Shell腳本。什么是Shell腳本?Shell腳本可以讓你自動化幾乎所有在Linux命令行上可以
    的頭像 發(fā)表于 03-25 09:28 ?1161次閱讀
    樹莓派新手必看!在樹莓派上編寫和運行 Shell 腳本!

    使用NXP MCX-N板卡新增命令控制

    此次任務(wù)通過串口命令行控制RGB LED,相比較與上一次任務(wù)通過單個字符控制增加了FreeRTOS-CLI組件,支持更復(fù)雜的、帶參數(shù)的命令。
    的頭像 發(fā)表于 03-17 13:38 ?1734次閱讀
    使用NXP MCX-N板卡新增<b class='flag-5'>命令</b>控制

    如何用幾條命令搞定Ubuntu系統(tǒng)的網(wǎng)絡(luò)配置

    在某些場景,設(shè)備沒有顯示器或屏可以用,這時候通過命令行來設(shè)置網(wǎng)絡(luò)就變得特別重要了。本文將介紹如何用幾條命令搞定Ubuntu系統(tǒng)的網(wǎng)絡(luò)配置。
    的頭像 發(fā)表于 03-14 10:53 ?3765次閱讀
    如何用幾條<b class='flag-5'>命令</b>搞定Ubuntu系統(tǒng)的網(wǎng)絡(luò)配置