91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深入研究Kubernetes調(diào)度

阿銘linux ? 來源:K8sMeetup社區(qū) ? 作者:Ron Sobol ? 2021-08-23 10:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“本文從 Pod 和節(jié)點的配置開始,介紹了 Kubernetes Scheduler 框架、擴(kuò)展點、API 以及可能發(fā)生的與資源相關(guān)的瓶頸,并展示了性能調(diào)整設(shè)置,涵蓋了 Kubernetes 中調(diào)度的大多方面。

Kubernetes Scheduler 是 Kubernetes 控制平面的核心組件之一。它在控制平面上運行,將 Pod 分配給節(jié)點,同時平衡節(jié)點之間的資源利用率。將 Pod 分配給新節(jié)點后,在該節(jié)點上運行的 kubelet 會在 Kubernetes API 中檢索 Pod 定義,根據(jù)節(jié)點上的 Pod 規(guī)范創(chuàng)建資源和容器。換句話說,Scheduler 在控制平面內(nèi)運行,并將工作負(fù)載分配給 Kubernetes 集群。

本文將對 Kubernetes Scheduler 進(jìn)行深入研究,首先概述一般的調(diào)度以及具有親和力(affinity)和 taint 的驅(qū)逐調(diào)度,然后討論調(diào)度程序的瓶頸以及生產(chǎn)中可能遇到的問題,最后研究如何微調(diào)調(diào)度程序的參數(shù)以適合集群。

調(diào)度簡介

Kubernetes 調(diào)度是將 Pod 分配給集群中匹配節(jié)點的過程。Scheduler 監(jiān)控新創(chuàng)建的 Pod,并為其分配最佳節(jié)點。它會根據(jù) Kubernetes 的調(diào)度原則和我們的配置選項選擇最佳節(jié)點。最簡單的配置選項是直接在 PodSpec 設(shè)置 nodeName:

apiVersion: v1

kind: Pod

metadata:

name: nginx

spec:

containers

- name: nginx

image: nginx

nodeName: node-01

上面的 nginx pod 默認(rèn)情況下將在 node-01 上運行,但是 nodeName 有許多限制導(dǎo)致無法正常運行 Pod,例如云中節(jié)點名稱未知、資源節(jié)點不足以及節(jié)點網(wǎng)絡(luò)間歇性問題等。因此,除了測試或開發(fā)期間,我們最好不使用 nodeName。

如果要在一組特定的節(jié)點上運行 Pod,可以使用 nodeSelector。我們在 PodSpec 中將 nodeSelector 定義為一組鍵值對:

apiVersion: v1

kind: Pod

metadata:

name: nginx

spec:

containers:

- name: nginx

image: nginx

nodeSelector:

disktype: ssd

對于上面的 nginx pod,Kubernetes Scheduler 將找到一個磁盤類型為 ssd 的節(jié)點。當(dāng)然,該節(jié)點可以具有其他標(biāo)簽。我們可以在 Kubernetes 參考文檔中查看標(biāo)簽的完整列表。

地址:https://kubernetes.io/docs/reference/kubernetes-api/labels-annotations-taints/

使用 nodeSelector 有約束 Pod 可以在有特定標(biāo)簽的節(jié)點上運行。但它的使用僅受標(biāo)簽及其值限制。Kubernetes 中有兩個更全面的功能來表達(dá)更復(fù)雜的調(diào)度需求:節(jié)點親和力(node affinity),標(biāo)記容器以將其吸引到一組節(jié)點上;taint 和 toleration,標(biāo)記節(jié)點以排斥 Pod。這些功能將在下面討論。

節(jié)點親和力

節(jié)點親和力(Node Affinity)是在 Pod 上定義的一組約束,用于確定哪些節(jié)點適合進(jìn)行調(diào)度,即使用親和性規(guī)則為 Pod 的節(jié)點分配定義硬性要求和軟性要求。例如可以將 Pod 配置為僅運行帶有 GPU 的節(jié)點,并且最好使用 NVIDIA_TESLA_V100 運行深度學(xué)習(xí)工作負(fù)載。Scheduler 會評估規(guī)則,并在定義的約束內(nèi)找到合適的節(jié)點。與 nodeSelectors 相似,節(jié)點親和性規(guī)則可與節(jié)點標(biāo)簽一起使用,但它比 nodeSelectors 更強(qiáng)大。

我們可以為 podspec 添加四個相似性規(guī)則:

requiredDuringSchedulingIgnoredDuringExecution

requiredDuringSchedulingRequiredDuringExecution

preferredDuringSchedulingIgnoredDuringExecution

preferredDuringSchedulingRequiredDuringExecution

這四個規(guī)則由兩個條件組成:必需或首選條件,以及兩個階段:計劃和執(zhí)行。以 required 開頭的規(guī)則描述了必須滿足的嚴(yán)格要求。以 preferred 開頭的規(guī)則是軟性要求,將強(qiáng)制執(zhí)行但不能保證。調(diào)度階段是指將 Pod 首次分配給節(jié)點。執(zhí)行階段適用于在調(diào)度分配后節(jié)點標(biāo)簽發(fā)生更改的情況。

如果規(guī)則聲明為 IgnoredDuringExecution,Scheduler 在第一次分配后不會檢查其有效性。但如果使用 RequiredDuringExecution 指定了規(guī)則,Scheduler 會通過將容器移至合適的節(jié)點來確保規(guī)則的有效性。

以下是示例:

apiVersion: v1kind: Pod

metadata:

name: nginx

spec:

affinity:

nodeAffinity:

requiredDuringSchedulingIgnoredDuringExecution:

nodeSelectorTerms

- matchExpressions:

- key: topology.kubernetes.io/region

operator: In

values:

- us-east

preferredDuringSchedulingIgnoredDuringExecution:

- weight: 1

preference:

matchExpressions:

- key: topology.kubernetes.io/zone

operator: In

values:

- us-east-1

- us-east-2

containers:

- name: nginx

image: nginx

上面的 Nginx Pod 具有節(jié)點親和性規(guī)則,該規(guī)則讓 Kubernetes Scheduler 將 Pod 放置在 us-east 的節(jié)點上。第二條規(guī)則指示優(yōu)先使用 us-east-1 或 us-east-2。

使用親和性規(guī)則,我們可以讓 Kubernetes 調(diào)度決策適用于自定義需求。

Taint 與 Toleration

集群中并非所有 Kubernetes 節(jié)點都相同。某些節(jié)點可能具有特殊的硬件,例如 GPU、磁盤或網(wǎng)絡(luò)功能。同樣,我們可能需要將一些節(jié)點專用于測試、數(shù)據(jù)保護(hù)或用戶組。我們可以將 Taint 添加到節(jié)點以排斥 Pod,如以下示例所示:

kubectl taint nodes node1 test-environment=true:NoSchedule

使用 test-environment=true:NoScheduletaint 時,除非在 podspec 具有匹配的 toleration,否則 Kubernetes Scheduler 將不會分配任何 pod:

apiVersion: v1kind: Pod

metadata:

name: nginx

spec:

containers:

- name: nginx

image: nginx

tolerations:

- key: “test-environment”

operator: “Exists”

effect: “NoSchedule”

taint 和 tolerations 共同發(fā)揮作用,讓 Kubernetes Scheduler 專用于某些節(jié)點并分配特定 Pod。

調(diào)度瓶頸

盡管 Kubernetes Scheduler 能選擇最佳節(jié)點,但是在 Pod 開始運行之后,“最佳節(jié)點”可能會改變。所以從長遠(yuǎn)來看,Pod 的資源使用及其節(jié)點分配可能存在問題。

資源請求(Request)和限制(Limit):“Noisy Neighbor”

“Noisy Neighbor”并不特定于 Kubernetes。任何多租戶系統(tǒng)都是它們的潛在地。假設(shè)有兩個容器 A 和 B,它們在同一節(jié)點上運行。如果 Pod B 試圖通過消耗所有 CPU 或內(nèi)存來創(chuàng)造 noise,Pod A 將出現(xiàn)問題。如果我們?yōu)槿萜髟O(shè)置了資源請求和限制就能控制住 neighbor。Kubernetes 將確保為容器安排其請求的資源,并且不會消耗超出其資源限制的資源。如果在生產(chǎn)中運行 Kubernetes,最好設(shè)置資源請求和限制以確保系統(tǒng)可靠。

系統(tǒng)進(jìn)程資源不足

Kubernetes 節(jié)點主要是連接到 Kubernetes 控制平面的虛擬機(jī)。因此,節(jié)點上也有自己的操作系統(tǒng)和相關(guān)進(jìn)程。如果 Kubernetes 工作負(fù)載消耗了所有資源,則這些節(jié)點將無法運行,并會發(fā)生各種問題問題。我們需要在 kubelet 中使用 –system -reserved 設(shè)置保留資源,以防止發(fā)生這種情況。

搶占或調(diào)度 Pod

如果 Kubernetes Scheduler 無法將 Pod 調(diào)度到可用節(jié)點,則可以從節(jié)點搶占(preempt)或驅(qū)逐(evict)一些 Pod 以分配資源。如果看到 Pod 在集群中移動而沒有發(fā)現(xiàn)特定原因,可以使用優(yōu)先級類對其進(jìn)行定義。同樣,如果沒有調(diào)度好 Pod,并且正在等待其他 Pod,也需要檢查其優(yōu)先級。

以下是示例:

apiVersion: scheduling.k8s.io/v1kind: PriorityClass

metadata:

name: high-priority-nonpreempting

value: 100000preemptionPolicy: NeverglobalDefault: false

description: “This priority class will not preempt other pods.”

可以通過以下方式在 podspec 中為分配優(yōu)先級:

apiVersion: v1kind: Pod

metadata:

name: nginx

spec:

containers:

- name: nginx

image: nginx

priorityClassName: high-priority-nonpreempting

調(diào)度框架

Kubernetes Scheduler 具有可插拔的調(diào)度框架架構(gòu),可向框架添加一組新的插件。插件實現(xiàn) Plugin API,并被編譯到調(diào)度程序中。下面我們將討論調(diào)度框架的工作流、擴(kuò)展點和 Plugin API。

工作流和擴(kuò)展點

調(diào)度 Pod 包括兩個階段:調(diào)度周期(scheduling cycle)和綁定周期(binding cycle)。在調(diào)度周期中,Scheduler 會找到一個可用節(jié)點,然后在綁定過程中,將決策應(yīng)用于集群。

工作流中的以下幾點對插件擴(kuò)展開放:

QueueSort:對隊列中的 Pod 進(jìn)行排序

PreFilter:檢查預(yù)處理 Pod 的相關(guān)信息以安排調(diào)度周期

Filter:過濾不適合該 Pod 的節(jié)點

PostFilter:如果找不到可用于 Pod 的可行節(jié)點,調(diào)用該插件

PreScore:運行 PreScore 任務(wù)以生成一個可共享狀態(tài)供 Score 插件使用

Score:通過調(diào)用每個 Score 插件對過濾的節(jié)點進(jìn)行排名

NormalizeScore:合并分?jǐn)?shù)并計算節(jié)點的最終排名

Reserve:在綁定周期之前選擇保留的節(jié)點

Permit:批準(zhǔn)或拒絕調(diào)度周期結(jié)果

PreBind:執(zhí)行任何先決條件工作,例如配置網(wǎng)絡(luò)卷

Bind:將 Pod 分配給 Kubernetes API 中的節(jié)點

PostBind:通知綁定周期的結(jié)果

插件擴(kuò)展實現(xiàn)了 Plugin API,是 Kubernetes Scheduler 的一部分。我們可以在 Kubernetes 存儲庫中檢查。插件應(yīng)使用以下名稱進(jìn)行注冊:

// Plugin is the parent type for all the scheduling framework plugins.

type Plugin interface {

Name() string

}

插件還實現(xiàn)了相關(guān)的擴(kuò)展點,如下所示:

// QueueSortPlugin is an interface that must be implemented by “QueueSort” plugins.

// These plugins are used to sort pods in the scheduling queue. Only one queue sort plugin may be enabled at a time.

type QueueSortPlugin interface {

Plugin

// Less are used to sort pods in the scheduling queue.

Less(*QueuedPodInfo, *QueuedPodInfo) bool

}

Scheduler 性能調(diào)整

Kubernetes Scheduler 有一個工作流來查找和綁定 Pod 的可行節(jié)點。當(dāng)集群中的節(jié)點數(shù)量非常多時,Scheduler 的工作量將成倍增加。在大型集群中,可能需要很長時間才能找到最佳節(jié)點,因此要微調(diào)調(diào)度程序的性能,以在延遲和準(zhǔn)確性之間找到折中方案。

percentageOfNodesToScore 將限制節(jié)點的數(shù)量來計算自己的分?jǐn)?shù)。默認(rèn)情況下,Kubernetes 在 100 節(jié)點集群的 50% 和 5000 節(jié)點集群的 10% 之間設(shè)置線性閾值。默認(rèn)最小值為 5%,它要確保至少考慮集群中 5% 節(jié)點的調(diào)度。

下面的示例展示了如何通過性能調(diào)整 kube-scheduler 來手動設(shè)置閾值:

apiVersion: kubescheduler.config.k8s.io/v1alpha1

kind: KubeSchedulerConfiguration

algorithmSource:

provider: DefaultProvider

percentageOfNodesToScore: 50

如果有一個龐大的集群并且 Kubernetes 工作負(fù)載不能承受 Kubernetes Scheduler 引起的延遲,那么更改百分比是個好主意。

總結(jié)

本文涵蓋了 Kubernetes 調(diào)度的大多方面,從 Pod 和節(jié)點的配置開始,包括 nodeSelector、親和性規(guī)則、taint 和 toleration,然后介紹了 Kubernetes Scheduler 框架、擴(kuò)展點、API 以及可能發(fā)生的與資源相關(guān)的瓶頸,最后展示了性能調(diào)整設(shè)置。盡管 Kubernetes Scheduler 能簡單地將 Pod 分配給節(jié)點,但是了解其動態(tài)性并對其進(jìn)行配置以實現(xiàn)可靠的生產(chǎn)級 Kubernetes 設(shè)置至關(guān)重要。

原文鏈接:https://thenewstack.io/a-deep-dive-into-kubernetes-scheduling/

作者:Ron Sobol. 翻譯:Bach(才云)

校對:星空下的文仔(才云)、bot(才云)

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • kubernetes
    +關(guān)注

    關(guān)注

    0

    文章

    263

    瀏覽量

    9492

原文標(biāo)題:Kubernetes 調(diào)度詳解

文章出處:【微信號:aming_linux,微信公眾號:阿銘linux】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Kubernetes Pod調(diào)度策略原理與落地指南

    Pod調(diào)度Kubernetes的核心機(jī)制之一,決定了Pod最終運行在哪個節(jié)點上。默認(rèn)調(diào)度器kube-scheduler通過一系列預(yù)選(Filtering)和優(yōu)選(Scoring)算法完成調(diào)度
    的頭像 發(fā)表于 02-27 11:08 ?136次閱讀

    KubePi:開源Kubernetes可視化管理面板,讓集群管理如此簡單

    同集群(Cluster)和命名空間(Namespace)的管理權(quán)限分配給指定用戶。這意味著: 開發(fā)人員 :可以管理集群中運行的應(yīng)用程序并進(jìn)行故障排查,而無需深入掌握復(fù)雜的Kubernetes命令。 運
    發(fā)表于 02-11 12:53

    Kubernetes kubectl命令行工具詳解

    kubectl是Kubernetes官方提供的命令行工具,作為與Kubernetes集群交互的主要接口,它通過調(diào)用Kubernetes API Server實現(xiàn)對集群資源的全面管理。在生產(chǎn)環(huán)境中,運維工程師需要熟練掌握kubec
    的頭像 發(fā)表于 02-02 16:40 ?404次閱讀

    深入Linux內(nèi)核:進(jìn)程調(diào)度的核心邏輯與實現(xiàn)細(xì)節(jié)

    在Linux系統(tǒng)中,進(jìn)程調(diào)度就像一位精明的“CPU管理員”——它決定著哪個進(jìn)程能優(yōu)先使用CPU,多久切換一次進(jìn)程,如何平衡系統(tǒng)響應(yīng)速度與資源利用率。小到桌面應(yīng)用的流暢點擊,大到服務(wù)器的多任務(wù)并發(fā)
    的頭像 發(fā)表于 12-24 07:05 ?4286次閱讀
    <b class='flag-5'>深入</b>Linux內(nèi)核:進(jìn)程<b class='flag-5'>調(diào)度</b>的核心邏輯與實現(xiàn)細(xì)節(jié)

    香港服務(wù)器支持Docker和Kubernetes嗎?

    在云原生技術(shù)成為主流的今天,Docker和Kubernetes(K8s)已成為現(xiàn)代化應(yīng)用開發(fā)和部署的事實標(biāo)準(zhǔn)。對于選擇香港服務(wù)器的開發(fā)者與企業(yè)而言,一個核心問題是:香港服務(wù)器能否完美支持Docker
    的頭像 發(fā)表于 10-21 15:47 ?673次閱讀

    Kubernetes安全加固的核心技術(shù)

    在生產(chǎn)環(huán)境中,Kubernetes集群的安全性直接關(guān)系到企業(yè)數(shù)據(jù)安全和業(yè)務(wù)穩(wěn)定性。本文將從實戰(zhàn)角度,帶你掌握K8s安全加固的核心技術(shù)。
    的頭像 發(fā)表于 08-18 11:18 ?796次閱讀

    高效管理Kubernetes集群的實用技巧

    作為一名經(jīng)驗豐富的運維工程師,我深知在日常的Kubernetes集群管理中,熟練掌握kubectl命令是提升工作效率的關(guān)鍵。今天,我將分享15個經(jīng)過實戰(zhàn)檢驗的kubectl實用技巧,幫助你像藝術(shù)家一樣優(yōu)雅地管理K8s集群。
    的頭像 發(fā)表于 08-13 15:57 ?916次閱讀

    生產(chǎn)環(huán)境中Kubernetes容器安全的最佳實踐

    隨著容器化技術(shù)的快速發(fā)展,Kubernetes已成為企業(yè)級容器編排的首選平臺。然而,在享受Kubernetes帶來的便利性和可擴(kuò)展性的同時,安全問題也日益凸顯。本文將從運維工程師的角度,深入探討生產(chǎn)環(huán)境中
    的頭像 發(fā)表于 07-14 11:09 ?730次閱讀

    你懂不懂DL/T645協(xié)議?看這篇文章,包你懂!

    DL/T645協(xié)議不用深入研究,掌握這些就夠用了。
    的頭像 發(fā)表于 06-12 17:24 ?2613次閱讀
    你懂不懂DL/T645協(xié)議?看這篇文章,包你懂!

    詳解Kubernetes中的Pod調(diào)度親和性

    Kubernetes(K8s)中,Pod 調(diào)度親和性(Affinity) 是一種高級調(diào)度策略,用于控制 Pod 與節(jié)點(Node)或其他 Pod 之間的關(guān)聯(lián)(親和)或反關(guān)聯(lián)(反親和)關(guān)系。通過親和性規(guī)則,管理員可以更精細(xì)地控
    的頭像 發(fā)表于 06-07 13:56 ?929次閱讀

    Kubernetes Helm入門指南

    Helm 是 Kubernetes 的包管理工具,它允許開發(fā)者和系統(tǒng)管理員通過定義、打包和部署應(yīng)用程序來簡化 Kubernetes 應(yīng)用的管理工作。Helm 的出現(xiàn)是為了解決在 Kubernetes
    的頭像 發(fā)表于 04-30 13:42 ?3078次閱讀
    <b class='flag-5'>Kubernetes</b> Helm入門指南

    直流電機(jī)控制方法的Matlab仿真研究

    針對無刷直流電機(jī)的控制方法進(jìn)行了深入研究 。根據(jù)無刷直流電機(jī)實際物理模型建立相應(yīng)的數(shù)學(xué)模型,電機(jī)使用雙閉環(huán)進(jìn)行控制 。根據(jù)電機(jī)的實際工作特點,使用模糊自適應(yīng) PID 算法替代常規(guī) PID 算法建立
    發(fā)表于 03-27 12:15

    Kubernetes中部署MySQL集群

    一般情況下 Kubernetes 可以通過 ReplicaSet 以一個 Pod 模板創(chuàng)建多個 pod 副本,但是它們都是無狀態(tài)的,任何時候它們都可以被一個全新的 pod 替換。
    的頭像 發(fā)表于 03-18 16:22 ?784次閱讀
    <b class='flag-5'>Kubernetes</b>中部署MySQL集群

    是否可以使用DMA和LPSPI的3字節(jié)幀大?。?/a>

    DMA 傳輸為24字節(jié)。 我不需要 CPU 干預(yù),所以一切都需要在 DMA 設(shè)置中進(jìn)行配置,否則就違背了使用 DMA 的目的。 此時,除非我們進(jìn)一步深入研究,否則我不會分享我的代碼,但我
    發(fā)表于 03-17 06:47

    Kubernetes包管理工具Helm的安裝和使用

    Helm 可以幫助我們管理 Kubernetes 應(yīng)用程序 - Helm Charts 可以定義、安裝和升級復(fù)雜的 Kubernetes 應(yīng)用程序,Charts 包很容易創(chuàng)建、版本管理、分享和分布。
    的頭像 發(fā)表于 03-13 16:06 ?2180次閱讀