久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

Daemonset Controller對Critical Pod的特殊處理是什么

152次閱讀
沒有評論

共計 8011 個字符,預計需要花費 21 分鐘才能閱讀完成。

這篇文章主要介紹“Daemonset Controller 對 Critical Pod 的特殊處理是什么”,在日常操作中,相信很多人在 Daemonset Controller 對 Critical Pod 的特殊處理是什么問題上存在疑惑,丸趣 TV 小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Daemonset Controller 對 Critical Pod 的特殊處理是什么”的疑惑有所幫助!接下來,請跟著丸趣 TV 小編一起來學習吧!

Daemonset Controller 對 CriticalPod 的特殊處理

在 DaemonSetController 判斷某個 node 上是否要運行某個 DaemonSet 時,會調用 DaemonSetsController.simulate 來分析 PredicateFailureReason。

pkg/controller/daemon/daemon_controller.go:1206
func (dsc *DaemonSetsController) simulate(newPod *v1.Pod, node *v1.Node, ds *apps.DaemonSet) ([]algorithm.PredicateFailureReason, *schedulercache.NodeInfo, error) {
 // DaemonSet pods shouldn t be deleted by NodeController in case of node problems.
 // Add infinite toleration for taint notReady:NoExecute here
 // to survive taint-based eviction enforced by NodeController
 // when node turns not ready.
 v1helper.AddOrUpdateTolerationInPod(newPod,  v1.Toleration{
 Key: algorithm.TaintNodeNotReady,
 Operator: v1.TolerationOpExists,
 Effect: v1.TaintEffectNoExecute,
 // DaemonSet pods shouldn t be deleted by NodeController in case of node problems.
 // Add infinite toleration for taint unreachable:NoExecute here
 // to survive taint-based eviction enforced by NodeController
 // when node turns unreachable.
 v1helper.AddOrUpdateTolerationInPod(newPod,  v1.Toleration{
 Key: algorithm.TaintNodeUnreachable,
 Operator: v1.TolerationOpExists,
 Effect: v1.TaintEffectNoExecute,
 // According to TaintNodesByCondition, all DaemonSet pods should tolerate
 // MemoryPressure and DisPressure taints, and the critical pods should tolerate
 // OutOfDisk taint additional.
 v1helper.AddOrUpdateTolerationInPod(newPod,  v1.Toleration{
 Key: algorithm.TaintNodeDiskPressure,
 Operator: v1.TolerationOpExists,
 Effect: v1.TaintEffectNoSchedule,
 v1helper.AddOrUpdateTolerationInPod(newPod,  v1.Toleration{
 Key: algorithm.TaintNodeMemoryPressure,
 Operator: v1.TolerationOpExists,
 Effect: v1.TaintEffectNoSchedule,
 // TODO(#48843) OutOfDisk taints will be removed in 1.10
 if utilfeature.DefaultFeatureGate.Enabled(features.ExperimentalCriticalPodAnnotation)  
 kubelettypes.IsCriticalPod(newPod) {
 v1helper.AddOrUpdateTolerationInPod(newPod,  v1.Toleration{
 Key: algorithm.TaintNodeOutOfDisk,
 Operator: v1.TolerationOpExists,
 Effect: v1.TaintEffectNoSchedule,
 _, reasons, err := Predicates(newPod, nodeInfo)
 return reasons, nodeInfo, err
}

DeamonSetController 會給 Pod 添加以下 Toleratoins,防止 Node 出現以下 Conditions 被 Node Controller Taint-based eviction 殺死。

NotReady:NoExecute

Unreachable:NoExecute

MemoryPressure:NoSchedule

DisPressure:NoSchedule

當 ExperimentalCriticalPodAnnotation Feature Gate Enable,并且該 Pod 是 CriticalPod 時,還會給該 Pod 加上 OutOfDisk:NoSchedule Toleration。

在 simulate 中,還會像類似 scheduler 一樣,進行 Predicates 處理。Predicates 過程中也對 CriticalPod 做了區分對待。

pkg/controller/daemon/daemon_controller.go:1413
// Predicates checks if a DaemonSet s pod can be scheduled on a node using GeneralPredicates
// and PodToleratesNodeTaints predicate
func Predicates(pod *v1.Pod, nodeInfo *schedulercache.NodeInfo) (bool, []algorithm.PredicateFailureReason, error) {var predicateFails []algorithm.PredicateFailureReason
 // If ScheduleDaemonSetPods is enabled, only check nodeSelector and nodeAffinity.
 if false /*disabled for 1.10*/   utilfeature.DefaultFeatureGate.Enabled(features.ScheduleDaemonSetPods) {fit, reasons, err := nodeSelectionPredicates(pod, nil, nodeInfo)
 if err != nil {
 return false, predicateFails, err
 if !fit {predicateFails = append(predicateFails, reasons...)
 return len(predicateFails) == 0, predicateFails, nil
 critical := utilfeature.DefaultFeatureGate.Enabled(features.ExperimentalCriticalPodAnnotation)  
 kubelettypes.IsCriticalPod(pod)
 fit, reasons, err := predicates.PodToleratesNodeTaints(pod, nil, nodeInfo)
 if err != nil {
 return false, predicateFails, err
 if !fit {predicateFails = append(predicateFails, reasons...)
 if critical {
 // If the pod is marked as critical and support for critical pod annotations is enabled,
 // check predicates for critical pods only.
 fit, reasons, err = predicates.EssentialPredicates(pod, nil, nodeInfo)
 } else {fit, reasons, err = predicates.GeneralPredicates(pod, nil, nodeInfo)
 if err != nil {
 return false, predicateFails, err
 if !fit {predicateFails = append(predicateFails, reasons...)
 return len(predicateFails) == 0, predicateFails, nil
}

如果是 CriticalPod,調用 predicates.EssentialPredicates,否則調用 predicates.GeneralPredicates。

這里的 GeneralPredicates 與 EssentialPredicates 有何不同呢?其實 GeneralPredicates 就是比 EssentialPredicates 多了 noncriticalPredicates 處理,也就是 Scheduler 的 Predicate 中的 PodFitsResources。

pkg/scheduler/algorithm/predicates/predicates.go:1076
// noncriticalPredicates are the predicates that only non-critical pods need
func noncriticalPredicates(pod *v1.Pod, meta algorithm.PredicateMetadata, nodeInfo *schedulercache.NodeInfo) (bool, []algorithm.PredicateFailureReason, error) {var predicateFails []algorithm.PredicateFailureReason
 fit, reasons, err := PodFitsResources(pod, meta, nodeInfo)
 if err != nil {
 return false, predicateFails, err
 if !fit {predicateFails = append(predicateFails, reasons...)
 return len(predicateFails) == 0, predicateFails, nil
}

因此,對于 CriticalPod,DeamonSetController 進行 Predicate 時不會進行 PodFitsResources 檢查。

PriorityClass Validate 對 CriticalPod 的特殊處理

在 Kubernetes 1.11 中,很重要的個更新就是,Priority 和 Preemption 從 alpha 升級為 Beta 了,并且是 Enabled by default。

Kubernetes VersionPriority and Preemption StateEnabled by default1.8alphano1.9alphano1.10alphano1.11betayes

PriorityClass 是屬于 scheduling.k8s.io/v1alpha1GroupVersion 的,在 client 提交創建 PriorityClass 請求后,寫入 etcd 前,會進行合法性檢查(Validate),這其中就有對 SystemClusterCritical 和 SystemNodeCritical 兩個 PriorityClass 的特殊對待。

pkg/apis/scheduling/validation/validation.go:30
// ValidatePriorityClass tests whether required fields in the PriorityClass are
// set correctly.
func ValidatePriorityClass(pc *scheduling.PriorityClass) field.ErrorList {
 // If the priorityClass starts with a system prefix, it must be one of the
 // predefined system priority classes.
 if strings.HasPrefix(pc.Name, scheduling.SystemPriorityClassPrefix) {if is, err := scheduling.IsKnownSystemPriorityClass(pc); !is {allErrs = append(allErrs, field.Forbidden(field.NewPath( metadata ,  name),  priority class names with  +scheduling.SystemPriorityClassPrefix+  prefix are reserved for system use only. error:  +err.Error()))
 } 
 return allErrs
// IsKnownSystemPriorityClass checks that  pc  is equal to one of the system PriorityClasses.
// It ignores  description , labels, annotations, etc. of the PriorityClass.
func IsKnownSystemPriorityClass(pc *PriorityClass) (bool, error) {
 for _, spc := range systemPriorityClasses {
 if spc.Name == pc.Name {
 if spc.Value != pc.Value {return false, fmt.Errorf( value of %v PriorityClass must be %v , spc.Name, spc.Value)
 if spc.GlobalDefault != pc.GlobalDefault {return false, fmt.Errorf( globalDefault of %v PriorityClass must be %v , spc.Name, spc.GlobalDefault)
 return true, nil
 return false, fmt.Errorf(%v is not a known system priority class , pc.Name)
}

PriorityClass 的 Validate 時,如果 PriorityClass s Name 是以 **system-** 為前綴的,那么必須是 system-cluster-critical 或者 system-node-critical 之一。否則就會 Validate Error,拒絕提交。

如果提交的 PriorityClass s Name 為 system-cluster-critical 或者 system-node-critical,那么要求 globalDefault 必須為 false,即 system-cluster-critical 或者 system-node-critical 不能是全局默認的 PriorityClass。

另外,在 PriorityClass 進行 Update 時,目前是不允許其 Name 和 Value 的,也就是說只能更新 Description 和 globalDefault。

pkg/apis/scheduling/helpers.go:27
// SystemPriorityClasses define system priority classes that are auto-created at cluster bootstrapping.
// Our API validation logic ensures that any priority class that has a system prefix or its value
// is higher than HighestUserDefinablePriority is equal to one of these SystemPriorityClasses.
var systemPriorityClasses = []*PriorityClass{
 ObjectMeta: metav1.ObjectMeta{
 Name: SystemNodeCritical,
 Value: SystemCriticalPriority + 1000,
 Description:  Used for system critical pods that must not be moved from their current node. ,
 ObjectMeta: metav1.ObjectMeta{
 Name: SystemClusterCritical,
 Value: SystemCriticalPriority,
 Description:  Used for system critical pods that must run in the cluster, but can be moved to another node if necessary. ,
}

到此,關于“Daemonset Controller 對 Critical Pod 的特殊處理是什么”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注丸趣 TV 網站,丸趣 TV 小編會繼續努力為大家帶來更多實用的文章!

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2023-08-16發表,共計8011字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 乳山市| 肥城市| 克山县| 兴宁市| 韶关市| 黄大仙区| 徐闻县| 若羌县| 武川县| 建阳市| 讷河市| 泽库县| 正宁县| 岳阳县| 大石桥市| 厦门市| 黄大仙区| 甘孜县| 洞头县| 苗栗县| 三门县| 沽源县| 临泽县| 安庆市| 华蓥市| 哈尔滨市| 洛隆县| 太湖县| 应城市| 勐海县| 通道| 台南市| 宣武区| 句容市| 临泽县| 邛崃市| 华安县| 方正县| 专栏| 馆陶县| 扶风县|