Anwendungen mit Kubernetes und KEDA auf Null skalieren
Aus Kostengründen ist es oft weder machbar noch wünschenswert, einer Anwendung so viele Ressourcen zuzuweisen, dass sie jederzeit in der Lage ist, Spitzenlasten zu bewältigen. Daher skalieren wir Anwendungen in der Regel auf der Grundlage der aktuellen Last. Dies beinhaltet normalerweise eine Mindestanzahl von Instanzen, die zu jeder Zeit eingesetzt werden, auch wenn keine Last vorhanden ist. Dieses Minimum kann uns dazu zwingen, mehr Worker Nodes in unserem Kubernetes Cluster zu behalten als nötig, da die Instanzen ein zugewiesenes Ressourcenbudget haben. In diesem Blog-Beitrag sehen wir uns an, wie man die Mindestanzahl der bereitgestellten Instanzen auf Null reduzieren kann, und diskutieren, welche Arten von Anwendungen davon am meisten profitieren.