Déployer une app Node.js sur Kubernetes

Comprendre Kubernetes : concepts fondamentaux

Qu'est-ce qu'un Cluster Kubernetes ?

Un cluster est un ensemble de machines (physiques ou virtuelles) orchestrées par Kubernetes. Chaque machine est appelée un nœud. Le cluster exécute vos conteneurs (pods), distribue le trafic, gère les mises à jour et redémarre automatiquement les applications qui tombent en panne.

Pourquoi c'est utile : Au lieu de gérer chaque serveur manuellement, vous décrivez l'état souhaité (« je veux 3 instances de mon API »), et Kubernetes maintient cet état automatiquement.

Qu'est-ce que Minikube ?

Minikube est un cluster Kubernetes minimaliste qui s'exécute localement sur votre machine (dans une VM ou un conteneur). Il simule un vrai cluster Kubernetes pour le développement.

Pourquoi l'utiliser : Au lieu de louer un cluster cloud (GKE, EKS) pendant le développement, Minikube vous permet de tester gratuitement sur votre laptop. Les concepts sont identiques, seule l'infrastructure change.

Glossaire Kubernetes

Pod : La plus petite unité exécutable en Kubernetes. C'est un wrapper autour d'un ou plusieurs conteneurs Docker. Généralement, 1 pod = 1 conteneur.
Deployment : Une description déclarative de votre application : combien de réplicas, quelle image Docker, comment mettre à jour, etc. Kubernetes crée et maintient les pods selon cette description.
Service : Expose vos pods au réseau. Il fournit une IP stable et équilibre le trafic entre les pods. Sans Service, il est difficile d'accéder à vos pods de l'extérieur.
Rolling Update : Une stratégie de mise à jour où les anciennes instances sont remplacées progressivement par les nouvelles, sans arrêt du service. L'utilisateur ne remarque aucune interruption.
HPA (Horizontal Pod Autoscaler) : Augmente ou diminue automatiquement le nombre de réplicas en fonction des métriques (CPU, mémoire). Si la charge augmente, plus de pods démarrent.
Namespace : Partitionnement virtuel du cluster. Permet d'isoler les ressources et les équipes. Par défaut, vous travaillez dans le namespace « default ».

Prérequis

Avant de commencer, assurez-vous d'avoir :

Docker installé — pour construire des images conteneur
Minikube installé — brew install minikube (Mac) ou consulter docs.minikube.sigs.k8s.io
kubectl installé — brew install kubectl (l'outil CLI pour parler à Kubernetes)
Notions basiques de Docker (images, conteneurs, Dockerfile)
Familiarité avec Node.js et Express

1. L'application Node.js

Nous allons créer une API Express simple avec trois endpoints : la racine (pour tester), /health (pour les liveness probes) et /ready (pour les readiness probes). Ces endpoints permettront à Kubernetes de vérifier que l'application est saine.

app.js

const express = require('express');
const app = express();
const PORT = process.env.PORT || 3000;
const VERSION = process.env.APP_VERSION || 'v1';

// Route principale : teste que l'API fonctionne et retourne des infos
app.get('/', (req, res) => {
  res.json({
    message: 'API Node.js opérationnelle',
    version: VERSION,  // Permet de voir quelle version tournée pendant les updates
    hostname: require('os').hostname(),  // Nom du pod Kubernetes (utile pour observer la distribution du trafic)
    timestamp: new Date().toISOString()  // Timestamp de la réponse
  });
});

// Liveness probe : Kubernetes utilise cette route pour vérifier si le pod est vivant
// Si elle retourne un code != 200, le pod sera redémarré
app.get('/health', (req, res) => {
  res.json({ status: 'healthy', version: VERSION });
});

// Readiness probe : Kubernetes utilise cette route pour vérifier si le pod peut recevoir du trafic
// Ici on simule une vérification : évidemment, on vérifie aussi les dépendances (DB, cache)
app.get('/ready', (req, res) => {
  // En production, vérifier ici que les DB et caches sont connectés
  res.json({ ready: true });
});

// Démarrer le serveur sur le port spécifié
app.listen(PORT, () => {
  console.log(`Serveur v${VERSION} démarré sur le port ${PORT}`);
});

Ce fichier définit une API Express minimal avec trois routes :

/ : retourne des infos sur le pod (version, hostname, timestamp)
/health : utilisée par Kubernetes pour vérifier que le pod est vivant (liveness probe)
/ready : utilisée par Kubernetes pour savoir si le pod peut recevoir du trafic (readiness probe)

L'application lit APP_VERSION et PORT depuis les variables d'environnement, qui seront passées par Kubernetes dans le Deployment.

Différence entre Liveness Probe et Readiness Probe

Liveness Probe (/health) : vérifie que le processus est toujours vivant. Si elle échoue 3 fois d'affilée, Kubernetes redémarre le pod. C'est pour détecter les deadlocks ou les fuites mémoire qui congelaient l'app.

Readiness Probe (/ready) : vérifie que le pod peut traiter du trafic. Si elle échoue, Kubernetes retire le pod du Service (pas de redémarrage). C'est pour éviter de envoyer du trafic à un pod qui initialise une connexion DB ou qui subit une maintenance.

Cas d'usage : Une app qui démarre met 10 secondes à se connecter à la DB. Pendant ces 10 secondes, readiness = false, mais liveness = true (le processus est vivant). Kubernetes n'envoie pas de trafic, mais ne redémarre pas non plus.

package.json

{
  "name": "api-k8s",
  "version": "1.0.0",
  "scripts": {
    "start": "node app.js"
  },
  "dependencies": {
    "express": "^4.19.2"
  }
}

Un package.json standard déclarant Express comme dépendance. Le script start lance l'application.

2. Dockerfile : construire l'image conteneur

Dockerfile

# Image de base : Node.js 20 sur Alpine Linux
# Alpine est petit (30 MB) et sécurisé — avantage pour Kubernetes
FROM node:20-alpine

# Créer le répertoire de travail
WORKDIR /app

# Copier package.json et package-lock.json si existant
# On utilise package*.json (wildcard) : copy les deux fichiers s'ils existent
COPY package*.json ./

# Installer les dépendances en mode production uniquement
# npm ci = "ci" = "clean install" = reproduction exacte des versions de package-lock.json
# --only=production = ne pas installer les devDependencies
RUN npm ci --only=production

# Copier le reste du code source
COPY . .

# Créer un groupe et un utilisateur non-root pour la sécurité
# Ne JAMAIS faire tourner Node en tant que root — vulnérabilité de sécurité
RUN addgroup -g 1001 -S nodejs && adduser -S nodeapp -u 1001
USER nodeapp

# Déclarer le port écouté (informatif, ne lie pas le port)
EXPOSE 3000

# Commande au démarrage du conteneur
CMD ["node", "app.js"]

Pourquoi utiliser Alpine ? Les images Alpine sont minuscules (30 MB vs 300 MB pour Node:20). En Kubernetes, moins l'image est grosse, plus vite elle démarre et moins elle consomme de bande passante réseau. Chaque seconde compte en production.

Pourquoi lire package-lock.json et pas réinstaller les dépendances ? Le fichier package-lock.json contient les versions exactes de toutes les dépendances. npm ci respecte ce fichier, garantissant que le conteneur construit aujourd'hui fonctionnera comme celui construit hier. npm install pourrait upgrader des versions mineures, introduisant des bugs imprévisibles.

Pourquoi un utilisateur non-root ? Si un attaquant s'introduit dans le conteneur, il doit au moins ne pas être root. Exécuter en tant que root augmente les dégâts d'une compromission. C'est une bonne pratique de sécurité appelée « principle of least privilege ».

Le Dockerfile construira une image Docker contenant : une image Alpine Linux + Node.js + les dépendances npm + votre code. Cette image sera exécutée dans chaque pod Kubernetes.

3. Construire et charger l'image dans Minikube

Terminal

# Étape 1 : Démarrer Minikube (si pas déjà lancé)
minikube start

# Étape 2 : Pointer Docker vers le daemon Minikube
# eval charge les variables d'environnement Docker de Minikube dans votre shell
eval $(minikube docker-env)

# Étape 3 : Construire l'image directement dans le Docker de Minikube
# (pas besoin de pousser sur Docker Hub)
docker build -t api-nodejs:v1 .

# Étape 4 : Vérifier que l'image existe dans Minikube
docker images | grep api-nodejs
# output: api-nodejs   v1   abc123def456   100MB   2 minutes ago

Le processus complet de construction :

minikube start lance une VM ou un conteneur Minikube avec Kubernetes
eval $(minikube docker-env) configure votre CLI Docker pour parler au daemon Docker à l'intérieur de Minikube, pas à celui de votre machine
docker build -t api-nodejs:v1 . construit l'image dans Minikube
docker images liste les images présentes dans Minikube

Qu'est-ce qu'une Registry Docker ?

Une registry est un serveur qui stocke des images Docker. Exemples : Docker Hub (public), Google Container Registry (GCR), Amazon ECR. En production, vous poussez votre image sur une registry, puis Kubernetes la télécharge de là.

Pourquoi construire dans Minikube ? Minikube a sa propre registry locale. En exécutant eval $(minikube docker-env), vous construisez directement dedans, sans besoin d'une registry externe. C'est la manière développement idéale : rapide et sans frais.

4. Les manifestes Kubernetes : infrastructure déclarative

Infrastructure déclarative vs impérative

Impérative : « Démarrer un conteneur, puis attacher un réseau, puis configurer les logs... » (commandes step-by-step)

Déclarative : « Voici le fichier YAML décrivant l'état souhaité. Kubernetes, fais en sorte que la réalité corresponde. »

Kubernetes fonctionne déclarativement. Vous décrivez l'état souhaité dans des fichiers YAML (Deployment, Service, etc.), puis Kubernetes garantit que l'état réel converge vers cet état souhaité — même si vous relancez les fichiers 10 fois.

4.1 Deployment — décrire votre application

deployment.yaml

# Quelle version de l'API Kubernetes utiliser
# apps/v1 est la version stable pour les Deployments
apiVersion: apps/v1

# Le type de ressource : Deployment
kind: Deployment

# Métadonnées de la ressource
metadata:
  # Nom unique du Deployment dans le cluster
  name: api-nodejs
  # Labels pour trier/chercher les ressources (optionnels mais bonne pratique)
  labels:
    app: api-nodejs
    tier: api

# Spécification : l'état souhaité
spec:
  # Nombre de pods à maintenir (3 copies de l'app, pour haute disponibilité)
  replicas: 3

  # Sélecteur : quels pods sont gérés par ce Deployment ?
  # Les pods ayant le label app:api-nodejs
  selector:
    matchLabels:
      app: api-nodejs

  # Stratégie de mise à jour : RollingUpdate = zéro downtime
  strategy:
    type: RollingUpdate
    rollingUpdate:
      # maxSurge : créer 1 pod SUPPLÉMENTAIRE avant de supprimer l'ancien
      # = à un moment donné, 4 pods (3 + 1 surplus) au lieu de 3
      # Permet aux nouveaux pods d'être prêts avant suppression des anciens
      maxSurge: 1

      # maxUnavailable : ne jamais avoir < 3 pods disponibles
      # = 0 = garder toujours au moins le nombre de replicas actifs
      # Garant : le service n'est jamais interrompu
      maxUnavailable: 0

  # Modèle de pod : description du conteneur
  template:
    metadata:
      labels:
        # Ce label correspondra au selector matchLabels
        app: api-nodejs
    spec:
      containers:
        # Conteneur de l'application
        - name: api-nodejs
          # Image Docker à utiliser (construite plus haut)
          image: api-nodejs:v1
          # imagePullPolicy: Never = utiliser seulement l'image locale Minikube
          # (ne pas essayer de télécharger depuis une registry)
          imagePullPolicy: Never

          # Ports exposés par le conteneur
          ports:
            - containerPort: 3000  # Le port du conteneur

          # Variables d'environnement passées au conteneur
          env:
            - name: APP_VERSION
              value: "v1"
            - name: PORT
              value: "3000"

          # Ressources CPU/mémoire : demandes et limites
          resources:
            # Ressources MINIMALES garanties par Kubernetes
            # Kubernetes ne planifiera ce pod que sur un nœud avec assez de ressources libres
            requests:
              cpu: "100m"        # 100 milliCPU = 0.1 CPU = 10% d'un CPU
              memory: "128Mi"     # 128 mégabytes
            # Ressources MAXIMALES autorisées
            # Si le pod dépasse les limites, Kubernetes le tue et le redémarre
            limits:
              cpu: "250m"        # 0.25 CPU = 25% d'un CPU
              memory: "256Mi"     # 256 mégabytes

          # ── LIVENESS PROBE : Redémarre le pod si l'API ne répond plus ──
          livenessProbe:
            httpGet:
              path: /health         # Appeler GET /health
              port: 3000
            # Attendre 15 secondes avant la première vérification (temps de démarrage)
            initialDelaySeconds: 15
            # Vérifier toutes les 20 secondes
            periodSeconds: 20
            # Redémarrer après 3 échecs consécutifs
            failureThreshold: 3

          # ── READINESS PROBE : Retire le pod du Service si pas prêt ──
          readinessProbe:
            httpGet:
              path: /ready          # Appeler GET /ready
              port: 3000
            # Attendre 5 secondes avant la première vérification (initialisation rapide)
            initialDelaySeconds: 5
            # Vérifier toutes les 10 secondes
            periodSeconds: 10

Le Deployment est le cœur de la configuration Kubernetes. Il dit :

« Maintenir 3 pods en tout temps »
« Chaque pod exécute l'image api-nodejs:v1 »
« Réserver au minimum 100m CPU et 128 Mi mémoire par pod »
« Limiter à 250m CPU et 256 Mi mémoire max »
« Vérifier la santé via GET /health toutes les 20 secondes »
« Vérifier la disponibilité via GET /ready toutes les 10 secondes »
« Lors d'une mise à jour, créer 1 pod supplémentaire, et ne jamais avoir moins de 3 pods actifs »

Kubernetes appliquera ces règles automatiquement et les maintiendra pour toujours.

4.2 Service — exposer l'application au réseau

service.yaml

apiVersion: v1
kind: Service

metadata:
  name: api-nodejs-service
  labels:
    app: api-nodejs

spec:
  # Type de Service : NodePort
  # Expose le service sur un port statique (30000-32767) sur chaque nœud du cluster
  # Utile pour le développement ; en production, on utilise LoadBalancer
  type: NodePort

  # Sélecteur : quels pods derrière ce service ?
  # Tous les pods avec le label app:api-nodejs (produits par le Deployment)
  selector:
    app: api-nodejs

  # Mappages de ports
  ports:
    - protocol: TCP
      # Port du Service dans le cluster (endpoint interne)
      port: 80
      # Port du conteneur (ce qu'on expose depuis le pod)
      targetPort: 3000
      # Port publié sur chaque nœud (accessible depuis l'extérieur du cluster)
      # L'utilisateur se connecte à noeud_ip:30080
      nodePort: 30080

Le Service agit comme un équilibreur de charge et un découvreur de service :

Il détecte automatiquement les 3 pods lancés par le Deployment
Il distribue le trafic entrant à l'un des 3 pods (round-robin)
Si un pod meurt, il est retiré de la liste automatiquement
Si un pod redémarre, il est réajouté automatiquement

Le Service agit comme un seul point d'entrée stable pour l'application, masquant la complexité des pods sous-jacents.

Types de Services Kubernetes

ClusterIP (défaut) : IP interne, accessible uniquement depuis d'autres pods du cluster. Idéal pour les microservices internes.
NodePort : expose le service sur un port statique (30000-32767) sur chaque nœud. Accessible depuis l'extérieur du cluster. Basique mais utile pour dev/testing.
LoadBalancer : demande au cloud provider de créer un équilibreur de charge externe (ex: AWS ALB, Google Cloud LB). Recommandé pour la production.
ExternalName : alias CNAME vers un service externe (ex: une base de données managée).

Pourquoi un Service distinct ? Les pods Kubernetes sont éphémères : ils peuvent mourir et être remplacés à tout moment. Sans Service, vous ne pourriez pas compter sur une adresse IP stable. Le Service fournit une abstraction : « peu importe les pods, accéder à api-nodejs-service est stable ».

5. Déployer sur le cluster Minikube

Terminal

# Appliquer les manifestes (en ordre importe peu, mais Service d'abord c'est plus logique)
kubectl apply -f deployment.yaml
kubectl apply -f service.yaml

# Vérifier le Deployment
kubectl get deployments
# output:
# NAME          READY   UP-TO-DATE   AVAILABLE   AGE
# api-nodejs    3/3     3            3           1m

# Voir tous les pods en cours d'exécution
kubectl get pods
# output:
# NAME                         READY   STATUS    RESTARTS   AGE
# api-nodejs-7d9f8b5c9-abc12   1/1     Running   0          2m
# api-nodejs-7d9f8b5c9-def34   1/1     Running   0          2m
# api-nodejs-7d9f8b5c9-ghi56   1/1     Running   0          2m

# Voir les services créés
kubectl get services
# output:
# NAME                 TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)
# api-nodejs-service   NodePort    10.96.201.45    nodes:30080

# Obtenir l'URL d'accès via Minikube
minikube service api-nodejs-service --url
# output: http://192.168.49.2:30080

La sortie montre que :

READY 3/3 : 3 pods sur 3 sont prêts
UP-TO-DATE 3 : tous les pods tournent la bonne version (v1)
AVAILABLE 3 : tous les pods sont disponibles pour recevoir du trafic
STATUS Running : tous les pods sont en cours d'exécution

Le Service reçoit une IP interne (10.96.201.45) et expose le port 30080 sur chaque nœud.

Terminal — tester l'API

# Obtenir l'URL du service
URL=$(minikube service api-nodejs-service --url)

# Tester la racine
curl $URL
# output: {"message":"API Node.js opérationnelle","version":"v1","hostname":"api-nodejs-7d9f8b5c9-abc12","timestamp":"2026-04-18T10:45:00.123Z"}

# Tester la probe de santé
curl $URL/health
# output: {"status":"healthy","version":"v1"}

# Tester la probe de disponibilité
curl $URL/ready
# output: {"ready":true}

Votre API Node.js tourne maintenant sur 3 pods orchestrés par Kubernetes ! Le Service équilibre automatiquement le trafic.

6. Rolling Update — mise à jour sans interruation

L'atout majeur de Kubernetes est le rolling update : mettre à jour l'application sans que les utilisateurs ne remarquent l'interruption. Les anciennes instances sont remplacées progressivement par les nouvelles.

Pourquoi un rolling update ? Traditionnellement, on arrête tous les serveurs, on déploie la nouvelle version, puis on redémarre. Les utilisateurs voient une interruption de service (downtime). Kubernetes utilise des rolling updates : remplacer les pods un par un, en veillant à toujours avoir au moins 3 pods actifs. L'application ne s'arrête jamais.

6.1 Construire la v2 de l'application

Terminal — modifier app.js pour v2

# (Supposons qu'on ajoute un endpoint /metrics à app.js)
# Puis relancer le build

eval $(minikube docker-env)
docker build -t api-nodejs:v2 .

# Vérifier que v2 existe
docker images | grep api-nodejs

6.2 Observer le trafic durant le rolling update

Ouvrez un terminal séparé et lancez une boucle qui simule du trafic continu :

Terminal 1 — simuler du trafic

URL=$(minikube service api-nodejs-service --url)

# Boucle infinie : appels toutes les 500ms
while true; do
  curl -s $URL | python3 -m json.tool | grep -E "version|hostname"
  sleep 0.5
done

# output:
# "version": "v1",
# "hostname": "api-nodejs-7d9f8b5c9-abc12",
# "version": "v1",
# "hostname": "api-nodejs-7d9f8b5c9-def34",

6.3 Déclencher la mise à jour

Terminal 2 — mettre à jour vers v2

# Option 1 : Mise à jour directe via kubectl set image
kubectl set image deployment/api-nodejs api-nodejs=api-nodejs:v2

# Option 2 : Éditer deployment.yaml (image: api-nodejs:v2) et relancer
kubectl apply -f deployment.yaml

# Suivre le rollout en temps réel
kubectl rollout status deployment/api-nodejs
# output:
# Waiting for deployment "api-nodejs" rollout to finish: 1 out of 3 new replicas updated...
# Waiting for deployment "api-nodejs" rollout to finish: 2 out of 3 new replicas updated...
# Waiting for deployment "api-nodejs" rollout to finish: 1 old replicas pending termination...
# deployment "api-nodejs" successfully rolled out

Le rolling update procède ainsi (avec maxSurge=1, maxUnavailable=0) :

Créer 1 pod v2 (= 4 pods totaux : 3 v1 + 1 v2)
Le pod v2 passe les readiness probes, devient actif
Supprimer 1 pod v1 (= 3 pods : 2 v1 + 1 v2)
Créer 1 pod v2 (= 4 pods : 2 v1 + 2 v2)
Supprimer 1 pod v1 (= 3 pods : 1 v1 + 2 v2)
Créer 1 pod v2 (= 4 pods : 1 v1 + 3 v2)
Supprimer le dernier pod v1 (= 3 pods : 0 v1 + 3 v2)

À chaque étape, au moins 3 pods sont actifs. Le Service ne retire jamais du trafic.

6.4 Observer la transition vers v2

Dans le Terminal 1 (trafic), vous verrez la transition :

Sortie du Terminal 1 durant le rollout

# Avant : seulement v1
# "version": "v1",
# "version": "v1",

# Pendant : mélange v1 et v2
# "version": "v1",
# "version": "v2",
# "version": "v1",
# "version": "v2",

# Après : seulement v2
# "version": "v2",
# "version": "v2",

Notez qu'aucune erreur de connexion n'apparaît. Le trafic passe sans interruption d'une version à l'autre. C'est la puissance du rolling update.

Pourquoi c'est zéro downtime ? Grâce à maxSurge: 1 et maxUnavailable: 0, Kubernetes garantit qu'on a toujours au moins 3 pods prêts. Le Service envoie le trafic uniquement aux pods prêts (readiness probe). Aucune requête n'est jamais perdue.

7. Rollback — annuler une mauvaise mise à jour

Si la v2 présente un problème critique, Kubernetes permet d'annuler instantanément :

Terminal

# Voir l'historique des déploiements
kubectl rollout history deployment/api-nodejs
# output:
# REVISION  CHANGE-CAUSE
# 1         kubectl apply --filename=deployment.yaml
# 2         kubectl set image deployment/api-nodejs api-nodejs=api-nodejs:v2

# Revenir à la révision précédente (v1)
kubectl rollout undo deployment/api-nodejs

# Ou revenir à une révision spécifique
kubectl rollout undo deployment/api-nodejs --to-revision=1

# Vérifier que le rollback est en cours
kubectl rollout status deployment/api-nodejs

Kubernetes maintient l'historique de tous les déploiements. Un undo relance simplement le rolling update en sens inverse : réinstancier les pods v1 et arrêter les pods v2. C'est aussi rapide et transparent qu'une mise à jour normale.

8. Scaling manuel — ajuster le nombre de réplicas

Terminal

# Scaler manuellement à 5 réplicas (augmente de 3 à 5)
kubectl scale deployment api-nodejs --replicas=5

# Vérifier que les 2 nouveaux pods démarrent
kubectl get pods
# output: 5 pods listés (3 anciens + 2 nouveaux)

# Réduire à 2 réplicas
kubectl scale deployment api-nodejs --replicas=2

# Vérifier que 3 pods sont arrêtés
kubectl get pods
# output: 2 pods listés

kubectl scale modifie dynamiquement le nombre de réplicas. Kubernetes ajoute ou supprime des pods immédiatement pour atteindre le nombre souhaité. C'est utile pour réagir rapidement à une charge qui augmente.

9. HPA — Autoscaling horizontal

Qu'est-ce que le HPA (Horizontal Pod Autoscaler) ?

Le HPA augmente ou diminue automatiquement le nombre de réplicas en fonction des métriques observées (utilisation CPU, mémoire, ou custom metrics).

Exemple : Vous définissez « maintenir le CPU moyen à 70%. Si elle dépasse 70%, ajouter des pods. Si elle descend sous 50%, en retirer. »

Cas d'usage : Pendant une pic de trafic (Black Friday), le HPA ajoute automatiquement des pods. Quand le trafic baisse, il en retire. Zéro intervention manuelle.

Terminal

# Créer un HPA : scaler automatiquement entre 2 et 10 pods basé sur le CPU
kubectl autoscale deployment api-nodejs \
  --min=2 \
  --max=10 \
  --cpu-percent=70

# Vérifier le HPA
kubectl get hpa
# output:
# NAME          REFERENCE                    TARGETS       MINPODS MAXPODS REPLICAS AGE
# api-nodejs    Deployment/api-nodejs        15%/70%       2       10      3        1m

# Le TARGETS indique l'utilisation actuelle (15%) vs la cible (70%)

# Supprimer le HPA
kubectl delete hpa api-nodejs

Pourquoi l'autoscaling ? En production, le trafic n'est jamais constant. Pendant les pics (minuit en Asie), vous avez besoin de 100 pods. Pendant les creux (3h du matin), 10 suffisent. Au lieu de payer pour 100 pods 24/7, le HPA les ajoute et les retire à la volée, réduisant les coûts d'infrastructure tout en garantissant la performance.

Le HPA fonctionne en boucle :

Toutes les 15 secondes, lire les métriques de tous les pods
Calculer l'utilisation CPU moyenne
Si moyenne > 70%, ajouter des pods (jusqu'au max de 10)
Si moyenne < (70% * 0.8) = 56%, retirer des pods (jusqu'au min de 2)

10. Commandes kubectl essentielles

Voici un résumé des commandes les plus utiles pour gérer Kubernetes au quotidien :

Aide-mémoire kubectl

# ─ Inspection ─

# Lister tous les pods du cluster
kubectl get pods

# Lister tous les déploiements
kubectl get deployments

# Lister tous les services
kubectl get services

# Lister toutes les ressources (pods, déploiements, services, etc.)
kubectl get all

# Obtenir des infos détaillées sur un pod spécifique
kubectl describe pod <nom-du-pod>

# ─ Logs et débogage ─

# Voir les logs d'un pod (les 50 dernières lignes)
kubectl logs <nom-du-pod> --tail=50

# Suivre les logs en temps réel (tail -f)
kubectl logs <nom-du-pod> -f

# Entrer dans un pod (ouvrir un shell interactif)
kubectl exec -it <nom-du-pod> -- sh

# Exécuter une commande dans un pod
kubectl exec <nom-du-pod> -- ps aux

# ─ Mises à jour et rollouts ─

# Appliquer/mises à jour les manifestes YAML
kubectl apply -f deployment.yaml

# Mettre à jour l'image d'un déploiement
kubectl set image deployment/api-nodejs api-nodejs=api-nodejs:v3

# Voir le statut du rollout
kubectl rollout status deployment/api-nodejs

# Voir l'historique des déploiements
kubectl rollout history deployment/api-nodejs

# Annuler une mise à jour (revenir à la version précédente)
kubectl rollout undo deployment/api-nodejs

# ─ Scaling ─

# Scaler à un nombre de réplicas donné
kubectl scale deployment api-nodejs --replicas=5

# Créer un autoscaler
kubectl autoscale deployment api-nodejs --min=2 --max=10 --cpu-percent=70

# ─ Suppression ─

# Supprimer un deployment (arrête tous les pods associés)
kubectl delete deployment api-nodejs

# Supprimer un service
kubectl delete service api-nodejs-service

# Supprimer via les fichiers YAML
kubectl delete -f deployment.yaml -f service.yaml

# ─ Utilitaires ─

# Afficher les informations du cluster
kubectl cluster-info

# Voir les ressources utilisées (CPU, mémoire) par les pods
kubectl top pods

# Voir les ressources utilisées par les nœuds
kubectl top nodes

# Nettoyage complet : arrêter et supprimer Minikube
minikube delete

Ces commandes couvrent les 80% des cas d'usage quotidiens en Kubernetes. get pour lister, describe pour les détails, logs pour débogage, apply pour déployer, delete pour nettoyer.

Résumé du flux complet

Créer app.js avec Express et les endpoints /health et /ready
Créer Dockerfile pour containeriser l'app
Construire l'image dans Minikube : eval $(minikube docker-env) && docker build -t api-nodejs:v1 .
Créer deployment.yaml décrivant l'état souhaité (3 réplicas, probes, limites de ressources)
Créer service.yaml exposant l'app via NodePort
Déployer : kubectl apply -f deployment.yaml service.yaml
Tester : curl $(minikube service api-nodejs-service --url)
Mettre à jour : kubectl set image deployment/api-nodejs api-nodejs=api-nodejs:v2
Observer : kubectl rollout status deployment/api-nodejs
Scaler : kubectl scale deployment api-nodejs --replicas=5 ou kubectl autoscale ...

Conseil : Consultez régulièrement les logs et les descriptions des pods pour comprendre ce que Kubernetes fait. kubectl logs et kubectl describe pod sont vos meilleurs amis pour le débogage.

Pour aller plus loin

ConfigMaps et Secrets : gérer les configurations et les données sensibles sans les bakes dans l'image
Ingress : router HTTP/HTTPS vers les services (meilleur que NodePort pour la prod)
Volumes : persister les données au-delà de la vie d'un pod
RBAC : contrôler l'accès à Kubernetes avec rôles et permissions
Helm : gérer des templates Kubernetes complexes et réutilisables
Monitoring (Prometheus) : surveiller la performance des apps

Déployer une app Node.js avec rolling updates zéro downtime