Pile de surveillance prête pour la production

Observabilité Kubernetes complète en une seule pile

Déployez Prometheus, Grafana, Alertmanager et les exporteurs essentiels en un seul chart Helm. Surveillance de niveau entreprise pour vos clusters Kubernetes — configurée en minutes, pas en jours.

0
Étoiles GitHub
0
Téléchargements Helm
0
SLA de disponibilité
Kube Prometheus Stack 2026 — Helm Install with Grafana & Full Kubernetes Observability

Six piliers de la surveillance complète

Chaque composant travaille de concert pour fournir une observabilité de bout en bout — des métriques d'infrastructure à l'alerte intelligente et aux beaux tableaux de bord.

Prometheus Operator

Le cerveau d'orchestration. Gère les instances Prometheus à l'aide de CRDs Kubernetes natifs — ServiceMonitors, PodMonitors et PrometheusRules pour une configuration déclarative.

Moteur principal

Serveur Prometheus

Base de données de séries temporelles standard de l'industrie. Collecte, stocke et évalue les métriques de l'ensemble de votre cluster avec le puissant langage de requête PromQL.

TSDB

Grafana

Couche de visualisation riche avec des tableaux de bord préconfigurés pour la santé du cluster, les performances des nœuds et les métriques des charges de travail. Personnalisable et extensible.

Visualisation

Alertmanager

Routage intelligent des alertes avec dé-duplication, regroupement et mise en sourdine. Acheminez les alertes vers Slack, PagerDuty, e-mail, MS Teams et des webhooks personnalisés.

Alertes

Node Exporter

Déployé en tant que DaemonSet sur chaque nœud, il expose les métriques CPU, mémoire, E/S disque et réseau — offrant une visibilité complète sur l'infrastructure hôte.

Infrastructure

Kube-State-Metrics

Surveille les objets API Kubernetes — déploiements, pods, replica sets, services — suivant l'état souhaité vs. réel de toutes vos charges de travail.

État K8s

Comment la pile fonctionne ensemble

Un pipeline de données unifié de la collecte de métriques à l'alerte intelligente et à la visualisation riche.

Diagramme d'architecture Kube Prometheus Stack montrant le flux de données des exporteurs de métriques à travers Prometheus vers les tableaux de bord Grafana

Orchestration

Prometheus Operator surveille les CRDs ServiceMonitor et PodMonitor pour découvrir automatiquement les cibles de collecte.

Collecte de métriques

Node Exporter collecte les métriques matérielles ; kube-state-metrics capture les états des objets Kubernetes depuis le serveur API.

Collecte et stockage

Prometheus extrait les métriques de tous les points de terminaison découverts et les stocke en tant que données de séries temporelles avec une rétention configurable.

Évaluation des règles

Les objets PrometheusRule définissent les conditions d'alerte. Les alertes déclenchées sont transmises à l'Alertmanager pour le routage.

Alerte et notification

L'Alertmanager dé-duplique, regroupe et achemine les alertes vers Slack, PagerDuty, e-mail ou tout récepteur webhook.

Visualisation

Grafana interroge Prometheus pour afficher des tableaux de bord en temps réel — préconfigurés pour la santé du cluster et entièrement personnalisables.

Déployez en trois commandes

De zéro à une surveillance complète en moins de cinq minutes avec le chart Helm officiel de la communauté Prometheus.

terminal — bash
# Ajouter le dépôt Helm de la communauté Prometheus
$ helm repo add prometheus-community \
    https://prometheus-community.github.io/helm-charts
$ helm repo update

# Créer un namespace de surveillance dédié
$ kubectl create namespace monitoring

# Installer la pile complète kube-prometheus-stack
$ helm install prometheus-stack \
    prometheus-community/kube-prometheus-stack \
    --namespace monitoring \
    --values values.yaml

Conçu pour l'échelle entreprise

Suivez des modèles éprouvés pour exécuter une pile de surveillance fiable, performante et sécurisée en production.

Stockage persistant

Configurez des Persistent Volumes pour Prometheus et Grafana afin de survivre aux redémarrages de pods sans perdre de métriques ni de tableaux de bord.

Contrôle de la cardinalité

Surveillez et gérez la cardinalité des séries temporelles pour éviter les explosions de mémoire. Évitez les labels à haute cardinalité comme les identifiants uniques.

Haute disponibilité

Exécutez plusieurs réplicas Prometheus avec anti-affinité de pods pour une surveillance sans interruption entre les domaines de défaillance.

Stockage à long terme

Intégrez avec Thanos, Cortex ou Grafana Cloud via remote_write pour la rétention de données historiques au-delà de 30 jours.

Sécurité et RBAC

Appliquez des politiques réseau, l'authentification OIDC/OAuth pour Grafana et un RBAC Kubernetes strict pour le namespace de surveillance.

Découverte ServiceMonitor

Utilisez les CRDs ServiceMonitor et PodMonitor pour la découverte automatique de cibles de métriques basée sur les services — aucune configuration manuelle nécessaire.

Gouvernance des ressources

Définissez des requêtes et limites CPU/mémoire pour chaque composant afin d'éviter la famine de ressources et les kills OOM en production.

Piliers d'observabilité complets

Allez au-delà des métriques : ajoutez Loki pour les logs et Tempo + OpenTelemetry pour le traçage distribué dans une pile Grafana unifiée.

Questions fréquemment posées

Tout ce que vous devez savoir sur le déploiement et la gestion du kube-prometheus-stack.

C'est un chart Helm complet qui déploie une pile complète de surveillance et d'alerte Kubernetes — incluant Prometheus, Grafana, Alertmanager, Node Exporter, kube-state-metrics et le Prometheus Operator. Il fournit une observabilité prête pour la production dès l'installation.
Prometheus autonome nécessite une configuration manuelle des cibles de collecte, des règles d'alerte et des tableaux de bord. Le kube-prometheus-stack automatise tout cela en utilisant le modèle Prometheus Operator avec des CRDs comme ServiceMonitor et PrometheusRule, plus des tableaux de bord Grafana préconfigurés.
Pour un petit cluster (1–5 nœuds), Prometheus nécessite généralement 2 cœurs CPU et 4–8 Go de RAM. Grafana nécessite environ 0,5 CPU et 512 Mo de RAM. Pour les clusters de production, dimensionnez les ressources en fonction du nombre de séries temporelles et de la fréquence de collecte.
Absolument. Les tableaux de bord Grafana personnalisés peuvent être provisionnés via ConfigMaps ou l'interface Grafana. Les règles d'alerte personnalisées sont définies à l'aide de CRDs PrometheusRule, que l'Operator synchronise automatiquement avec la configuration Prometheus.
Le stockage local Prometheus est recommandé pour 15–30 jours de rétention. Pour un stockage à plus long terme, configurez remote_write pour envoyer les métriques vers des solutions comme Thanos, Cortex, Grafana Mimir ou des services managés comme Amazon Managed Prometheus et Grafana Cloud.
La configuration par défaut est un excellent point de départ, mais les déploiements de production devraient personnaliser le values.yaml pour activer le stockage persistant, définir des limites de ressources, configurer des réplicas HA et appliquer des politiques réseau pour la sécurité.

Prêt à surveiller votre cluster Kubernetes?

Déployez la pile d'observabilité standard de l'industrie en quelques minutes. Open-source, éprouvée et approuvée par des milliers d'équipes d'ingénierie dans le monde.

Voir sur GitHub Artifact Hub