Stos monitoringu gotowy do produkcji

Kompletna obserwowalność Kubernetes w jednym stosie

Wdróż Prometheus, Grafana, Alertmanager i niezbędne eksportery jako jeden chart Helm. Monitoring klasy enterprise dla Twoich klastrów Kubernetes — skonfigurowany w minuty, nie dni.

0
Gwiazdek GitHub
0
Pobrań Helm
0
SLA dostępności
Kube Prometheus Stack 2026 — Helm Install with Grafana & Full Kubernetes Observability

Sześć filarów pełnego monitoringu

Każdy komponent współpracuje, aby zapewnić kompleksową obserwowalność — od metryk infrastruktury po inteligentne alerty i piękne pulpity nawigacyjne.

Prometheus Operator

Mózg orkiestracji. Zarządza instancjami Prometheus za pomocą natywnych Kubernetes CRD — ServiceMonitors, PodMonitors i PrometheusRules do konfiguracji deklaratywnej.

Silnik

Serwer Prometheus

Standardowa baza danych szeregów czasowych. Zbiera, przechowuje i ocenia metryki z całego klastra z potężnym językiem zapytań PromQL.

TSDB

Grafana

Bogata warstwa wizualizacji z gotowymi pulpitami dla zdrowia klastra, wydajności węzłów i metryk obciążeń. Konfigurowalna i rozszerzalna.

Wizualizacja

Alertmanager

Inteligentne trasowanie alertów z deduplikacją, grupowaniem i wyciszaniem. Kieruj alerty do Slack, PagerDuty, e-mail, MS Teams i niestandardowych webhooków.

Alerty

Node Exporter

Wdrożony jako DaemonSet na każdym węźle, eksponuje metryki CPU, pamięci, I/O dysku i sieci — zapewniając pełną widoczność infrastruktury hosta.

Infrastruktura

Kube-State-Metrics

Monitoruje obiekty API Kubernetes — deploymenty, pody, replica sets, serwisy — śledząc pożądany vs. rzeczywisty stan wszystkich obciążeń.

Stan K8s

Jak stos współpracuje

Zunifikowany potok danych od zbierania metryk przez inteligentne alerty do bogatej wizualizacji.

Diagram architektury Kube Prometheus Stack pokazujący przepływ danych od eksporterów metryk przez Prometheus do pulpitów Grafana

Orkiestracja

Prometheus Operator obserwuje CRD ServiceMonitor i PodMonitor do automatycznego odkrywania celów zbierania.

Zbieranie metryk

Node Exporter zbiera metryki sprzętowe; kube-state-metrics przechwytuje stany obiektów Kubernetes z serwera API.

Zbieranie i przechowywanie

Prometheus pobiera metryki ze wszystkich odkrytych endpointów i przechowuje je jako dane szeregów czasowych z konfigurowalną retencją.

Ewaluacja reguł

Obiekty PrometheusRule definiują warunki alertów. Wyzwolone alerty są przekazywane do Alertmanagera do trasowania.

Alerty i powiadomienia

Alertmanager deduplikuje, grupuje i kieruje alerty do Slack, PagerDuty, e-mail lub dowolnego odbiornika webhook.

Wizualizacja

Grafana odpytuje Prometheus, aby renderować pulpity w czasie rzeczywistym — gotowe dla zdrowia klastra i w pełni konfigurowalne.

Wdróż w trzech komendach

Od zera do pełnego monitoringu w mniej niż pięć minut z oficjalnym chartem Helm od społeczności Prometheus.

terminal — bash
# Dodaj repozytorium Helm społeczności Prometheus
$ helm repo add prometheus-community \
    https://prometheus-community.github.io/helm-charts
$ helm repo update

# Utwórz dedykowaną przestrzeń nazw monitoringu
$ kubectl create namespace monitoring

# Zainstaluj pełny kube-prometheus-stack
$ helm install prometheus-stack \
    prometheus-community/kube-prometheus-stack \
    --namespace monitoring \
    --values values.yaml

Zbudowany dla skali enterprise

Stosuj sprawdzone wzorce do uruchamiania niezawodnego, wydajnego i bezpiecznego stosu monitoringu w produkcji.

Trwałe przechowywanie

Skonfiguruj Persistent Volumes dla Prometheus i Grafana, aby przetrwać restarty podów bez utraty metryk lub pulpitów.

Kontrola kardynalności

Monitoruj i zarządzaj kardynalnością szeregów czasowych, aby zapobiec eksplozji pamięci. Unikaj etykiet o wysokiej kardynalności, takich jak unikalne ID.

Wysoka dostępność

Uruchom wiele replik Prometheus z anty-afinicznością podów dla monitoringu bez przestojów między domenami awarii.

Długoterminowe przechowywanie

Integruj z Thanos, Cortex lub Grafana Cloud przez remote_write do przechowywania danych historycznych powyżej 30 dni.

Bezpieczeństwo i RBAC

Wymuszaj polityki sieciowe, uwierzytelnianie OIDC/OAuth dla Grafana i ścisłe Kubernetes RBAC dla przestrzeni nazw monitoringu.

Odkrywanie ServiceMonitor

Używaj CRD ServiceMonitor i PodMonitor do automatycznego odkrywania celów metryk opartych na usługach — bez ręcznej konfiguracji.

Zarządzanie zasobami

Ustaw żądania i limity CPU/pamięci dla każdego komponentu, aby zapobiec głodzeniu zasobów i zabijaniu OOM w produkcji.

Pełne filary obserwowalności

Wyjdź poza metryki: dodaj Loki dla logów i Tempo + OpenTelemetry dla rozproszonego śledzenia w zunifikowanym stosie Grafana.

Najczęściej zadawane pytania

Wszystko, co musisz wiedzieć o wdrażaniu i zarządzaniu kube-prometheus-stack.

To kompleksowy chart Helm, który wdraża pełny stos monitoringu i alertów Kubernetes — w tym Prometheus, Grafana, Alertmanager, Node Exporter, kube-state-metrics i Prometheus Operator. Zapewnia gotową do produkcji obserwowalność od razu po instalacji.
Samodzielny Prometheus wymaga ręcznej konfiguracji celów zbierania, reguł alertów i pulpitów. kube-prometheus-stack automatyzuje to wszystko, używając wzorca Prometheus Operator z CRD takimi jak ServiceMonitor i PrometheusRule, plus wstępnie skonfigurowane pulpity Grafana.
Dla małego klastra (1–5 węzłów) Prometheus zazwyczaj potrzebuje 2 rdzeni CPU i 4–8 GB RAM. Grafana wymaga około 0,5 CPU i 512 MB RAM. Dla klastrów produkcyjnych skaluj zasoby na podstawie liczby szeregów czasowych i częstotliwości zbierania.
Oczywiście. Niestandardowe pulpity Grafana można dostarczyć przez ConfigMaps lub interfejs Grafana. Niestandardowe reguły alertów definiuje się za pomocą CRD PrometheusRule, które Operator automatycznie synchronizuje z konfiguracją Prometheus.
Lokalne przechowywanie Prometheus jest zalecane na 15–30 dni retencji. Dla dłuższego przechowywania skonfiguruj remote_write do wysyłania metryk do rozwiązań takich jak Thanos, Cortex, Grafana Mimir lub usług zarządzanych jak Amazon Managed Prometheus i Grafana Cloud.
Domyślna konfiguracja to doskonały punkt wyjścia, ale wdrożenia produkcyjne powinny dostosować values.yaml, aby włączyć trwałe przechowywanie, ustawić limity zasobów, skonfigurować repliki HA i zastosować polityki sieciowe dla bezpieczeństwa.

Gotowy do monitorowania Twojego klastra Kubernetes?

Wdróż standardowy stos obserwowalności w minuty. Open-source, sprawdzony w boju i zaufany przez tysiące zespołów inżynierskich na całym świecie.

Zobacz na GitHub Artifact Hub