Stack de monitorización listo para producción

Observabilidad Kubernetes completa en un solo stack

Despliegue Prometheus, Grafana, Alertmanager y exporters esenciales como un chart Helm unificado. Monitorización de nivel empresarial para sus clústeres Kubernetes — configurado en minutos, no días.

0
Estrellas GitHub
0
Descargas Helm
0
SLA de tiempo activo
Kube Prometheus Stack 2026 — Helm Install with Grafana & Full Kubernetes Observability

Seis pilares de la monitorización completa

Cada componente trabaja en conjunto para ofrecer observabilidad de extremo a extremo — desde métricas de infraestructura hasta alertas inteligentes y hermosos paneles.

Prometheus Operator

El cerebro de orquestación. Gestiona instancias de Prometheus utilizando CRDs nativos de Kubernetes — ServiceMonitors, PodMonitors y PrometheusRules para configuración declarativa.

Motor central

Servidor Prometheus

Base de datos de series temporales estándar de la industria. Recopila, almacena y evalúa métricas de todo su clúster con el poderoso lenguaje de consulta PromQL.

TSDB

Grafana

Rica capa de visualización con paneles preconstruidos para salud del clúster, rendimiento de nodos y métricas de cargas de trabajo. Personalizable y extensible.

Visualización

Alertmanager

Enrutamiento inteligente de alertas con deduplicación, agrupación y silenciamiento. Envíe alertas a Slack, PagerDuty, correo electrónico, MS Teams y webhooks personalizados.

Alertas

Node Exporter

Desplegado como DaemonSet en cada nodo, expone métricas de CPU, memoria, E/S de disco y red — proporcionando visibilidad total de la infraestructura del host.

Infraestructura

Kube-State-Metrics

Monitoriza objetos de la API de Kubernetes — deployments, pods, replica sets, servicios — rastreando el estado deseado vs. actual de todas sus cargas de trabajo.

Estado K8s

Cómo el stack funciona en conjunto

Un pipeline de datos unificado desde la recopilación de métricas hasta alertas inteligentes y visualización rica.

Diagrama de arquitectura del Kube Prometheus Stack mostrando el flujo de datos desde los exporters de métricas a través de Prometheus hasta los paneles de Grafana

Orquestación

Prometheus Operator vigila los CRDs ServiceMonitor y PodMonitor para descubrir automáticamente objetivos de recopilación.

Recopilación de métricas

Node Exporter recopila métricas de hardware; kube-state-metrics captura estados de objetos Kubernetes desde el servidor API.

Recopilación y almacenamiento

Prometheus extrae métricas de todos los endpoints descubiertos y las almacena como datos de series temporales con retención configurable.

Evaluación de reglas

Los objetos PrometheusRule definen condiciones de alerta. Las alertas disparadas se reenvían al Alertmanager para enrutamiento.

Alertas y notificaciones

Alertmanager deduplica, agrupa y enruta alertas a Slack, PagerDuty, correo electrónico o cualquier receptor webhook.

Visualización

Grafana consulta Prometheus para renderizar paneles en tiempo real — preconstruidos para salud del clúster y totalmente personalizables.

Despliegue en tres comandos

De cero a monitorización completa en menos de cinco minutos usando el chart Helm oficial de la comunidad Prometheus.

terminal — bash
# Agregar el repositorio Helm de la comunidad Prometheus
$ helm repo add prometheus-community \
    https://prometheus-community.github.io/helm-charts
$ helm repo update

# Crear un namespace dedicado de monitorización
$ kubectl create namespace monitoring

# Instalar el stack completo kube-prometheus-stack
$ helm install prometheus-stack \
    prometheus-community/kube-prometheus-stack \
    --namespace monitoring \
    --values values.yaml

Construido para escala empresarial

Siga patrones probados para ejecutar un stack de monitorización fiable, eficiente y seguro en producción.

Almacenamiento persistente

Configure Persistent Volumes para Prometheus y Grafana para sobrevivir a reinicios de pods sin perder métricas ni paneles.

Control de cardinalidad

Monitorice y gestione la cardinalidad de series temporales para prevenir explosiones de memoria. Evite etiquetas de alta cardinalidad como IDs únicos.

Alta disponibilidad

Ejecute múltiples réplicas de Prometheus con anti-afinidad de pods para monitorización sin tiempo de inactividad entre dominios de fallo.

Almacenamiento a largo plazo

Integre con Thanos, Cortex o Grafana Cloud vía remote_write para retención de datos históricos más allá de 30 días.

Seguridad y RBAC

Aplique políticas de red, autenticación OIDC/OAuth para Grafana y RBAC estricto de Kubernetes para el namespace de monitorización.

Descubrimiento ServiceMonitor

Use CRDs ServiceMonitor y PodMonitor para descubrimiento automático de objetivos de métricas basado en servicios — sin configuración manual necesaria.

Gobernanza de recursos

Establezca requests y limits de CPU/memoria para cada componente para prevenir escasez de recursos y OOM kills en producción.

Pilares completos de observabilidad

Vaya más allá de las métricas: añada Loki para logs y Tempo + OpenTelemetry para trazado distribuido en un stack Grafana unificado.

Preguntas frecuentes

Todo lo que necesita saber sobre el despliegue y gestión del kube-prometheus-stack.

Es un chart Helm completo que despliega un stack de monitorización y alertas Kubernetes — incluyendo Prometheus, Grafana, Alertmanager, Node Exporter, kube-state-metrics y el Prometheus Operator. Proporciona observabilidad lista para producción directamente.
Prometheus independiente requiere configuración manual de objetivos de recopilación, reglas de alertas y paneles. El kube-prometheus-stack automatiza todo esto usando el patrón Prometheus Operator con CRDs como ServiceMonitor y PrometheusRule, más paneles Grafana preconfigurados.
Para un clúster pequeño (1–5 nodos), Prometheus normalmente necesita 2 cores de CPU y 4–8 GB de RAM. Grafana requiere aproximadamente 0,5 CPU y 512 MB de RAM. Para clústeres de producción, escale recursos basándose en el número de series temporales y frecuencia de recopilación.
Por supuesto. Los paneles Grafana personalizados pueden aprovisionarse vía ConfigMaps o la interfaz de Grafana. Las reglas de alertas personalizadas se definen usando CRDs PrometheusRule, que el Operator sincroniza automáticamente con la configuración de Prometheus.
El almacenamiento local de Prometheus se recomienda para 15–30 días de retención. Para almacenamiento a largo plazo, configure remote_write para enviar métricas a soluciones como Thanos, Cortex, Grafana Mimir o servicios gestionados como Amazon Managed Prometheus y Grafana Cloud.
La configuración por defecto es un excelente punto de partida, pero los despliegues de producción deben personalizar el values.yaml para habilitar almacenamiento persistente, establecer límites de recursos, configurar réplicas HA y aplicar políticas de red para seguridad.

¿Listo para monitorizar su clúster Kubernetes?

Despliegue el stack de observabilidad estándar de la industria en minutos. Código abierto, probado en batalla y confiado por miles de equipos de ingeniería en todo el mundo.

Ver en GitHub Artifact Hub