Stack de monitorización listo para producción

Observabilidad Kubernetes completa en un solo stack

Despliegue Prometheus, Grafana, Alertmanager y exporters esenciales como un chart Helm unificado. Monitorización de nivel empresarial para sus clústeres Kubernetes — configurado en minutos, no días.

Instalación rápida Explorar el stack

Estrellas GitHub

Descargas Helm

SLA de tiempo activo

Kube Prometheus Stack 2026 — Helm Install with Grafana & Full Kubernetes Observability

Componentes principales

Seis pilares de la monitorización completa

Cada componente trabaja en conjunto para ofrecer observabilidad de extremo a extremo — desde métricas de infraestructura hasta alertas inteligentes y hermosos paneles.

Prometheus Operator

El cerebro de orquestación. Gestiona instancias de Prometheus utilizando CRDs nativos de Kubernetes — ServiceMonitors, PodMonitors y PrometheusRules para configuración declarativa.

Motor central

Servidor Prometheus

Base de datos de series temporales estándar de la industria. Recopila, almacena y evalúa métricas de todo su clúster con el poderoso lenguaje de consulta PromQL.

TSDB

Grafana

Rica capa de visualización con paneles preconstruidos para salud del clúster, rendimiento de nodos y métricas de cargas de trabajo. Personalizable y extensible.

Visualización

Alertmanager

Enrutamiento inteligente de alertas con deduplicación, agrupación y silenciamiento. Envíe alertas a Slack, PagerDuty, correo electrónico, MS Teams y webhooks personalizados.

Alertas

Node Exporter

Desplegado como DaemonSet en cada nodo, expone métricas de CPU, memoria, E/S de disco y red — proporcionando visibilidad total de la infraestructura del host.

Infraestructura

Kube-State-Metrics

Monitoriza objetos de la API de Kubernetes — deployments, pods, replica sets, servicios — rastreando el estado deseado vs. actual de todas sus cargas de trabajo.

Estado K8s

Flujo de datos

Cómo el stack funciona en conjunto

Un pipeline de datos unificado desde la recopilación de métricas hasta alertas inteligentes y visualización rica.

Diagrama de arquitectura del Kube Prometheus Stack mostrando el flujo de datos desde los exporters de métricas a través de Prometheus hasta los paneles de Grafana

Orquestación

Prometheus Operator vigila los CRDs ServiceMonitor y PodMonitor para descubrir automáticamente objetivos de recopilación.

Recopilación de métricas

Node Exporter recopila métricas de hardware; kube-state-metrics captura estados de objetos Kubernetes desde el servidor API.

Recopilación y almacenamiento

Prometheus extrae métricas de todos los endpoints descubiertos y las almacena como datos de series temporales con retención configurable.

Evaluación de reglas

Los objetos PrometheusRule definen condiciones de alerta. Las alertas disparadas se reenvían al Alertmanager para enrutamiento.

Alertas y notificaciones

Alertmanager deduplica, agrupa y enruta alertas a Slack, PagerDuty, correo electrónico o cualquier receptor webhook.

Visualización

Grafana consulta Prometheus para renderizar paneles en tiempo real — preconstruidos para salud del clúster y totalmente personalizables.

Inicio rápido

Despliegue en tres comandos

De cero a monitorización completa en menos de cinco minutos usando el chart Helm oficial de la comunidad Prometheus.

terminal — bash

# Agregar el repositorio Helm de la comunidad Prometheus
$ helm repo add prometheus-community \
    https://prometheus-community.github.io/helm-charts
$ helm repo update

# Crear un namespace dedicado de monitorización
$ kubectl create namespace monitoring

# Instalar el stack completo kube-prometheus-stack
$ helm install prometheus-stack \
    prometheus-community/kube-prometheus-stack \
    --namespace monitoring \
    --values values.yaml

Mejores prácticas de producción

Construido para escala empresarial

Siga patrones probados para ejecutar un stack de monitorización fiable, eficiente y seguro en producción.

Almacenamiento persistente

Configure Persistent Volumes para Prometheus y Grafana para sobrevivir a reinicios de pods sin perder métricas ni paneles.

Control de cardinalidad

Monitorice y gestione la cardinalidad de series temporales para prevenir explosiones de memoria. Evite etiquetas de alta cardinalidad como IDs únicos.

Alta disponibilidad

Ejecute múltiples réplicas de Prometheus con anti-afinidad de pods para monitorización sin tiempo de inactividad entre dominios de fallo.

Almacenamiento a largo plazo

Integre con Thanos, Cortex o Grafana Cloud vía remote_write para retención de datos históricos más allá de 30 días.

Seguridad y RBAC

Aplique políticas de red, autenticación OIDC/OAuth para Grafana y RBAC estricto de Kubernetes para el namespace de monitorización.

Descubrimiento ServiceMonitor

Use CRDs ServiceMonitor y PodMonitor para descubrimiento automático de objetivos de métricas basado en servicios — sin configuración manual necesaria.

Gobernanza de recursos

Establezca requests y limits de CPU/memoria para cada componente para prevenir escasez de recursos y OOM kills en producción.

Pilares completos de observabilidad

Vaya más allá de las métricas: añada Loki para logs y Tempo + OpenTelemetry para trazado distribuido en un stack Grafana unificado.

FAQ

Preguntas frecuentes

Todo lo que necesita saber sobre el despliegue y gestión del kube-prometheus-stack.

¿Qué es el kube-prometheus-stack?

Es un chart Helm completo que despliega un stack de monitorización y alertas Kubernetes — incluyendo Prometheus, Grafana, Alertmanager, Node Exporter, kube-state-metrics y el Prometheus Operator. Proporciona observabilidad lista para producción directamente.

¿En qué se diferencia del Prometheus independiente?

Prometheus independiente requiere configuración manual de objetivos de recopilación, reglas de alertas y paneles. El kube-prometheus-stack automatiza todo esto usando el patrón Prometheus Operator con CRDs como ServiceMonitor y PrometheusRule, más paneles Grafana preconfigurados.

¿Cuáles son los requisitos mínimos de recursos?

Para un clúster pequeño (1–5 nodos), Prometheus normalmente necesita 2 cores de CPU y 4–8 GB de RAM. Grafana requiere aproximadamente 0,5 CPU y 512 MB de RAM. Para clústeres de producción, escale recursos basándose en el número de series temporales y frecuencia de recopilación.

¿Puedo añadir paneles y alertas personalizados?

Por supuesto. Los paneles Grafana personalizados pueden aprovisionarse vía ConfigMaps o la interfaz de Grafana. Las reglas de alertas personalizadas se definen usando CRDs PrometheusRule, que el Operator sincroniza automáticamente con la configuración de Prometheus.

¿Cómo manejar el almacenamiento de métricas a largo plazo?

El almacenamiento local de Prometheus se recomienda para 15–30 días de retención. Para almacenamiento a largo plazo, configure remote_write para enviar métricas a soluciones como Thanos, Cortex, Grafana Mimir o servicios gestionados como Amazon Managed Prometheus y Grafana Cloud.

¿Está listo para producción directamente?

La configuración por defecto es un excelente punto de partida, pero los despliegues de producción deben personalizar el values.yaml para habilitar almacenamiento persistente, establecer límites de recursos, configurar réplicas HA y aplicar políticas de red para seguridad.

Latest Guides

Deep Dive Articles

In-depth guides to help you master kube-prometheus-stack for production Kubernetes monitoring.

What is Kube-Prometheus-Stack? Complete Guide 12 min read Helm Chart Documentation: The Complete 2026 Guide 18 min read Grafana Dashboards: Kubernetes Monitoring Dashboards Guide 15 min read Alertmanager Configuration: Kubernetes Alert Routing 15 min read

View All Articles

Observabilidad Kubernetes completa en un solo stack

Seis pilares de la monitorización completa

Prometheus Operator

Servidor Prometheus

Grafana

Alertmanager

Node Exporter

Kube-State-Metrics

Cómo el stack funciona en conjunto

Orquestación

Recopilación de métricas

Recopilación y almacenamiento

Evaluación de reglas

Alertas y notificaciones

Visualización

Despliegue en tres comandos

Construido para escala empresarial

Almacenamiento persistente

Control de cardinalidad

Alta disponibilidad

Almacenamiento a largo plazo

Seguridad y RBAC

Descubrimiento ServiceMonitor

Gobernanza de recursos

Pilares completos de observabilidad

Preguntas frecuentes

Deep Dive Articles

¿Listo para monitorizar su clúster Kubernetes?