Este documento proporciona una descripción completa de la arquitectura AWS para la infraestructura de servicios de EKB. La arquitectura sigue patrones de nube nativa con servicios administrados de AWS, orquestación de Kubernetes y escalado automático.

Descripción General de la Arquitectura AWS

La arquitectura sigue patrones de nube nativa con servicios administrados de AWS, orquestación de Kubernetes y escalado automático.

Diagrama de Arquitectura

Supabase autoalojado usa un clúster HA de PostgreSQL administrado por CloudNativePG (ha-supabase-db) con pooler PgBouncer, MinIO para almacenamiento de objetos y el stack completo de aplicación Supabase desplegado vía helm-deployment/supabase-kubernetes-ha. Supabase Cloud es la alternativa si no se necesita autoalojamiento.

Componentes Principales

1. Capa de Red

Proveedor DNS

Propósito: Resolución de nombres de dominio; funciona con cualquier proveedor (Route 53, Cloudflare, etc.)
Dominios (use su propio dominio, ej. example.com):
- app.example.com — Frontend Web
- api.example.com — Backend FastAPI
- automations.example.com — Servicio Automator
- supabase.example.com — Supabase Kong (solo autoalojado)
- signoz.example.com — Observabilidad SigNoz (opcional)
Validación SSL: Registros CNAME requeridos para validación DNS de ACM

Balanceador de Carga de Aplicación (ALB)

Propósito: Terminación SSL, balanceo de carga y enrutamiento basado en hostname
Características:
- Terminación SSL/TLS usando certificados ACM (wildcard o por servicio)
- Redirección HTTP → HTTPS
- Health checks para todos los grupos objetivo
Administrado por: AWS Load Balancer Controller (chart Helm en helm-deployment/infrastructure)

VPC

CIDR: Específico del entorno (ej. 10.x.0.0/16)
Zonas de Disponibilidad: 3 AZs en la región elegida
Subredes: 3 públicas (NAT Gateways) + 3 privadas (nodos EKS)
Salida: NAT Gateway por AZ para salida de nodos

2. Capa de Cómputo

Cluster EKS

Versión: Kubernetes 1.33
Grupo de Nodos del Sistema: Grupo de nodos administrado ejecutando el controlador Karpenter (no en nodos administrados por Karpenter, según la mejor práctica de AWS)
Add-ons: EBS CSI Driver, AWS Load Balancer Controller, CoreDNS, kube-proxy

Karpenter — Provisionamiento Dinámico de Nodos

Propósito: Provisionamiento de nodos justo a tiempo y optimización de costos
Clases de Nodos:
- Propósito General: Instancias Spot para la mayoría de las cargas de trabajo
- Intensivo en Cómputo: Instancias de alta CPU para tareas limitadas por CPU
- Intensivo en Memoria: Instancias optimizadas en memoria para grandes conjuntos de datos
- Base de Datos: Instancias bajo demanda para cargas de trabajo con estado/bases de datos
- GPU: Instancias GPU para cargas de trabajo de IA/ML (opcional)
Características: Priorización Spot, consolidación automática, manejo de interrupciones basado en SQS

KEDA — Autoescalado de Pods Basado en Eventos de Kubernetes

Propósito: Autoescalado horizontal de pods basado en métricas de recursos
Objetivos:

Servicio	Réplicas	Umbral CPU	Umbral Memoria
Frontend Web	2–8	60%	80%
Backend FastAPI	2–10	70%	80%
Workers Celery	2–8	70%	80%
Automator	2–8	70%	80%

Escala descendente: Ventana de estabilización de 30s para respuesta rápida

3. Servicios de Aplicación

Frontend Web

Puerto: 3000
Réplicas: 2–8 (administrado por KEDA)
Propósito: Aplicación React que sirve la interfaz de usuario

Backend FastAPI

Puerto: 8001
Réplicas: 2–10 (administrado por KEDA)
Propósito: Servidor de API REST que maneja la lógica de negocio y acceso a datos

Workers Celery

Réplicas: 2–8 (administrado por KEDA)
Propósito: Procesamiento de tareas en segundo plano (encolado vía RabbitMQ)

Servicio Automator

Puerto: 80
Réplicas: 2–8 (administrado por KEDA)
Propósito: Automatización y orquestación de flujos de trabajo

Supabase Kong

Puerto: 8000 (servicio interno del clúster)
Propósito: Gateway API para todos los servicios de Supabase
Enrutamiento: El tráfico externo llega a Kong a través del ingreso ALB definido en odin-services/main-ingress.yaml

SigNoz (opcional)

Namespace: monitoring
Componentes: Plataforma SigNoz + agente DaemonSet k8s-infra
Propósito: Traza distribuida, agregación de métricas, gestión de logs
Habilitado por: ENABLE_SIGNOZ=true

4. Capa de Datos

ElastiCache Redis

Propósito: Caché, almacenamiento de sesiones y broker/result backend de Celery
Configuración:
- Tipo de nodo: configurable (ej. cache.t3.micro)
- Puerto: 6379
- Cifrado en reposo y en tránsito
- Multi-AZ para alta disponibilidad
Habilitado por: ENABLE_AWS_SERVICES=true

Amazon MQ (RabbitMQ)

Propósito: Cola de mensajes para procesamiento asíncrono de tareas
Configuración:
- Motor: RabbitMQ
- Puertos: 5671 (AMQP/SSL), 15671 (Gestión/SSL)
- Modo de despliegue: instancia individual o activo/en espera
Habilitado por: ENABLE_AWS_SERVICES=true

Supabase — Opción A: Cloud (administrado)

Propósito: PostgreSQL, Auth, Storage y Realtime administrados externamente
Conexión: URL del proyecto Supabase y clave de servicio role configuradas en values/odin-services.yaml

Supabase — Opción B: Autoalojado en EKS

Propósito: Stack completo de Supabase ejecutándose dentro del clúster
Componentes:
- Operador CloudNativePG (cnpg-system) — gestiona el ciclo de vida del clúster Postgres
- DB HA de Supabase (ha-supabase-db) — Recurso Cluster de CloudNativePG con pooler PgBouncer
- Aplicación Supabase (namespace supabase) — Kong, Auth, Storage (MinIO), Meta, Rest, Realtime, Studio
Orden de despliegue: CloudNativePG → DB HA de Supabase → Aplicación Supabase
Habilitado por: ENABLE_CNPG=true, ENABLE_HA_SUPABASE_DB=true, ENABLE_SUPABASE=true

PostgreSQL Automator

Propósito: Base de datos PostgreSQL local para el servicio Automator
Puerto: 5432
Almacenamiento: Volumen persistente EBS
Afinidad de nodo: Nodos dedicados a bases de datos

5. Seguridad e IAM

Roles IAM

Rol	Propósito
Rol del Cluster EKS	Permisos de API a nivel de cluster
Rol del Grupo de Nodos	Permisos EC2 del nodo (ECR, SSM, red)
Rol del Controlador Karpenter	Provisionamiento EC2, cola de interrupciones SQS
Rol del AWS Load Balancer Controller	Gestión de ELBv2 y EC2
Rol del Controlador EBS CSI	Gestión del ciclo de vida de volúmenes EBS

Los nombres de los roles siguen el patrón <env-name>-<component> y son creados por el módulo Terraform EKS.

Grupos de Seguridad

ALB: Auto-creado por AWS Load Balancer Controller (80/443 entrada)
Cluster EKS: Comunicación nodo a nodo y pod
Redis: Puerto 6379 solo desde CIDR de VPC
RabbitMQ: Puertos 5671, 15671 solo desde CIDR de VPC

SSL/TLS

Terminación: A nivel de ALB (los pods ven HTTP plano internamente)
Certificados: Certificados ACM — por servicio o un solo wildcard
Validación: Validación DNS CNAME vía su proveedor de DNS
Protocolo mínimo: TLS 1.2

6. Infraestructura como Código

Módulos Terraform

modules/eks: Cluster EKS, VPC, grupos de nodos, Karpenter, IAM, releases de Helm
Estado: Bucket S3 con versionado, tabla de bloqueo DynamoDB

Terragrunt

Aislamiento de entornos: Un directorio por entorno bajo terragrunt/environments/
Plantilla: env-template-folder — copiar y completar placeholders para crear un nuevo entorno
Configuración DRY: root.hcl compartido con overrides por entorno
Banderas de habilitación/deshabilitación: Servicios activados vía variables de entorno (ENABLE_*)

Charts Helm

Chart	Namespace	Descripción
`infrastructure`	`infrastructure`	Controlador ALB
`odin-services`	`default`	Web, API, Workers, Automator, Ingress
`aws-ebs-csi-driver`	`kube-system`	Provisionamiento de volúmenes EBS
`keda`	`keda`	Autoescalado de pods
`cloudnative-pg`	`cnpg-system`	Operador PostgreSQL
`ha-supabase-db`	`ha-supabase-db`	Clúster HA de Postgres + PgBouncer
`supabase-kubernetes-ha`	`supabase`	Stack completo de Supabase
`signoz`	`monitoring`	Plataforma de observabilidad
`k8s-infra`	`monitoring`	Agente de métricas del clúster

Flujo de Datos

1. Flujo de Solicitud del Usuario

Usuario → DNS → ALB (terminación SSL) → Pod EKS (Frontend Web)
                                     → Pod EKS (Backend FastAPI)
                                     → Pod EKS (Supabase Kong)

El usuario accede a app.example.com
DNS resuelve al ALB
ALB termina SSL y enruta por hostname al grupo objetivo correcto
El Frontend Web sirve la aplicación React y realiza llamadas API a api.example.com
El Backend FastAPI procesa solicitudes y lee/escribe en servicios de datos

2. Flujo de Solicitud API

Cliente → ALB → Backend FastAPI → Redis (caché) / RabbitMQ (cola) / Supabase (DB)

El cliente llama a api.example.com
ALB enruta al pod de FastAPI
El backend verifica la caché de Redis; en caso de miss, consulta la base de datos Supabase
Las tareas asíncronas se encolan en RabbitMQ y son procesadas por Workers Celery

3. Flujo de Procesamiento en Segundo Plano

FastAPI → RabbitMQ → Worker Celery → DB Supabase

FastAPI encola una tarea en RabbitMQ
Worker Celery desencola y procesa la tarea
Los resultados se escriben en la base de datos Supabase

4. Flujo de Automator

Automator → PostgreSQL (local) → Redis → APIs Externas

Automator recibe una solicitud de flujo de trabajo
El estado del flujo de trabajo se persiste en la instancia PostgreSQL local
Redis almacena en caché los resultados intermedios
Se llaman APIs externas como parte de la automatización

5. Flujo de Escalado

Métricas → KEDA → Escalado de pods → Karpenter → Provisionamiento de nodos

KEDA evalúa las métricas de CPU/Memoria contra los umbrales configurados
Los pods se escalan horizontalmente dentro del rango de réplicas configurado
Si la capacidad del clúster es insuficiente, Karpenter provisiona nuevos nodos EC2 (prefiriendo Spot)
Cuando la carga disminuye, KEDA reduce los pods; Karpenter consolida y termina nodos inactivos

6. Flujo de Seguridad

Internet → ALB (TLS 1.2+, ACM) → Grupos de Seguridad → Pods → Roles IAM IRSA → APIs AWS

Todo el tráfico externo termina TLS en el ALB
Los grupos de seguridad aplican acceso de red de menor privilegio
Los pods se comunican con servicios AWS vía IRSA (IAM Roles for Service Accounts)

Resumen de Alta Disponibilidad

Característica	Implementación
Despliegue multi-AZ	3 AZs para nodos EKS, Redis, subredes
Balanceo de carga	ALB con múltiples grupos objetivo
Redundancia de pods	Mínimo 2 réplicas por servicio
HA de base de datos	Clúster CloudNativePG con PgBouncer (autoalojado) o Supabase Cloud
Redundancia de caché	ElastiCache Multi-AZ
Autoescalado de nodos	Karpenter con mezcla Spot + bajo demanda
Autoescalado de pods	KEDA basado en CPU/Memoria
Observabilidad	SigNoz (opcional)
Gestión de estado	S3 con versionado + bloqueo DynamoDB

Optimización de Costos

Instancias Spot: Karpenter prioriza Spot para todas las cargas de trabajo que no sean de bases de datos
Consolidación de nodos: Karpenter reclama automáticamente nodos subutilizados
Dimensionamiento correcto de pods: KEDA reduce los pods durante períodos de baja actividad
Solo bajo demanda donde se necesita: La clase de nodo de base de datos usa bajo demanda para estabilidad

Mantenimiento y Operaciones

Proceso de Despliegue

cd terragrunt/environments/<your-env-name>
# Establecer variables de entorno ENABLE_* y dominio/certificado requeridas
terragrunt apply
# Actualizaciones rolling: volver a aplicar después de actualizar etiquetas de imagen o archivos de valores

Consulte la Guía de Despliegue con Terragrunt para la secuencia completa de despliegue.

Estrategia de Respaldo

Snapshots EBS: Snapshots automáticos para volúmenes persistentes (DB de Automator, MinIO de Supabase)
CloudNativePG: Archivado continuo de WAL + respaldos base programados (si está configurado)
Supabase Cloud: Respaldos diarios administrados (opción cloud)
Estado IaC: Bucket S3 versionado

Recuperación ante Desastres

Multi-AZ: Todos los servicios con estado abarcan múltiples zonas de disponibilidad
HA de CloudNativePG: Failover automático entre el primario de Postgres y las réplicas
Supabase Cloud: Redundancia multi-región (opción cloud)
Estado de Terraform: El versionado de S3 permite revertir a cualquier estado anterior

​Descripción General de la Arquitectura AWS

​Diagrama de Arquitectura

​Componentes Principales

​1. Capa de Red

​Proveedor DNS

​Balanceador de Carga de Aplicación (ALB)

​VPC

​2. Capa de Cómputo

​Cluster EKS

​Karpenter — Provisionamiento Dinámico de Nodos

​KEDA — Autoescalado de Pods Basado en Eventos de Kubernetes

​3. Servicios de Aplicación

​Frontend Web

​Backend FastAPI

​Workers Celery

​Servicio Automator

​Supabase Kong

​SigNoz (opcional)

​4. Capa de Datos

​ElastiCache Redis

​Amazon MQ (RabbitMQ)

​Supabase — Opción A: Cloud (administrado)

​Supabase — Opción B: Autoalojado en EKS

​PostgreSQL Automator

​5. Seguridad e IAM

​Roles IAM

​Grupos de Seguridad

​SSL/TLS

​6. Infraestructura como Código

​Módulos Terraform

​Terragrunt

​Charts Helm

​Flujo de Datos

​1. Flujo de Solicitud del Usuario

​2. Flujo de Solicitud API

​3. Flujo de Procesamiento en Segundo Plano

​4. Flujo de Automator

​5. Flujo de Escalado

​6. Flujo de Seguridad

​Resumen de Alta Disponibilidad

​Optimización de Costos

​Mantenimiento y Operaciones

​Proceso de Despliegue

​Estrategia de Respaldo

​Recuperación ante Desastres

​Recursos Adicionales

Descripción General de la Arquitectura AWS

Diagrama de Arquitectura

Componentes Principales

1. Capa de Red

Proveedor DNS

Balanceador de Carga de Aplicación (ALB)

VPC

2. Capa de Cómputo

Cluster EKS

Karpenter — Provisionamiento Dinámico de Nodos

KEDA — Autoescalado de Pods Basado en Eventos de Kubernetes

3. Servicios de Aplicación

Frontend Web

Backend FastAPI

Workers Celery

Servicio Automator

Supabase Kong

SigNoz (opcional)

4. Capa de Datos

ElastiCache Redis

Amazon MQ (RabbitMQ)

Supabase — Opción A: Cloud (administrado)

Supabase — Opción B: Autoalojado en EKS

PostgreSQL Automator

5. Seguridad e IAM

Roles IAM

Grupos de Seguridad

SSL/TLS

6. Infraestructura como Código

Módulos Terraform

Terragrunt

Charts Helm

Flujo de Datos

1. Flujo de Solicitud del Usuario

2. Flujo de Solicitud API

3. Flujo de Procesamiento en Segundo Plano

4. Flujo de Automator

5. Flujo de Escalado

6. Flujo de Seguridad

Resumen de Alta Disponibilidad

Optimización de Costos

Mantenimiento y Operaciones

Proceso de Despliegue

Estrategia de Respaldo

Recuperación ante Desastres

Recursos Adicionales