Ir al contenido

Módulo 5: System Design

Duración estimada: 8-10 semanas

Al finalizar este módulo, serás capaz de:

  • Diseñar sistemas distribuidos escalables y resilientes
  • Desplegar aplicaciones AI en Kubernetes con Helm
  • Gestionar infraestructura como código con Terraform
  • Implementar patrones de serving: batch, streaming, online
  • Elegir y optimizar estrategias de base de datos
  • Orquestar sistemas event-driven con colas de mensajes
  • Construir stack completo de observabilidad
  • CAP Theorem, Eventual Consistency, CQRS
  • Service Mesh con Istio
  • Lab: Sistema Distribuido con gRPC
  • Herramientas: gRPC, Protocol Buffers, Istio, Consul
  • Deployments, Services, Ingress, StatefulSets
  • Helm charts para aplicaciones ML
  • Lab: Desplegar LLM en K8s
  • Herramientas: Kubernetes, Helm, K9s, Lens
  • Terraform: Resources, Modules, State Management
  • Multi-cloud: AWS + Azure + GCP
  • Lab: Infraestructura Completa
  • Herramientas: Terraform, Terragrunt, Atlantis
  • Batch vs Streaming vs Online inference
  • Model serving: vLLM, TorchServe, TensorFlow Serving
  • Lab: API de Inference Escalable
  • Herramientas: vLLM, Ray Serve, Triton Inference Server
  • OLTP vs OLAP, Data Warehouse, Data Lake
  • Postgres, Redis, MongoDB, ClickHouse
  • Lab: Arquitectura Híbrida
  • Herramientas: PostgreSQL, Redis, ClickHouse, S3
  • RabbitMQ vs Kafka vs Redis Streams
  • Event sourcing, SAGA pattern
  • Lab: Pipeline Event-Driven
  • Herramientas: Apache Kafka, RabbitMQ, Redis Streams
  • Logs: Loki, Elasticsearch
  • Métricas: Prometheus, Grafana
  • Tracing: Jaeger, Tempo
  • Lab: Stack Completo
  • Herramientas: Grafana Stack, ELK Stack, OpenTelemetry
  1. Plataforma ML Multi-Cloud: Terraform + K8s + Helm
  2. Sistema de Serving Híbrido: Batch + Streaming + Online
  3. Observability Stack: Logs + Métricas + Tracing integrados

Módulo 6: Security →