IA local: el kit de supervivencia cuando caigan las grandes IA

Tu kit de supervivencia para cuando los grandes cierren el grifo

Imagina que mañana te levantas y:

  • ChatGPT Plus cuesta 200€/mes en vez de 22.
  • Tu API key de OpenAI ha sido baneada porque tu caso de uso «viola las políticas» (no te explican cuál).
  • El modelo de Anthropic que usaba tu app en producción está discontinuado, tienes 30 días.
  • Tu país decide regular la IA y bloquea servicios extranjeros.
  • Midjourney se ha vendido y los nuevos dueños quintuplican el plan.

¿Qué haces?

¿Lloras? ¿Pagas lo que pidan? ¿Migras a mano las 47 integraciones que dependen de OpenAI?

O bajas al sótano, enciendes el generador, y sigues trabajando.

Este post va de ese sótano.


La idea: IA como infraestructura crítica personal

Tienes copias de seguridad de tus fotos. Tienes un NAS. Tienes un gestor de contraseñas con vault local. Tienes una linterna en el cajón por si se va la luz.

Pero probablemente toda tu vida con IA depende de tres empresas californianas. ChatGPT para pensar. Copilot para programar. Midjourney para imágenes. Whisper o un servicio cloud para transcribir. ElevenLabs para voz. Tu SaaS, si tienes uno, le manda 200€/mes a OpenAI sin que te des cuenta.

Y esos tres pueden:

  1. Subir precios cuando quieran.
  2. Cambiar términos cuando quieran.
  3. Banearte cuando quieran.
  4. Discontinuar el modelo que usas cuando quieran.
  5. Decidir que tu industria, país o caso de uso ya no encaja.

No estoy diciendo que vayan a hacerlo mañana. Estoy diciendo que pueden, y que estar a su merced no debería ser tu plan B.

Lo mismo que tener un NAS no significa odiar a Google Photos: tener IA local no significa odiar a OpenAI. Es prudencia, no paranoia.

Tu objetivo no es casarte con una IA. Es poder divorciarte en cualquier momento.


El kit, perfil bajo

He empaquetado todo lo que necesitas en un repo con Docker Compose. Un git clone y un docker compose up y tienes tu propio ChatGPT corriendo en tu máquina. El repo está aquí: ai-survival-kit.

Filosofía:

  1. No reemplaces a OpenAI. Haz que OpenAI sea reemplazable. Tu código sigue llamando a gpt-4o. Solo cambias la URL base.
  2. Modular por perfiles. Instalas solo lo que vas a usar. Desde «necesito chatear» hasta «todo el stack».
  3. Un comando para arrancar. Cero CUDA hell. Cero «no me funciona Python».

El kit tiene cuatro niveles, según cuánto búnker quieras:

Nivel 1 — apagón básico

Lo mínimo: un LLM local con interfaz tipo ChatGPT.

  • Ollama como runtime de modelos.
  • Open WebUI como interfaz (es prácticamente idéntica a ChatGPT).
  • Qwen 2.5 como modelo por defecto (multilingüe, hace buen español).

Con esto ya puedes:

  • Resumir un PDF largo arrastrándolo a la conversación.
  • Reescribir emails sin que tu jefe se entere de que usas IA.
  • Pedir ideas para un proyecto.
  • Traducir cosas.
  • Explicarle a tu LLM local cosas que prefieres no contarle a OpenAI.
docker compose --profile basic up -d

Y a los 5 minutos tienes ChatGPT en localhost:3000. Tuyo. Sin que nadie mire. Sin contador de mensajes.

Nivel 2 — modo creador

Le añadimos audio: escuchar y hablar.

  • faster-whisper-server para transcribir audio (mismo motor que usa OpenAI por dentro).
  • Kokoro para generar voz.

Ambos exponen API compatible con OpenAI, lo cual es brutal: si tienes una app que ya usa whisper-1 o tts-1, cambias dos líneas y pasa a usar tu versión local.

Casos de uso reales:

  • Transcribir todas tus reuniones sin pagar 30€/mes a Otter o similar, y sin enviar audio confidencial a la nube.
  • Procesar notas de voz y volcarlas a Notion / Obsidian / lo que uses.
  • Generar locuciones para vídeos, podcasts, audiolibros sin ElevenLabs.
  • Asistente de voz casero que vive solo en tu casa.

Nivel 3 — taller de imágenes (y vídeo)

Aquí entra ComfyUI, el «Photoshop del prompt».

  • Generar miniaturas para YouTube sin facturas de Midjourney.
  • Mockups para clientes.
  • Ilustraciones para posts.
  • Assets para juegos.
  • Vídeo generativo (CogVideoX, Wan, HunyuanVideo) si tienes una GPU seria.

Avisos sinceros:

  • Para que sea usable necesitas GPU NVIDIA o Mac Apple Silicon decente. En CPU pura tarda minutos por imagen.
  • En Mac Docker no puede usar Metal, así que el repo incluye un script (scripts/comfyui-mac.sh) que instala ComfyUI nativo dentro del propio repo. Reversible con un rm -rf.
  • Hay una trampa: las versiones recientes de ComfyUI traen workflows «API» (Seedance, Kling, Veo, Flux Pro…) que piden pagar créditos porque llaman a servicios cloud. Eso no es local. Usa workflows con nodos Load Checkpoint / KSampler y serás libre.

Nivel 4 — el búnker bien equipado

Esta es la pieza más potente del kit, especialmente si tienes un negocio o un side-project que ya usa la API de OpenAI.

LiteLLM es un proxy que vive en localhost:4000 y habla exactamente la misma API que OpenAI. Pero por debajo enruta a tus servicios locales:

  • Llamadas a gpt-4o → Ollama con Qwen 2.5
  • Llamadas a whisper-1 → tu faster-whisper local
  • Llamadas a tts-1 → tu Kokoro local

Es decir: tu código en Python que hoy dice esto:

client = OpenAI(api_key="sk-...")
client.chat.completions.create(model="gpt-4o", messages=[...])

Se convierte en esto:

client = OpenAI(base_url="http://localhost:4000/v1", api_key="not-needed")
client.chat.completions.create(model="gpt-4o", messages=[...])

Dos líneas. Sin tocar la lógica de tu aplicación. Y de repente tu SaaS funciona sin pagarle a nadie. O sigue pagándole a OpenAI pero sabiendo que puedes desenchufarlo en 30 segundos si sube precios.

Todo el resto del kit te da autonomía técnica. LiteLLM te da autonomía operativa.


El cálculo de servilleta

Mira lo que probablemente estás pagando ahora mismo si trabajas con IA a diario:

ServicioPrecio típico
ChatGPT Plus~22€/mes
GitHub Copilot~10€/mes
Midjourney~30€/mes
ElevenLabs~22€/mes
Servicio de transcripción~15€/mes
API calls de tu SaaSvariable, fácilmente 50-500€/mes

Sumando lo personal: ~100€/mes. 1200€/año. Sin contar la cuenta de la empresa.

Lo que necesitas para el kit:

  • Si ya tienes un Mac con M1/M2/M3 con 16+ GB de RAM: nada nuevo, te corre todo.
  • Si tienes que comprar hardware: una mini PC con 32 GB de RAM (~500€) o un PC con RTX 4070 (~800€) corre prácticamente todo bien.
  • El bunker definitivo: Mac Studio o servidor con GPU usada, ~2000-3000€.

Es decir, lo que pagas en 1-2 años de suscripciones se convierte en hardware que es tuyo, te dura 5+ años, y nadie puede ratelimitarte.

Y la cuenta de tu empresa, si la tienes, se vuelve más interesante: bajas de pagar 500€/mes en APIs a pagar 0€/mes a cambio de un servidor que ya tenías.


Pero, ¿es realmente equivalente?

No te voy a engañar. Hoy no. Qwen 2.5 7B no es GPT-4o. FLUX local no es Midjourney v6 al 100%. ComfyUI en Mac no genera vídeo Sora.

Pero:

  1. Qwen 2.5 14B y 32B se acercan muchísimo a GPT-4o para la mayoría de tareas comunes (resumir, traducir, escribir, razonamiento básico, código).
  2. Llama 3.3 70B ya es competitivo con los frontier models para muchísimos casos.
  3. FLUX.1-schnell genera imágenes que hace 18 meses la gente pagaba por hacer en Midjourney.
  4. El gap se cierra cada mes. En 2026 lo que hoy es «casi GPT-4» será «GPT-4 sin discusión».

Y para muchísimos casos de uso no necesitas el mejor modelo del mundo. Necesitas uno bueno, predecible, tuyo, gratis y disponible. Eso ya lo tienes.

Mi recomendación práctica: híbrido. Usa los modelos cloud cuando los necesites de verdad. Usa los locales para el 80% restante. Cuando los cloud te fallen (que te fallarán), tienes un plan B operativo.


¿Cómo se monta esto?

El repo está pensado para que un git clone y un docker compose up te dejen funcionando. Las instrucciones técnicas detalladas están en el README, pero el resumen es:

git clone https://github.com/ablancodev/ai-survival-kit.git
cd ai-survival-kit
cp .env.example .env

# Elige tu nivel de paranoia:
docker compose --profile basic up -d    # chat local
docker compose --profile creator up -d  # + audio
docker compose --profile bunker up -d   # + proxy OpenAI para tus apps

Para ComfyUI hay dos caminos (Docker NVIDIA / script nativo en Mac) explicados en el README.

Disco: cuenta con 15 GB para el básico, 30-60 GB cómodo, 100+ si vas a meter modelos de vídeo. Y ojo: es el disco virtual de Docker Desktop, no el del sistema. Sube su límite en Settings → Resources si vas justo.


La pregunta incómoda

Después de un par de tardes montando esto, te das cuenta de algo:

Probablemente no necesitabas ChatGPT Plus. Probablemente no necesitabas la suite completa de cinco suscripciones. Lo que necesitabas era una buena interfaz, un par de modelos decentes, y un poco de paciencia para configurarlo una vez.

Lo que pagas a OpenAI, Anthropic, Midjourney y compañía es muy útil — pero también es muy reemplazable. Y el día que decidan que tu uso, tu industria, tu país o tu cara no encajan, vas a desear haber montado esto antes.

En el búnker nadie te limita, el bunker es tuyo


Enlaces

Repo del kit: ai-survival-kit — código, instrucciones técnicas, troubleshooting.

Si solo quieres probarlo:

  1. clónalo
  2. docker compose --profile basic up -d
  3. abre localhost:3000

Si te ha resultado útil, comparte el repo. Cuanta más gente tenga su búnker montado, menos podrá ratelimitarnos cualquiera.