La IA no es magia, es silicio ardiendo

Ayer por la tarde decidí que ya estaba harto de depender de las caídas de servidor de las grandes empresas tecnológicas y de pagar suscripciones mensuales por cada pequeña herramienta que necesito. En un arranque de motivación tras una clase especialmente densa de Arquitectura de Computadores, me propuse un reto que sonaba genial y revolucionario en mi cabeza: descargar un modelo de Inteligencia Artificial de código abierto y ejecutarlo directamente en mi portátil. Nada de nubes, nada de internet, nada de APIs. Mi máquina y yo, cara a cara, de forma completamente local y privada.

Spoiler de lo que ocurrió a continuación: mi máquina casi pide la jubilación anticipada por estrés térmico.

Estamos tan malacostumbrados a las interfaces limpias y minimalistas de las aplicaciones actuales que nos hemos acabado creyendo una mentira colectiva: que la Inteligencia Artificial es algo etéreo. Usamos la palabra "nube" como si nuestros datos y las respuestas de la IA flotaran en el cielo rodeados de algodón. Escribimos una frase en un recuadro blanco, le damos a la tecla enter y, en un abrir y cerrar de ojos, la pantalla nos devuelve un ensayo perfectamente redactado o un bloque de código sin errores. Parece magia pura.

Pero la magia no existe en la informática. Cuando le quitas el diseño bonito a la interfaz, lo que queda debajo en las entrañas del sistema son matemáticas brutas. Matrices gigantescas multiplicándose entre sí millones de veces por segundo para calcular la probabilidad de cuál es la siguiente letra que tiene que aparecer en tu pantalla. Y las matemáticas de esa magnitud, cuando se ejecutan en el mundo real, necesitan un soporte físico contundente. Necesitan placas de silicio, kilómetros de cables, muchísima energía eléctrica y, como consecuencia directa de las leyes de la termodinámica, generan una cantidad obscena de calor.

La barrera física de mi escritorio

El proceso de instalación del modelo en mi ordenador fue sorprendentemente fácil (la comunidad Open Source hace un trabajo increíble simplificando estas cosas), pero el verdadero drama llegó cuando le di al botón de ejecutar. Le pedí al modelo algo tan simple como que me resumiera un texto de tres párrafos sobre historia antigua.

En cuestión de cuatro segundos, mi portátil de estudiante (ese que uso para tomar apuntes en clase, programar un poco en Python y ver series por la noche) se transformó en una estufa improvisada. Los ventiladores internos se dispararon, poniéndose a girar a unas revoluciones que yo ni siquiera sabía que existían en ese chasis. El sonido en mi cuarto pasó de ser un silencio tranquilo al ruido de un túnel de viento.

El teclado empezó a quemarme literalmente las yemas de los dedos si lo dejaba pulsado mucho tiempo. Intenté mover el ratón para abrir el administrador de tareas y el puntero iba a saltos por la pantalla, agonizando.

Mi ordenador estaba sufriendo de verdad. Para poder procesar esa simple petición de texto, el modelo necesitaba cargar miles de millones de parámetros (los "pesos" del conocimiento de la IA) en la memoria RAM y en la memoria de la tarjeta gráfica (VRAM). En el ecosistema brutal de la Inteligencia Artificial moderna, los 16 gigas de RAM de un buen ordenador de consumo son el equivalente a intentar vaciar el mar Mediterráneo con un cubo de playa.

A los dos minutos de sufrimiento acústico y térmico, la pantalla parpadeó y me escupió el error que más tememos los que estudiamos esto: «CUDA out of memory». Básicamente, mi ordenador levantó una bandera blanca, reconoció que sus circuitos no daban para más, y mató el proceso para no morir en el intento.

La nube es en realidad un polígono industrial

Esta cura de humildad térmica en mi propia habitación me hizo reflexionar sobre lo que realmente está pasando a nivel macroeconómico. Si a un ordenador moderno le cuesta la misma vida procesar un resumen de tres párrafos en local, ¿qué demonios hace falta a nivel físico para responder a los cientos de millones de personas que usan estas herramientas cada día en todo el mundo?

La respuesta asusta un poco y rompe toda esa estética limpia que nos venden en los anuncios. La famosa "nube" donde vive la Inteligencia Artificial no está en la estratosfera. Son polígonos industriales gigantescos, centros de datos del tamaño de tres campos de fútbol llenos hasta el techo de servidores metálicos apilados en pasillos oscuros.

Cada uno de esos servidores lleva dentro decenas de tarjetas gráficas industriales especializadas que cuestan decenas de miles de euros cada una. Estas naves consumen tanta electricidad diaria como una ciudad entera. Y como todo ese silicio trabajando a destajo genera un calor infernal que fundiría los componentes en minutos, necesitan sistemas de refrigeración masivos. Hablamos de millones de litros de agua dulce consumidos constantemente solo para enfriar las tuberías y evitar que los procesadores salgan ardiendo. La Inteligencia Artificial es, a día de hoy, una bestia increíblemente sedienta de energía y recursos naturales físicos.

Por qué el mercado del software es como es

Entender esta barrera física también me ha hecho comprender por qué el mercado de los Micro-SaaS funciona exactamente como os he contado en otros artículos.

Muchos compañeros me preguntan: "Si sabes programar, ¿por qué no montas tú tu propia IA en un servidor para tu proyecto y así no dependes de la API de grandes empresas?".

Ahí tenéis la respuesta. Alojar una página web normal para un cliente cuesta un par de euros al mes. Pero alquilar servidores en la nube equipados con GPUs dedicadas (tarjetas gráficas potentes) para que tus usuarios puedan generar textos o imágenes sin que la web se quede colgada, cuesta miles de euros mensuales de mantenimiento.

La barrera de entrada técnica para crear una pequeña aplicación web hoy en día es casi cero gracias a las herramientas No-Code, pero la barrera de hardware para competir en la creación y alojamiento de modelos base es de miles de millones de euros. Es un monopolio natural dictado por el precio de la electricidad y el coste del silicio.

El verdadero reto de nuestra generación

En las noticias y en los foros de tecnología todo el mundo habla fascinado de cuándo alcanzaremos la Inteligencia Artificial General (AGI), de modelos con trillones de parámetros y de cerebros digitales cada vez más masivos.

Pero, desde mi humilde silla de estudiante de primero, viendo a mi portátil recuperar poco a poco el aliento y bajar su temperatura a niveles normales, creo que estamos ignorando el verdadero elefante en la habitación. El mayor reto que vamos a tener los que nos dediquemos a esto en los próximos diez años no va a ser crear un modelo informático que sea el doble de inteligente a base de fuerza bruta.

El verdadero reto es la optimización. ¿Cómo conseguimos que esa misma inteligencia requiera diez veces menos energía? ¿Cómo comprimimos esos cerebros matemáticos gigantescos para que puedan ejecutarse en el teléfono móvil de un profesor en una zona rural sin cobertura, de forma local, y sin que la batería del dispositivo se evapore en diez minutos?

El progreso real en la ingeniería no siempre consiste en hacer las cosas más grandes; muchas veces consiste en hacerlas ridículamente eficientes. Hasta que llegue ese día y se optimicen los modelos, creo que seguiré tragándome mi orgullo y pagando la suscripción mensual para que los servidores refrigerados por agua de otros hagan el trabajo sucio. Mi portátil me ha dejado muy claro hoy que él prefiere seguir siendo una herramienta para tomar apuntes en clase y, como mucho, ver alguna serie los fines de semana. Dejemos el silicio ardiendo para los que pueden pagarse la factura de la luz industrial.

La IA no es magia, es silicio ardiendo: Mi choque de realidad con el hardware local

La barrera física de mi escritorio

La nube es en realidad un polígono industrial

Por qué el mercado del software es como es

El verdadero reto de nuestra generación