Aquí hay una introducción a la IA generativa, ideas sobre cómo empoderarse con esta tecnología y una descripción general de cómo Stable Diffusion logró el éxito como un esfuerzo de código abierto.
Echa un vistazo a la Fig. 1. ¿Puedes adivinar qué tienen en común estas tres imágenes? De un vistazo rápido, podría pensar que es solo el estilo artístico genial. ¿Qué pasaría si te dijera que ninguno de ellos fue dibujado por un artista humano sino que fueron generados sobre la marcha en segundos por un modelo de IA?

Este es el poder de la IA generativa: modelos que pueden generar nuevos contenidos basados en una comprensión amplia y abstracta del mundo, impulsada por el entrenamiento en grandes conjuntos de datos. El «artista» de las imágenes de arriba es un modelo llamado «Stable Diffusion» lanzado como software de código abierto por la organización Stability AI. Todo lo que tiene que dar es un mensaje de texto que describa la imagen que desea en detalle, y hará el resto por usted. Si tiene curiosidad, he dejado caer las indicaciones de ejemplo que pueden generar las imágenes en la figura 2.

Stable Diffusion no es el primero de su tipo. «DALL-E» de OpenAI superó la persecución ya que se lanzó unos meses antes. Sin embargo, mirando el estado del arte, es el primer modelo generativo de IA capaz de sintetizar y manipular imágenes que se ha lanzado al público como software FOSS y que es práctico de adoptar.