Este fin de semana llegó el fin de mi uso gratuito de Midjourney, mi IA creadora de imágenes favorita.
Así que, tocaba buscar alternativas y ver si hay alguna que merezca la pena o es mejor pasarse al plan de pago de la actual.
Tenía ya instalado Stable Diffusion en local, ya que fue la primera que probé, aunque me gustaba menos que Midjourney y por eso apenas la usaba.
Era la versión 1 de la aplicación así que, como esta semana ha sido noticia la extensión ControlNet que permite hacer cosas bastante avanzadas, me he animado a darle una oportunidad a la versión 2, a ver qué tal.
Aunque si googleas un poco verás que hay distintos métodos, la mayoría me fallaban en algún punto.
Finalmente, he encontrado dos métodos que me han funcionado sin errores. Uno más sencillo y otro más manual.
Voy a explicar los dos en este artículo: empezaré por el método fácil (Easy Diffusion) y a continuación explicaré el método manual (creado por Automatic1111), con la ventaja para el segundo de explicar cómo añadir el modulo Xformers, que acelera entre un 30% y un 50% el tiempo de creación de la imagen.
Además, para terminar con la instalación de la herramienta, me gustaría lanzar en breve un artículo explicando la instalación de ControlNet.
Así podrás tener para tener un buen arsenal para la creación de imágenes a medida y totalmente gratuito a nuestra disposición.
Pero antes de empezar, un punto importante.
Índice de contenidos
- 1 Los requisitos del PC para utilizar Stable Diffusion
- 2 Instalar Stable Diffusion en tu PC gratis y fácilmente
- 3 Instalar Stable Diffusion en tu PC de forma manual
- 3.1 Paso 1: descargar lo necesario
- 3.2 Paso 2: crear la carpeta de instalación
- 3.3 Paso 3: Instalar Python
- 3.4 Paso 4: Instalar la interfaz del programa
- 3.5 Paso 5: pega los archivos con los correctores de caras
- 3.6 Paso 6: pega los modelos en la carpeta que corresponda
- 3.7 Paso 7: Instalar GIT
- 3.8 Paso 8: escribir la ruta de Python
- 3.9 Paso 9: lanzar el instalador del programa
- 3.10 Paso 10: configuración para PCs de “bajos” recursos
- 3.11 Paso 11: cerrar el programa
- 3.12 Paso 12: abrir de nuevo el programa
- 4 Es hora de disfrutar
- 5 Bonus track 1: cómo actualizar los modelos a las nuevas versiones de Stable Diffusion
- 6 Bonus track 2: cómo instalar el módulo Xformers en Stable Diffusion de forma fácil
- 7 Oye, creo que esto te interesa
Los requisitos del PC para utilizar Stable Diffusion
Si bien no se necesita un procesador de última generación para generar la imagen y con 16GB de RAM podemos ir bien, sí hay un par de aspectos relevantes.
El espacio en disco
Los modelos de datos que me he descargado pesan entre 4 y 7 GB, y a esto hay que añadir el resto del código. Si solo tienes un modelo, reserva 15GB de espacio en disco. Si tienes varios, pues vete sumando.
Ése era el requisito fácil.
El segundo requisito es más complicado.
La tarjeta gráfica
Te cuento: si quieres utilizar esta IA en tu PC vas a necesitar una buena tarjeta gráfica. Una con al menos 4GB de vRAM y los desarrolladores de los métodos que te explico recomiendan que sea nVidia.
Se pueden usar tarjetas AMD con Stable Diffusion, pero la aplicación y el sistema de instalación son otros, si quieres sacarles rendimiento.
En cuanto a modelos de nVidia, te diré que una GTX 1650 que puedes encontrar por 70-80€ en Wallapop (y bajando) es suficiente, peeeero…
Solo cumple los requisitos mínimos, que, en principio te dan para obtener imágenes en formato 4:3 de 512×384 píxeles. Es decir, imágenes bastante pequeñas.
Para conseguir imágenes más grandes recomiendan gráficas con más de 10GB de vRAM. Una RTX 3060 de 12GB es el modelo ideal, por precio y prestaciones, ya que en marzo de 2023 la puedes encontrar ligeramente por encima de los 300€ nueva y por 200€ de segunda mano.
Ahora bien, hay formas de saltarnos estas limitaciones:
- Si tu GPU tiene esos 4GB de vRAM, Easy Diffusion trae de serie un motor de escalado que funciona también bien.
- Si prefieres usar el método de Automatic1111, podemos usar Waifu para hacerlas más grandes sin perder demasiada calidad y utilizarlas así el redes sociales o banners, como te mencioné en mi artículo anterior
- En el caso de que la GPU de tu PC no tenga siguiera esos 4GB de vRAM, puedes configurar en Easy Diffusion que tire de la CPU para generar la imagen, pero ya te aviso que tardará mucho más en ofrecer resultados. Media hora tranquilamente dependiendo de la potencia de tu procesador.
¿Merece la pena generar imágenes por CPU? Personalmente, me lanzaría a por la GTX 1650 de cabeza. Dependiendo del número de “pasadas”, una imagen puede tardar entre uno y cinco minutos con esta gráfica.
Si a esto añades que es raro acertar con el prompt a la primera y que tendrás que probar varios hasta conseguir la imagen que quieras, echa cuentas del tiempo que tardarías en conseguir una buena imagen renderizada por CPU…
Bueno, pues una vez aclarado lo que necesitas a nivel de hardware, comencemos con el método fácil de instalación.
Instalar Stable Diffusion en tu PC gratis y fácilmente
Para este primer método, como te decía antes, nos vamos a servir de Easy Diffusion, en concreto, de la versión 2.5.
La guía original y sus archivos podéis encontrarlos aquí:
https://github.com/cmdr2/stable-diffusion-ui#installation
Es bastante inmediato el proceso.
Paso 1: te descargas el instalador de Windows
- Entra en el enlace de arriba.
- Baja hasta que veas esta imagen:
- Pulsa en el botón de Windows.
- Se te descargará el fichero “stable-diffusion-ui-windows.zip”:
Paso 2: descomprimir el archivo en la raíz del disco
- Corta o copia el archivo que te acabas de descargar.
- Dirígete a la carpeta raíz del disco. Generalmente será “C:” o “D:”
- Pega el archivo zip.
- Clica con el botón derecho sobre él y elige “Extraer todo”:
Se te habrá generado una carpeta llamada “stable-diffusion-ui”:
Paso 3: lanzar el programa
- Entra en la carpeta y encuentra el archivo “Start Stable Diffusion UI.cmd”:
- Doble clic sobre él
- Se abrirá la consola de comandos de Windows y comenzará a instalar el programa. No la cierres en ningún momento.
- Cuando acabe de instalarse se te habrá abierto una pestaña en el navegador:
- Ya podrás empezar a crear tus imágenes. Más adelante explicaré en otro artículo todas las opciones, aunque basta con escribir un texto (prompt) y darle al botón de “Make Image“:
- Obtendrás algo como esto:
Paso 4: configuraciones para PCs de (relativamente) bajos recursos
Un par de apuntes si tu PC cumple a medias o no cumple los requisitos recomendados.
Si tu PC cuenta con una tarjeta gráfica de 4GB
Básicamente, tendrás que hacer dos cosas:
- Vete a Settings y cambia a modo “Low”:
- Ajusta el tamaño de la imagen. Si no la quieres cuadrada, sino horizontal o vertical, te recomiendo las medidas 512×384 píxeles como formato apaisado y 384×512 para los verticales. Estos ajustes funcionan con una GTX 1650 de 4GB:
Si tu PC cuenta con una tarjeta gráfica de menos de 4GB
Vas a tener que renderizar por CPU (y esperar bastante a cada imagen). Para ello:
- Escoges aquí renderizar por CPU:
Paso 5: cerrar el programa
- Simplemente, asegúrate de que no estás generando ninguna imagen y cierra la consola de Windows.
Paso 6: volver a abrir el programa
- Solo tienes que ir a la carpeta donde lo instalaste (muy probablemente “C:\stable-diffusion-ui”) y darle doble clic al archivo “Start Stable Diffusion UI.cmd” (igual que en el paso 3):
- Se te volverá a abrir la consola de Windows y cuando finalice la inicialización se te abrirá la pestaña del navegador.
- Si por algún extraño motivo no se te abriera el navegador, o lo cerraras tú mismo sin querer, entra en http://localhost:9000/ y te debería de aparecer la interfaz del programa (siempre que no hayas cerrado la consola de comandos, en cuyo caso deberías repetir el paso 6 desde el principio):
Listo.
Ya tienes instalado Stable Diffusion en tu PC.
No ha sido muy difícil, ¿verdad?
Vamos ahora con el método manual, que tiene un poco más de miga.
Instalar Stable Diffusion en tu PC de forma manual
Si la opción de arriba es más sencilla, ¿por que querría alguien hacerlo de forma manual?
Pues porque hay quien prefiere entender qué es lo que hace y requiere la aplicación.
Si lo entiendes, puedes modificar lo que consideres y adaptarlo a tu uso y a tu máquina.
Y añadir extensiones, como el caso de Xformers, que explico más abajo.
Por este motivo añado este otro tutorial, en el que aclaro cada elemento que utiliza la aplicación por separado.
Y vas a ver que son unos cuantos.
Paso 1: descargar lo necesario
Vamos a necesitar varias cosas para esta instalación manual:
- Un editor de texto: yo utilizo Sublime Text (clica para ir a la descarga), pero si tienes Notepad, pues también te sirve.
- Python: el lenguaje en el que está escrito el programa y que necesitamos instalar en nuestro PC. https://www.python.org/downloads/release/python-3106/
- GIT: el repositorio de código desde donde instalaremos la aplicación. https://git-scm.com/download/win
- Stable Diffusion Model 1.5: los dos modelos que generarán las imágenes. Descárgate uno o los dos. https://huggingface.co/runwayml/stable-diffusion-v1-5
- Stable Diffusion Web UI: la interfaz web del programa, que nos permite interactuar de forma gráfica. https://github.com/AUTOMATIC1111/stable-diffusion-webui
- GFPGAN: el algoritmo que ayuda al modelo a “arreglar caras”. https://github.com/TencentARC/GFPGAN
Descárgate todo en una carpeta para tenerlo más a mano.
Una vez lo tengas, empezamos con la instalación.
Paso 2: crear la carpeta de instalación
Dos cosas a tener en cuenta:
- La puedes crear en la ruta que quieras de tu disco. Yo la he instalado en la raíz, al lado de la carpeta que cree en el tutorial anterior.
- No dejes espacios en el nombre. Pon algo como “stablediffusion”:
Paso 3: Instalar Python
- Abre “python-3.10.6-amd64.exe” con doble clic.
- Selecciona “Install Now” en la primera opción que se te abre:
- Espera a que se instale y cierra la ventana una vez terminado.
Paso 4: Instalar la interfaz del programa
- Extrae el archivo descargado “stable-diffusion-webui-master.zip”.
- Se te creará la carpeta “stable-diffusion-webui-master”.
- Copia todo su contenido (todas las carpetas y archivos):
- Pégalos en la carpeta de instalación que creaste en el paso 2.
Paso 5: pega los archivos con los correctores de caras
- Copia los archivos descargados “GFPGANv1.3.pth” y “GFPGANv1.4.pth”.
- Pégalos en la carpeta de instalación:
Paso 6: pega los modelos en la carpeta que corresponda
- Copia los archivos descargados “v1-5-pruned.ckpt” y “v1-5-pruned-emaonly.ckpt”. Si solo has descargado un modelo, pues copia el que hayas descargado.
- Pegalos en la siguiente ruta dentro de la carpeta de instalación:
“nombre-de-mi-carpeta\models\Stable-diffusion”.
En mi caso:
“C:\stablediffusion\models\Stable-diffusion”:
Paso 7: Instalar GIT
- Abrimos el archivo descargado “Git-2.39.2-64-bit.exe”
- Hacemos una instalación normal de Windows. Ya sabes, “siguiente”, “siguiente”, “siguiente” (unas cuantas veces más que de costumbre):
- Cerramos la ventana cuando acabe.
Paso 8: escribir la ruta de Python
Este paso no siempre es necesario, pero no pasa nada por hacerlo.
Es, quizá, el más complejo para aquellas personas que no están habituadas a navegar por las carpetas de Windows.
Vamos paso a paso:
- Lo primero es averiguar la ruta en la que hemos instalado Python en nuestro PC. Para ello vamos al buscador de Windows y escribimos “Python”.
- Nos encontrará el programa ya instalado (no confundir con el archivo que nos descargamos al principio) y a la derecha veremos “Abrir ubicación del archivo”. Clicamos ahí:
- Se nos abrirá la carpeta que contiene el acceso directo al programa. Le damos al botón derecho y seleccionamos la opción “Abrir la ubicación del archivo”:
- Se nos abrirá una nueva carpeta de Windows. Copiamos la ruta de dicha carpeta desde la barra superior:
- Lo siguiente es irnos a nuestra carpeta de instalación del programa y abrir el archivo “webui-user.bat” (ojo, no el “webui-user.sh”) con Sublime Text o el editor de textos que usemos. La forma más sencilla es darle al botón derecho sobre el archivo y seleccionar “Open with Sublime Text”, pero cada cual que lo abra como quiera.
- Una vez abierto el archivo en el editor nos fijamos en la línea 3:
- Pegamos la ruta de la carpeta de Python que tenemos copiada en el portapapeles y le añadimos “python.exe” (sin las comillas) al final, para que quede así:
- Guardamos el archivo y lo cerramos.
Paso 9: lanzar el instalador del programa
- Ya tenemos todo preparado para instalar el programa, así que doble clic sobre el mismo archivo que acabamos de editar (“webui-user.bat”) para ejecutarlo.
- Se abrirá la consola de comandos de Windows que empezará a realizar procesos:
- Tardará un rato hasta que acabe. Incluso parecerá que se queda parada en algunos momentos. No podemos cerrarla nunca. Cuando acabe veremos estas líneas:
- En rojo te señalo la dirección que tenemos que meter en cualquier navegador que tengamos instalado para acceder a la interfaz de la aplicación:
- Ya tendríamos Stable Diffusion listo para crear imágenes a base de prompts:
Paso 10: configuración para PCs de “bajos” recursos
- Si tu PC no cuenta con una tarjeta gráfica muy potente pero sí con una que tenga al menos 4GB de vRAM, podrás utilizar el programa produciendo imágenes de 512x384px (en horizontal o en vertical):
- A diferencia de lo que ocurre con la instalación sencilla, ese método manual no te trae por defecto ningún motor de escalado. Así que ya sabes, toca tirar de Waifu para ampliar la imagen. Es lo que he hecho yo con la imagen de cabecera de este segundo tutorial.
Paso 11: cerrar el programa
- Para cerrar la aplicación vale con cerrar la consola de comandos que se abre cuando ejecuto el archivo “webui-user.bat”.
Paso 12: abrir de nuevo el programa
- Para volver a abrir el programa cuando lo he cerrado (u otro día) tienes que ejecutar el archivo “webui-user.bat”, que está en la carpeta que creamos en el paso 2 para la instalación del programa.
Es hora de disfrutar
Espero que hayas podido seguir cualquiera de los dos tutoriales y puedas empezar a generar tus imágenes infinitas y gratuitas desde tu PC.
Tienes un montón de opciones y pestañas para probar, así que hazlo. Conseguir buenos resultados es más cuestión de práctica que de suerte acertando con el prompt, como en todo.
Otra opción es visitar páginas como éstas, que te muestran las imágenes y los prompts que las han generado:
- https://prompthero.com/stable-diffusion-prompts
- https://mpost.io/best-100-stable-diffusion-prompts-the-most-beautiful-ai-text-to-image-prompts/
Me parece la forma ideal de comenzar a trastear con esta potentísima aplicación.
Y crear princesas guerreras como ésta:
Bonus track 1: cómo actualizar los modelos a las nuevas versiones de Stable Diffusion
Bien, en realidad ya habrías acabado de instalar el programa en tu PC, pero si lo haces tal y como te he descrito solo podrás utilizar el modelo 1.4 de Stable Diffusion.
Y mientras escribo estas líneas ya está disponible el 1.5.
Es importante porque cada modelo mejora los resultados. O, por lo menos, genera otros diferentes.
Así que te voy a explicar cómo actualizarlo para poder utilizar la nueva versión.
Paso 1: descargar modelos nuevos
- Éste es sencillo, visitas este enlace: https://huggingface.co/runwayml/stable-diffusion-v1-5
- Bajas hasta que veas los modelos:
- Descargas el modelo que quieras, uno o los dos. ¿Ves lo que te comentaba antes del tamaño? 4 y 7 GB, no es poca cosa.
Paso 2: copiar los modelos en la carpeta adecuada
- Coges los archivos descargados tal cual y los copias (o mejor, los cortas).
- Navegas hasta la carpeta adecuada donde tengas instalado el programa, en concreto a ésta: “C:\stable-diffusion-ui\models\stable-diffusion”.
- Pegas los archivos. Verás que ya tenías la versión 1.4 (“sd-v1-4-ckpt”):
Paso 3: reiniciar el programa
- Éste paso solo es necesario si tenías arrancada la aplicación. Si está funcionando, cierras la consola de comandos de Windows. Si no es el caso, te lo saltas.
Paso 4: seleccionas el modelo que quieras antes de generar la imagen
- Una vez arrancado el programa con los modelos nuevos, solo tienes que seleccionar el que quieras utilizar para generar la imagen en este desplegable, donde te aparecerán los modelos que tengas instalados:
Así puedes ir actualizando el modelo cada vez que salga una versión nueva.
Además, que sepas que mediante este sistema podrías añadir otros modelos entrenados que hay por la red, no solo el oficial de Stable Diffusion. Se haría de forma análoga.
Bonus track 2: cómo instalar el módulo Xformers en Stable Diffusion de forma fácil
Para acabar con este megatutorial de instalación de Stable Diffusion vamos a instalar el módulo Xformer.
De momento no he averiguado cómo hacerlo en Easy Diffusion, así que, si quieres hacer uso de este módulo, tendrás que utilizar la instalación manual de Automatic1111.
Si en algún momento descubro cómo hacerlo con Easy Diffusion también lo añadiré aquí.
Aclarado este punto, te explico lo que hay que hacer, que es bastante poco.
Paso 1: abrir el archivo webui-user.bat
Partimos de la base de que ya tenemos instalado y operativo Stable Difussion en nuestra máquina (repito que mediante el sistema de Automatic1111).
Al abrirlo tal y como lo hemos instalado, no carga el módulo:
- Lo primero que tienes que hacer para que lo cargue es ir a la carpeta de instalación del programa y abrir con el editor de texto el archivo “webui-user.bat”. Sí, es el mismo que editaste en la instalación para añadirle la ruta de Python:
Paso 2: añadir argumento
- Lo siguiente que hay que hacer es añadir este argumento: “–xformers” en la línea 6 (argumentos para la línea de comandos):
Paso 3: abrimos el programa y comprobamos que se carga el módulo
- Una vez que abramos el programa como siempre, bastará ver la consola de comandos y comprobar que el módulo se ha cargado correctamente:
Si vemos estas líneas es que todo ha ido como debía y disfrutaremos de sus ventajas.
Ventajas de usar Xformers en Stable Diffusion
La principal es que tardas mucho menos en generar las imágenes. Podéis ver benchmarks en este enlace.
Con las gráficas actuales, a no ser que tengas una que supere los 1.500€, no es ninguna tontería este aumento de la velocidad de generación.
Además, también tiene efectos positivos en el consumo de vRAM, permitiendo a las gráficas modestas crear imágenes más grandes.
Desventajas de Xformers
Vale, pero, si es tan bueno este módulo, ¿por qué no viene implementado por defecto?
Pues el motivo es que puede que pierdas calidad en la generación de las imágenes.
Importante el matiz de que puede.
Porque no ocurre siempre. De hecho, ocurre bastante poco.
Tienes más info aquí.
Con esto cerramos.
Sólo de momento.
Porque en el próximo artículo te explicaré como instalar la extensión ControlNet que nos permite hacer cosas todavía más chulas.
Así que, si no quieres perdértelas, ya sabes: suscríbete justo debajo y te aviso en cuanto lo publique.
Oye, creo que esto te interesa
Regístrate y llévate mi guía de 66 páginas las Mejores Herramientas Digitales Gratuitas para:
- Marketing
- Analítica
- UX
- Gestión de proyectos…
Además, cada día en tu bandeja de entrada recibirás un truco o consejo (de los buenos) para mejorar tu negocio o proyecto digital.
Recursos gratuitos
- Una calculadora de la inversión de marketing.
- PDF con temas, ajustes y plugins que utilizo yo para optimizar el SEO en WordPress y PrestaShop.
- El flujo de emails comercialesóptimo para ecommerce.
- Plantillas para realizar un análisis de mercado de guerrilla.
- Y varios más…
Gustavo Mirabal dice
Hola, buenas tardes. He seguido con dellate la instalacion usando https://github.com/AUTOMATIC1111/stable-diffusion-webui.
Al final despues de modificar el archivo.bat.
y ejecutarlo, da una cantidad de errores.
Yago González dice
Buenas Gustavo, a la hora de modificar el archivo .bat ¿te has asegurado de que la ruta de Python que le has añadido es correcta? Fíjate que en la imagen que te muestro es la mía, pero ahí está metido el nombre de mi usuarios (“pcadmin”) pero en tu PC será otra. Revisa porfa si el problema se resuelve así.
Un saludo