En un post anterior te expliqué cómo crear un vídeo para las redes sociales de tu negocio con IA.
Ahí puedes ver el flujo que utilizamos en Yo pongo el hielo para crear un vídeo completo, que publicaremos en nuestros perfiles sociales y cuyo alcance será orgánico. Es decir, esos no son vídeos pensados para promocionarse.
No son lo que podríamos llamar “spots publicitarios”.
Pero que esos vídeos no lo fueran no significa que no se puedan crear vídeos publicitarios para tu negocio gracias a la IA.
Desde que asistí a la Upscale Conf y vi lo que se podía hacer ya a nivel de creación audiovisual con IA, no he parado de darle vueltas al tema. Y de probar.
Lo que te traigo en este artículo es fruto de estas pruebas.
Y consiste en el flujo de trabajo más rápido que he encontrado para hacer un anuncio en vídeo mediante la IA.
Importante: he dicho el flujo más rápido, no el mejor.
Hay pasos opcionales que pueden mejorar el resultado. De ello hablaré en un próximo artículo, cuando tenga tan machacado esto que considere que es posible competir en la liga de la calidad con respecto a las grabaciones tradicionales.
A día de hoy con la IA sólo somos competitivos en la liga de la velocidad.
Que no está mal tampoco.
Bien, pues éste es el vídeo que he creado y que voy a utilizar para la explicación.
Veamos cuál ha sido el proceso de producción completo.
Índice de contenidos
- 1 #1. Pensar y definir
- 2 #2. El guion del spot
- 3 #3. El storyboard
- 4 #4. Las imágenes del storyboard
- 5 #5. Cambiar el formato de las imágenes (opcional)
- 6 #6. Retoca alguna imagen si hace falta (opcional)
- 7 #7. Le pedimos el prompt de cada imagen a ChatGPT
- 8 #8. Generamos los vídeos
- 9 #9. Editamos el vídeo
- 10 #10. Añadimos la voz en off
- 11 Pasos opcionales
- 12 Coste: en dinero y en tiempo
- 13 Conclusiones
#1. Pensar y definir
Como en cualquier proyecto, lo primero será saber qué queremos hacer. Cuál va a ser el objetivo del vídeo y sobre qué tema va a pivotar.
En el ejemplo tenemos que:
- El objetivo: el vídeo será para anunciar mi ecommerce Yo pongo el hielo durante la campaña de Navidad e incrementar ventas y reconocimiento de marca.
- El tema: en este caso es sencillo. En navidad nos juntamos con la gente a la que queremos y quizá la mayor demostración de lo que nos queremos son los brindis.
Como te digo, en este caso lo teníamos a huevo, pero, si no se nos ocurre el tema o vamos con prisa, le pedimos ayuda a ChatGPT para que nos de algunas ideas.
Una vez que tengamos alguna que nos guste, vamos a por lo siguiente.
#2. El guion del spot
Aquí de nuevo podríamos escribirlo nosotros, pero, por mucho que tengamos experiencia, nos llevaría un buen rato. Y si no la tenemos, más aún.
Así que, abrimos nuestro querido ChatGPT y le decimos algo como:
Como experto guionista necesito que elabores el guion para un spot publicitario de 30 segundos. La empresa es un ecommerce que vende todo tipo de marcas de bebida y el motivo del spot es la campaña de Navidad, donde la gente se reúne con sus familiares y amigos, y se cuentan cómo le va, hay brindis y muchas risas y abrazos
Por supuesto edita lo que necesites o consideres.
En este caso, el resultado fue el siguiente:
Escena 1: Inicio emotivo
[Visual] Una casa iluminada con luces de Navidad. Suena una melodía suave de campanas. Vemos una puerta abriéndose mientras un grupo de amigos y familiares se abrazan al entrar.
[Voz en off]:
“La Navidad es el momento de volver a estar juntos, de compartir historias, risas… y brindar por los momentos que nos unen.”
Escena 2: La mesa servida
[Visual] La cámara muestra una mesa decorada, llena de copas, botellas de diversas bebidas y risas alrededor. Alguien sirve un vino, otro una bebida espumosa, y un niño levanta su vaso de refresco.
[Voz en off]:
“En nuestra tienda online encontrarás todas las marcas que amas. Desde el brindis perfecto, hasta el sabor que trae recuerdos.”
Escena 3: Momentos de conexión
[Visual]
- Un padre contando un chiste mientras los demás ríen.
- Dos amigos chocando sus copas.
- Una abuela sosteniendo su vaso junto a su nieto mientras todos levantan los suyos.
[Voz en off]:
“Porque cada bebida tiene su historia, y en esta Navidad, queremos que la tuya sea inolvidable.”
Escena 4: Cierre inspirador
[Visual] El grupo brinda al unísono con una gran sonrisa. El logo del ecommerce aparece en pantalla junto a una frase.
[Voz en off]:
“Esta Navidad, brinda con nosotros. [Nombre del ecommerce], donde las mejores marcas llegan directo a tu mesa.”
[Pantalla final]:
Logo del ecommerce + Lema: “Tu brindis, nuestra pasión” + URL del sitio web
[Audio]
Campanadas y un jingle navideño alegre que finaliza con risas y sonidos de brindis.
¿Hay algún detalle que te gustaría ajustar o añadir?
Aquí ya le pido nuevas versiones, o edito lo que no me guste.
Lo hago hasta obtener algo que en mi cabeza suene bien.
#3. El storyboard
Este paso nos servirá para hacernos una mejor idea de cómo será nuestro anuncio.
Así que le digo a ChatGTP algo como esto:
Ahora necesito el storyboard con todos los planos
Y esto es lo que obtengo:
Storyboard del Spot Publicitario: “Navidad con Sabor a Encuentro”
Plano 1: “La llegada”
Descripción: Plano medio. Una familia entra a una casa decorada para Navidad, se abrazan y ríen al reencontrarse.
Ángulo: Enfoque frontal desde la altura del pecho.
Duración: 3 segundos.
Detalles: Se ven las luces navideñas parpadeando en el fondo.
Plano 2: “Abrazos y calidez”
Descripción: Primer plano. Un abrazo entre dos personas sonrientes, capturando la emoción.
Ángulo: Cámara fija a la altura del rostro.
Duración: 2 segundos.
Detalles: El fondo tiene desenfoque para destacar las expresiones.
Plano 3: “La mesa lista”
Descripción: Plano cenital (desde arriba). Una mesa decorada con velas, copas, y varias botellas de bebidas.
Ángulo: Cenital con enfoque en los detalles de las botellas y copas.
Duración: 3 segundos.
Detalles: Las manos de los invitados comienzan a interactuar, sirviendo bebidas.
Plano 4: “El brindis del grupo”
Descripción: Plano general. Todos los invitados están reunidos alrededor de la mesa, levantando sus copas.
Ángulo: Cámara ligeramente inclinada hacia arriba para dar un efecto dinámico y cálido.
Duración: 4 segundos.
Detalles: Las risas se sincronizan con el sonido de las copas chocando.
Plano 5: “Momentos personales”
- Plano 5A:
Descripción: Primer plano de un padre contando un chiste, con los demás riendo al fondo.
Ángulo: Ligeramente lateral para captar la expresión natural.
Duración: 2 segundos. - Plano 5B:
Descripción: Plano medio de dos amigos chocando sus copas mientras ríen.
Ángulo: Enfoque central en las copas.
Duración: 2 segundos. - Plano 5C:
Descripción: Plano detalle de una abuela alzando un vaso con su nieto, ambos sonrientes.
Ángulo: Primer plano de las manos levantando los vasos.
Duración: 2 segundos.
Plano 6: “El brindis final”
Descripción: Plano general. Todo el grupo, visto desde un ángulo ligeramente bajo, levanta sus copas en un brindis unánime.
Ángulo: Contrapicado leve para resaltar la unidad y alegría.
Duración: 4 segundos.
Detalles: La iluminación suave da un tono cálido y acogedor.
Plano 7: “Cierre y marca”
Descripción: Plano detalle. Una copa se eleva y queda en el centro del plano mientras aparece el logo del ecommerce y el lema: “Tu brindis, nuestra pasión”.
Ángulo: Enfoque fijo en la copa; fondo desenfocado.
Duración: 4 segundos.
Detalles: El jingle navideño cierra mientras suenan campanas y risas de fondo.
Duración total: 30 segundos.
¿Te gustaría visualizar el storyboard con imágenes o necesitas ajustarlo antes de proceder?
Aquí te diré que puedes tomarlo como orientativo, pero que luego, en la edición cambiará seguro. Más adelante entenderás el motivo.
#4. Las imágenes del storyboard
Bajo mi punto de vista, éste es el paso principal de todo el proceso.
En función de lo que consiga aquí, mi spot será mejor o peor.
De una imagen mala, es imposible sacar un vídeo bueno. Así que más vale dedicar el tiempo necesario aquí, ya que te ahorrará mucho rato intentando “arreglar” los prompts con los que generaremos los vídeos.
El problema, en la mayoría de ocasiones, es de la imagen del storyboard.
Bueno, pues a la pregunta que me hacía ChatGPT en el último resultado, le contesto que sí, que quiero visualizar las imágenes.
Y me devuelve esto:
Que, sinceramente, es algo muy deficiente y que no me sirve para nada. Así que le pido que me las dé por separado:
Créame las imágenes de cada plano por separado
Y me irá generando una por una, hasta tenerlas todas:
Bien, pues una vez que las tengas, ya te podrás hacer una idea de la historia que cuenta el spot.
En este momento notarás si te falta algún plano, y tendrás que pedírselo.
Yo le he pedido estos dos, porque veía que le faltaba algo de introducción al anuncio:
También podrás decirle que te cambie o retoque algún otro:
Elimíname de ese plano el árbol de navidad con los regalos
Una vez estés contento con todo el material, vamos con lo siguiente.
#5. Cambiar el formato de las imágenes (opcional)
Aquí ya, según el canal al que vaya dirigido el spot, necesitaré un vídeo cuadrado, panorámico o vertical.
En mi caso, como quiero un spot tradicional, se las pido en formato 16:9:
¿Me puedes pasar las imagenes en formato 16 / 9?
Es posible que este paso te de algún fallo en ChatGPT. Le cuesta al tío.
Reinténtalo hasta que te de lo que necesites. Al final tendrás esto:
Como te decía antes, la calidad de las imágenes determinará al 80% la calidad del vídeo final (el resto será el montaje y el audio).
En este ejemplo, yo no me di cuenta y fíjate:
Hay nieve dentro de la casa.
Imposible de quitar posteriormente con el prompt del vídeo. Más abajo te enseño el clip de vídeo final generado de esta imagen tras muchas pruebas.
Por eso, repite aquí hasta conseguir lo que necesitas.
O…
#6. Retoca alguna imagen si hace falta (opcional)
En ocasiones, por mucho que insistas con distintos prompts, puede que no consigas algo que te guste de lo que te ha dado ChatGPT en el paso anterior. No queda otra que retocar la imagen con alguna herramienta de edición que utilices.
Si usas Photoshop, que sepas que las versiones anteriores a las 2023 no abren (por defecto) los archivos de imagen .WEBP que genera ChatGPT.
Para poder abrirlos puedes hacer una de estas dos cosas:
- Instalar un plugin a Photoshop. Aquí tienes el enlace: https://helpx.adobe.com/es/photoshop/kb/support-webp-image-format.html
- Abres las imágenes con Paint. Sí, no es broma, Paint lo hace (y Photoshop no). Cuando tengas una abierta, le das a “guardar como” y ya eliges .JPG o .PNG, lo que necesites.
#7. Le pedimos el prompt de cada imagen a ChatGPT
Tengo que hacer más pruebas, porque, con las que he hecho hasta ahora, no tengo claro si este paso es obligatorio u opcional.
Es decir, todavia no estoy seguro de que, si no lo hago, el vídeo generado después sea peor.
De todas formas, para este vídeo lo hice, así que te lo explico.
La idea es que ChatGPT nos consiga un buen prompt que acompañe a la imagen del storyboard cuando lo subamos a Kling (este caso), Freepik o Runway para que nos genere los clips de vídeo.
Para ello, subo esta imagen a ChatGPT:
Y le digo algo como:
Como experto en prompts, necesito que me describas esa imagen que va a ser la base para un clip de video para Kling.AI. Dame el prompt en inglés
El resultado:
Detailed description of the image for a video clip in Kling.AI:
- General setting:
A bird’s-eye view of a dark-colored car (possibly black or dark gray) driving along a snow-covered road at night. The scene is enveloped in a serene, wintry atmosphere, highlighting the movement of the vehicle in a tranquil yet captivating natural environment. - Road and surroundings:
- The road is covered in compacted snow, with visible tire tracks indicating the car is in motion.
- Snow-laden trees line both sides of the road, with no lights or decorations, enhancing the feeling of a pure, untouched winter setting.
- Some tree branches slightly extend toward the road, adding depth to the composition.
- Car:
- The vehicle features a sleek, modern design with a roof that subtly reflects the dim glow of the snowy surroundings.
- The headlights are turned on, casting two defined beams of warm light that illuminate the snow ahead, emphasizing direction and motion.
- The car is perfectly centered in the frame, making it the primary focus of the scene.
- Ambient details:
- Snowflakes gently fall, visible in the air and on the road and trees, adding a sense of movement to the stillness of the environment.
- There are no human-made elements, such as traffic signs or buildings, creating a minimalist atmosphere focused on the interaction between the car and nature.
- Subtle shadows and soft reflections in the snow under the car’s headlights add depth and texture to the scene.
- Overall feeling:
- The image conveys tranquility, introspection, and a hint of adventure, making it perfect for a video clip designed to showcase the sophistication of a product or experience, such as an advanced AI assistant or cutting-edge automotive technology.
- The bird’s-eye perspective reinforces a sense of oversight and control, aligning seamlessly with Kling.AI’s messaging about providing guidance and assistance in any situation.
Would you like me to tailor this description further for a specific narrative or tone in the video?
#8. Generamos los vídeos
En este caso como te decía en el punto anterior yo voy a usar Kling.ai, pero tú puedes utilizar la herramienta que quieras.
A diferencia de la mayoría de pasos anteriores, aquí sí que es recomendable contar con un plan de pago, ya que, además de evitar la marca de agua, te tirarías muchísimo más rato esperando a generar los vídeos.
Proceso para generar los clips
Subimos la imagen:
Metemos el prompt de ChatGPT:
Elegimos el movimiento, o de algunos objetos:
O de la cámara:
Colocamos los ajustes. Yo he dejado los por defecto para este vídeo:
Añadimos prompts negativos si lo creemos conveniente:
Y vamos generando el siguiente plano mientas esperamos a que se genere el vídeo. Esto es importante: no esperes a que se genere el primer clip para empezar con el segundo, sino que repite el proceso que te acabo de explicar con cada uno de los planos del tirón.
Se irán generando los vídeos poco a poco. Y es entonces cuando te dedicarás a editar y retocar lo que te no te guste de cada uno, generando nuevos vídeos.
En función del nivel de calidad que busquemos, éste será el paso más lento. Sobre todo si no me has hecho caso y la imagen de la que partes no es buena.
Por eso, si no das con la tecla, rehaz la imagen del storyboard. Porque si no, a base de prompts en la herramienta de vídeo, jamás serás capaz de quitar la nieve del interior de la casa:
#9. Editamos el vídeo
En Capcut, en Premiere o donde quieras.
Analizamos el ritmo de los planos. Y también si nos sobra o nos falta algo en la historia visualmente, antes de meternos con el audio.
Aquí un par de consejos:
- Puedes seguir el timing del guion de ChatGPT para los planos o no, aunque sea a modo orientativo, pero el vídeo generado por la IA también influirá. Sobre todo, porque estamos hablando de tiempos de segundos o medios segundos.
- Puedes probar a pegar un plano a continuación del otro, o puedes probar a usar pequeños fundidos, como he usado yo en el vídeo de ejemplo. Obviamente, esto tiene un poco más de trabajo.
#10. Añadimos la voz en off
Aunque Freepik también lo hace, yo me he decantado por ElevenLabs.
Aquí sólo tendrás que:
- Copiar las frases del guion generado por ChatGPT.
- Escoger el idioma de la locución.
- Elegir una voz que transmita lo que quieres.
- Revisar que la locución no se pase del tiempo del vídeo. Si es el caso, hay que editar (ahora, en testo y luego, el audio, al montarlo).
- Exportar la locución.
Ahora, cogemos la locución y la metemos en el editor, cortando y editando hasta que cuadre con las imágenes. Importante esto: voz e imágenes tienen que ir de la mano, por lo que tendrás que alargar planos de vídeo o espaciar las frases hasta que quede “encajado”.
Es otro de los puntos que marca la calidad final del spot.
Bien, pues en algunos spots, una vez que lleguemos aquí y exportemos, ya habremos acabado el proceso.
Pasos opcionales
Sin embargo, en otros vídeos podremos necesitar dar otros tres últimos pasos, en función de lo que queramos conseguir.
Este trío final –sobre todo el último paso- es, por tanto, totalmente opcional.
#11. Añadir música (opcional)
Aunque no es imprescindible, una gran parte de spots llevan algo de música, a lo largo de todo el spot o solo en algún punto concreto del mismo.
Si quieres añadirla tienes dos opciones:
- Buscar una libre de derechos que nos encaje (lo que yo hice). Por ejemplo en https://pixabay.com/
- Crearla con IA. Lo intenté, pero no me encajó. Aquí la mejor solución es Suno.ai, por si quieres probar.
En cualquier caso, tires por donde tires, tendrás que añadirla al editor de video y encajarla, como hiciste con la voz en off.
Una cosa: la voz en off es lo importante (o debería). Que la música no la solape: baja su volumen para que sea un acompañamiento, no la protagonista.
#12. Añadir efectos de sonido (opcional)
De la misma forma que hemos hecho con la música, le podemos añadir algún efecto de sonido.
Yo para el vídeo le he añadido dos:
- El sonido del coche circulando en el plano 1.
- El sonido del coche parando en el plano 2.
En ambos casos los he sacado de la sección de sonidos gratuitos de Pixabay.
#13. Añadir subtítulos (opcional)
Aunque personalmente para un spot publicitario no me gustan, sí que estoy viendo la tendencia en redes sociales a subtitular todo, dado el caso frecuente de usar el móvil en silencio.
Si quieres añadir los subtítulos no tienes más que abrir Capcut y hacerlo:
Una vez te los haya generado, ya les damos formato:
Consejo: sí, hay efectos de subtítulos muy ¿guapos? que lo que hacen es distraer del spot, que es lo importante. Por eso, te recomiendo sobriedad en el estilo.
Exportamos la creación y ya tenemos nuestro vídeo totalmente acabado.
Coste: en dinero y en tiempo
Suena a broma, pero hacer este vídeo ha costado menos de 3€ a nivel de producción.
Este coste sale de multiplicar los créditos gastados al hacerlo en Kling.ai, por el coste de cada crédito en el plan que tenemos contratado.
En cuanto al tiempo, el proceso completo me ha llevado algo menos de 4 horas.
Teniendo en cuenta que iba documentando ligeramente cada paso, yo creo que se podría conseguir algo similar en 2-3 horas con algo más de manejo y repetición del proceso.
Es el flujo más rápido de los que he probado
El resultado final tiene varios puntos de mejora, claro. Yo tengo identificados un par, que quiero probar para mejorar, a ver si puedo llegar a conseguir resultados 100 por 100 profesionales con las herramientas actuales generales de la IA (no entrenadas o hechas a medida).
Pero eso se queda para un próximo artículo.
O un curso, ya veremos 😉
Conclusiones
Como te comento, tengo claro que el nivel de calidad del vídeo creado no es aceptable para muchas marcas actualmente.
Y que no lo será para ninguna, probablemente, en menos de un año.
Así de rápido avanza esto.
Sin embargo, creo que, a día de hoy, poder tener un vídeo como éste hecho en menos de 4 horas y con un coste de 3 euros, para mí –y para la inmensa mayoría de pymes de este país- era ciencia ficción hace tan solo unos meses.
Y ahora ha llegado el punto en que conseguirlo requiere de un poco de ciencia y también de algo de ficción, pero por separado.
Te animo a que pruebes el proceso.
A que realices tus creaciones audiovisuales.
A que aprendas.
Para que no te atropelle el tren de la IA. Sobre todo, si ya te pilló el de internet en su momento.
Por eso, aquí te dejo algunos recursos más que te pueden ayudar en tu aprendizaje:
- Artículos con cómo hacer cosas con Inteligencia Artificial.
- Artículos sobre el vídeo en los negocios digitales.
- Suscripción a mi newsletter para que te llegue un aviso a tu email cada jueves con el artículo nuevo de esa semana.
Recursos gratuitos
- Una calculadora de la inversión de marketing.
- PDF con temas, ajustes y plugins que utilizo yo para optimizar el SEO en WordPress y PrestaShop.
- El flujo de emails comercialesóptimo para ecommerce.
- Plantillas para realizar un análisis de mercado de guerrilla.
- Y varios más…
Deja una respuesta