Formación en IA transforma la creación audiovisual en Cali
- En la tercera y cuarta clase del Diplomado de Realización Audiovisual, los participantes experimentaron con herramientas como Midjourney y Sora —para la creación de imágenes y videos— ElevenLabs y Udio —para la generación de audio, voces y música—, aprendiendo a crear universos visuales con inteligencia artificial.
Santiago de Cali, 11 de julio del 2025
El Diplomado en Realización Audiovisual con Inteligencia Artificial, organizado por la Unidad Administrativa Especial Estudios Takeshima, avanza con intensidad y creatividad. En sus más recientes sesiones, los participantes se enfrentaron a dos componentes clave de la producción audiovisual contemporánea: el diseño visual con IA y la generación sonora automatizada.
Módulo 3: IA para imagen y diseño visual
Durante la tercera clase, los estudiantes tuvieron una introducción a modelos generativos como Midjourney y Sora, explorando las bases técnicas que permiten traducir una descripción textual en una imagen construida por algoritmos de aprendizaje automático.
También se discutieron temas cruciales como las licencias, derechos de autor, y los sesgos en los datasets de entrenamiento. Ejemplos como Zizi – Queering the Dataset, del artista Jake Elwes, sirvieron para reflexionar sobre la representación y diversidad en los modelos de inteligencia artificial.
“No basta con decirle a la IA ‘quiero una imagen bonita’. Para obtener un resultado potente hay que saber narrar visualmente desde el prompt”, explicó Marcelo Müller durante la sesión, enfatizando la importancia del estilo, la composición, la atmósfera y la intención.
Se introdujeron conceptos como las redes GAN (Generative Adversarial Networks) —que generan imágenes comparando simulaciones con datos reales— y los modelos de difusión, que reconstruyen imágenes eliminando progresivamente el ruido hasta alcanzar el resultado deseado. Todo esto, aplicado a la narración visual.
“Crear imágenes con IA también es contar historias. Pero hay que saber cómo decirle a la máquina lo que imaginamos”, expresó una de las participantes, durante la realización de su actividad práctica.
Módulo 4: IA para voz, diálogos, música y video
En el cuarto encuentro, el sonido tomó protagonismo. A través de plataformas como ElevenLabs y Suno, los estudiantes experimentaron con la síntesis de voz, la clonación vocal y la generación musical automática.
En el laboratorio práctico se abordaron las posibilidades de trabajar voice-overs (narración en off) y crear ambientes sonoros IA-first, es decir, diseñados desde cero con tecnologías de inteligencia artificial como base narrativa.
“La IA permite construir mundos sonoros desde ideas, emociones y palabras. Pero sigue siendo el criterio humano el que decide qué suena auténtico”, afirmó Marcelo Müller.
La sesión no solo fue técnica, también provocó reflexiones sobre la voz como identidad y sobre los riesgos éticos de clonar voces reales para ficciones o contenidos sin consentimiento.
Desde Takeshima se continúa promoviendo una formación integral donde la tecnología no reemplaza la creatividad, sino que la expande. Estos módulos permitieron a los participantes reconocer que detrás de cada imagen y sonido generados por inteligencia artificial, también hay decisiones humanas, referencias culturales y preguntas sobre representación, estética y responsabilidad ética. Este diplomado no solo fortalece el sector audiovisual de Cali, sino que posiciona a la ciudad como referente en la exploración de nuevas narrativas impulsadas por inteligencia artificial.
Comunicaciones Estudios Takeshima