Ingestia | Inteligencia Artificial y producción Broadcast

Inteligencia artificial

Como tecnología habilitadora, la IA (inteligencia artificial) está presente en casi cualquier sector y a muy diferentes niveles. El caso de la producción de contenidos no es una excepción, y en los últimos años hemos sido testigos de una paulatina adopción de estos sistemas, para áreas tan diferentes como la transmisión de señal o la producción de contenidos.

Podríamos definir dos grandes áreas de aplicación de la IA en procesos de producción broadcast:

  • Accesibilidad y documentación:
    • Transcripción
    • Traducción automática
    • Etiquetado de contenidos automatizado
  • Aplicaciones creativas y experiencia del usuario:
    • Creatividades basadas en IAs generativas
    • Plató virtual
    • Personalización

Accesibilidad y documentación:

Documentar de forma eficiente todo el contenido generado durante la creación de un programa de televisión como un informativo, con varias emisiones diarias en directo, supone un esfuerzo ingente pero irrenunciable, ya que sólo teniendo bien documentados los assets es posible emplearlos con agilidad para crear nuevos contenidos. Tareas como la transcripción son una exigencia legal, como elemento de accesibilidad para personas sordas. También la descripción del contenido de la imagen, es una funcionalidad cada vez más frecuente y que puede ayudar a personas con problemas de visión a entender el contenido de una imagen.

Estas tareas, tradicionalmente recaen en un equipo de profesionales que clasifican de una forma estructurada la información, con las limitaciones que esto puede tener, y que inevitablemente generan sesgos de todo tipo, ya que el esquema de datos no puede prever todas las posibles necesidades de información futuras, y el tiempo disponible es limitado.

Por su naturaleza, el etiquetado de contenido siempre será una tarea parcial, y siempre existirá la posibilidad de que surjan nuevas necesidades que no se hayan previsto (p.e. tal vez no se hayan etiquetado modelos de vehículos, negocios, edades de personas en segundo plano, lugares, mobiliario urbano, condiciones metereológicas, sonidos, emociones…).

Por ejemplo, imaginemos que queremos recuperar las imágenes en las que D.Trump aparece junto a Storm Daniels. Esta última, pudo haber resultad irrelevante para el documentalista hasta que pasa a un primer plano por su denuncia al expresidente, entonces ¿es viable revisar todo el material en el que D.Trump aparece acompañado de otras personas en los últimos 20 años, para ilustrar una nueva noticia? Pues, realmente, hasta hace pocos años no habría otra solución que visualizar cientos de horas de archivo para localizar apenas unos segundos de vídeo. Hoy en día, gracias a sistemas de reconocimiento facial, podríamos automatizar esta tarea y simplemente generar ese registro cuando lo necesitemos. No hay necesidad de previsión, simplemente damos un input actual y el sistema revisa el material digitalizado con ese nuevo criterio.

El etiquetado automático, es la base para agilizar los procesos de producción, ofreciendo un acceso inmediato al creador de contenidos, a materiales de archivo que tal vez no se habían utilizado antes, a través de una interfaz de texto accesible, que le permite generar prompts en lenguaje natural al estilo ChatGPT.

Además de multiplicar la capacidad de producción de nuevos contenidos, es innegable un impacto positivo en la amortización del archivo de contenidos del que dispone el canal. Un programa como “Cachitos de hierro y cromo” que parte del archivo de TVE, se podría generar en minutos prácticamente con un único prompt como “canciones con nombres de mujer”, “duetos en blanco y negro”, “viedoclips con bailarines”. Ya sólo faltaría añadirle los comentarios de la presentadora y los ingeniosos rótulos de los guionistas.

La transcripción de los diálogos, es también una excelente base de documentación, y un paso previo para la traducción de contenidos en tiempo real. Si juntamos traducción en tiempo real y tecnologías de deepfake, podemos disponer de diferentes streams de video en los que el presentador habla con su propia voz y articula su vocalización en idiomas que desconoce. Esto que parece ciencia ficción ya lo están haciendo empresas como Flawless.

Creación de contenidos

¿Y si vamos más lejos, y creamos contenido de la “nada”? (una “nada” relativa, ya que en el caso de IAs generativas, el sistema se ha entrenado con contenidos preexistentes).

¿Cómo puede ayudar la IA generativa a la creación de contenidos broadcast? Tal vez estemos a años luz de ver a una IA generar un programa de TV completo como sugiere el capítulo de Black Mirror “ Joan is Awful”, pero ya estamos en un momento de madurez suficiente para ayudar a los profesionales. Por ejemplo, generar una pista de background sonoro para reforzar la tensión de una noticia, o como ayuda en los procesos de composición digital (p.e. secuencia de paisajes relajantes). Adobe, la suite creativa más popular del planeta, ya integra soluciones basadas en IA como Firefly con la que realizar ediciones de gran calidad simplemente describiendo con texto lo que quieres obtener (por ejemplo, añadir un cielo estrellado a la foto).

Existen algunas cuestiones legales, que deberán ser resueltas en cuanto a la propiedad intelectual, transparencia y veracidad de estos contenidos generados o alterados mediante IAs generativas. A día de hoy, una imagen creada con Midjourney por ejemplo, no genera unos derechos de autor que puedan proteger la obra frente a copias o usos indebidos. Además parece claro que el contenido creado o modificado con inteligencia artificial deberá ser etiquetado de alguna manera, para que el espectador pueda distinguirlo de contenido “raw”.

Publicaciones Similares

  • |

    INGESTIA | Social TV

    Social TV El consumo colectivo de contenidos broadcast, tiene su origen en la gran expansión de las redes sociales, la democratización de los servicios de comunicación en tiempo real y en el fenómeno del consumo “multiscreen” (usuarios viendo la TV con el móvil en la mano). Los que mejor han sabido construir una oferta en…

  • Metaverso y comunicaciones unificadas

    Metaverso, un concepto en construcción Lo que hoy llamamos Metaverso (o, más bien, metaversos) es una multitud de plataformas virtuales independientes, donde los usuarios pueden interactuar como avatares, así como hacer compras, consumir contenido, generar información. etc. No deja de ser un concepto discutible, aunque ha recibido el respaldo de diferentes actores del mercado, como…

  • Estrategia «Trusted Communications»: Cómo recuperar la confianza en el canal telefónico

    El fraude telefónico y la suplantación de identidad (spoofing) han desatado una verdadera crisis de confianza en el canal de voz. En un escenario donde el 85% de la población en España ha sufrido intentos de fraude telefónico, la desconfianza del consumidor ha llegado a un punto crítico. De hecho, el rechazo a responder números…

  • CHAKEN la alternativa China a STIR/SHAKEN

    CHAKEN es la respuesta china a la necesidad de autenticar las llamadas con el fin de mitigar el fraude telefónico y el spam. Se desprende de la norma nacional «Especificación Técnica para la Autenticación Confiable de Identidad de Usuarios que Llaman Basada en Tokens de Contraseña para Tecnología de Seguridad de Red» (GB/T 43779-2024, denominada…

  • Branded calling y su cadena de valor

    La cadena de valor de las llamadas con marca comercial, es relativamente compleja, ya que agrupa dos procesos claves: En ambos procesos es necesaria la colaboración entre los diferentes actores que forman parte de un ecosistema de confianza que se despliega en una doble dimensión: Branded calling y autenticación de llamadas son cosas diferentes. A…

  • ¿Qué es Microsoft Teams Phone?

    Para actuar como una solución UCaaS completa, Microsoft Teams necesita acceso al Microsoft Teams Phone anteriormente conocido como «Microsoft Phone System». Existe cierta confusión entre la tecnología y el servicio (no confundir con los planes de llamadas de Microsoft “MS Calling Plans”). Microsoft Teams Phone es una tecnología o producto de Microsoft, que posibilita el…