Los modelos de Runway se habrían entrenado con vídeos de YouTube sin permiso - El IAS

Runway AI: Entrenamiento con Miles de Vídeos de YouTube sin Permiso

La inteligencia artificial sigue siendo un tema caliente en el mundo tecnológico, y no siempre por razones positivas. Un reciente artículo publicado por 404 Media, una fuente confiable y reconocida por su periodismo independiente, ha revelado que el generador de video AI de Runway, una herramienta aclamada en la industria, se entrenó utilizando miles de videos de YouTube y contenido pirateado sin el permiso de los creadores. Esta revelación ha sacudido a la comunidad tecnológica y ha puesto en el ojo del huracán a Runway y sus prácticas éticas.

¿Qué es Runway y por qué es relevante?

Runway es una empresa multimillonaria que ha desarrollado una herramienta de generación de videos mediante inteligencia artificial. Esta herramienta, conocida como Gen-3, ha recibido elogios por su capacidad para crear videos de alta calidad, especialmente útiles para tomas cinematográficas y con controles de cámara avanzados. En junio de 2024, Runway lanzó Gen-3 después de recaudar $141 millones de inversionistas, incluidos Google y Nvidia, lo que le otorgó una valoración de $1.5 mil millones.

El Descubrimiento de 404 Media

404 Media obtuvo una hoja de cálculo interna de Runway que muestra que la empresa recopiló miles de videos de canales populares de YouTube y contenido pirateado para entrenar sus modelos de IA. Entre los videos utilizados, se encuentran contenidos de compañías de medios y entretenimiento de renombre como The New Yorker, VICE News, Pixar, Disney, Netflix, Sony, entre otros. Además, también se incluyeron videos de influencers y creadores de contenido conocidos como Casey Neistat, Sam Kolder, Benjamin Hardman y Marques Brownlee.

Un antiguo empleado de Runway confirmó a 404 Media que hubo un esfuerzo a nivel de empresa para compilar videos en hojas de cálculo y luego rasparlos utilizando software de código abierto como YouTube-DL, configurado con proxies para evitar ser bloqueados por YouTube.

Implicaciones Éticas y Legales

El uso no autorizado de estos videos plantea serias cuestiones éticas y legales. Las plataformas como YouTube tienen términos de servicio claros que prohíben la descarga y el uso de contenido sin permiso. Además, esta práctica no solo viola las políticas de YouTube, sino que también socava los derechos de los creadores de contenido que han invertido tiempo y recursos en la creación de sus videos.

Google, que es uno de los inversionistas de Runway y opera YouTube, reiteró su postura en contra del uso no autorizado de videos para entrenar modelos de IA, citando un artículo de Bloomberg de abril en el que afirmaron que entrenar modelos con videos de YouTube violaría las reglas de la plataforma.

La Reacción de la Comunidad y Futuro de la IA

La comunidad tecnológica ha respondido con preocupación ante estas revelaciones. Este incidente es solo el último en una serie de acusaciones contra empresas de IA que presuntamente utilizan contenido con derechos de autor sin permiso para entrenar sus modelos. En abril, más de 200 músicos firmaron una carta abierta pidiendo a las empresas tecnológicas que dejaran de infringir los derechos de los artistas para desarrollar IA.

Además, investigaciones recientes han revelado que empresas como OpenAI, Google, Anthropic, Nvidia, Apple y Salesforce han utilizado subtítulos de videos de YouTube sin el permiso de los propietarios de los videos para entrenar sus modelos de reconocimiento de voz e imagen.

Conclusión

El uso no autorizado de contenido para entrenar modelos de IA plantea serias cuestiones éticas y legales que necesitan ser abordadas con urgencia. Las empresas tecnológicas deben reevaluar sus prácticas y garantizar que respetan los derechos de los creadores de contenido. La transparencia y la ética en el desarrollo de IA son fundamentales para mantener la confianza del público y evitar una «carrera hacia el fondo» en la industria tecnológica.

La comunidad espera que incidentes como este impulsen a las empresas a adoptar prácticas más responsables y respetuosas con los derechos de los creadores, asegurando un desarrollo ético y sostenible de la inteligencia artificial.

Para más información y actualizaciones sobre este tema, puedes seguir a Samantha Cole en 404 Media, una periodista comprometida con la verdad y la transparencia en la era digital.