"No estoy segura": así responde la directora técnica de OpenAI cuando le preguntan si Sora está entrenada con vídeos de YouTube

Mira Murati ha preferido centrarse en anunciar la disponibilidad de Sora para todos los usuarios a lo largo de este año

Youtubia
9 comentarios Facebook Twitter Flipboard E-mail

En los últimos tiempos, son dos los temas relacionados con OpenAI que más suenan en medios y redes (enfrentamientos con Elon Musk al margen): por un lado, su nuevo y sorprendente modelo de IA de generación de vídeos (Sora); por otro, las polémicas legales que le rodean por haber usado material sujeto a copyright para completar los datasets que luego se usaron para entrenar sus modelos de IA.

Pues bien, en este caso, la noticia que os traemos es un dos-en-uno: las inquietudes sobre las ya mencionadas malas prácticas de la compañía han salido a la luz durante una entrevista del The Wall Street a Mira Murati, directora técnica de OpenAI, y la no-respuesta a una de las preguntas de la periodista está generando ya una tormenta mediática.

La pregunta era muy sencilla, planteando si acaso OpenAI había usado vídeos públicos de plataformas como YouTube, Facebook e Instagram para entrenar a Sora, algo que Murati no ha confirmado ni negado con claridad. "No estoy segura", afirmó, para luego precisar "utilizamos datos públicamente disponibles y datos con licencia".

Elmomento Aquí Murati en el momento exacto en que se tiene que pensar la respuesta a la pregunta del WSJ.

Una falta de información concreta (con base en un desconocimiento poco creíble por parte de la directora 'técnica' de la compañía) que no ha hecho más que disparar las especulaciones.

Y es que, como señalan algunos, si Sora hubiera sido entrenada con vídeos de YouTube, eso significa que millones de usuarios podrían ver cómo los patrones / fragmentos de sus propios vídeos reaparecen durante la generación de contenidos en Sora, incluso años después de que sus propietarios los borrasen de la red.

Por otro lado, la reticencia de OpenAI a detallar completamente sus fuentes de datos no es un caso aislado en el ámbito de la IA generativa: cuanto mayor es la demanda de transparencia relacionada con el copyright y el uso ético de contenidos, más generalizada parece ser la tendencia a la no revelación de esa clase de detalles.

Un vistazo a…
CÓMO DESCARGAR VÍDEOS de Instagram, Facebook, Twitter o TikTok en tu MÓVIL

Podremos usar Sora este mismo año. ¡Albricias!

Así, Murati ha querido centrar la atención del público no el debate sobre el origen de sus datasets, sino en una buena noticia: el anuncio de que OpenAI pondrá Sora a disposición del público a lo largo de este mismo año (habla de que será "en unos meses" pero sin precisar fechas exactas), y de que lo hará no sólo con las funciones actuales...

...sino también implementando nuevas características, como la edición a posteriori de contenido mediante prompts. Otras medidas muy esperadas, como la posibilidad de generar audio para acompañar los clips de vídeo, son temas en los que están trabajando, pero que no veremos implementados en un primer momento.

Imagen | Marcos Merino mediante IA

En Genbeta | Me acabo de enterar de que hay a la venta en Amazon una (cutre) biografía sobre mí que no he autorizado. Hecha con IA, claro

Inicio