Fair Use, Minería de Datos e IA: La Nueva Frontera del Derecho de Autor

Posted March 6, 2025

In COPYRIGHT, DERECHO DE AUTOR, Derecho de entretenimiento, Entertainment Law, Inteligencia Artificial

En los últimos años, el desarrollo de la inteligencia artificial ha transformado por completo la industria del entretenimiento, especialmente el cine y la música. Si bien estos avances han facilitado la producción de películas y canciones, brindando nuevas herramientas a productoras y disqueras, también han generado una problemática en torno a la protección del derecho de autor. La capacidad de la IA para generar contenido de manera autónoma desafía los marcos jurídicos tradicionales, planteando interrogantes sobre la autoría, el uso no autorizado de obras preexistentes y los límites de la creatividad humana frente a la inteligencia artificial.

En la actualidad, la industria musical se enfrenta a transformaciones que han traído tanto oportunidades como desafíos. Por ejemplo, las disqueras Universal Music Group, Warner y Sony Music demandaron a dos startups de inteligencia artificial[1], pues alegan que éstas entrenaron sus modelos de IA con grabaciones que no contaban con las licencias necesarias y producían canciones nuevas que suenan muy similares a obras protegidas dentro de su catálogo.

Las startups alegan que cuando los usuarios les piden generar estas canciones no está permitido incluir nombres de artistas para evitar plagio, sin embargo, la Recording Industry Association of América (RIAA) cita que los usuarios generaron música parecida a canciones de artistas como Mariah Carey y Michael Jackson[2]. A pesar de que una demanda fue interpuesta en junio de 2024, el caso continúa en proceso judicial y todavía no hay fallo.

Por otra parte, GEMA, la sociedad de gestión de derechos de autor en Alemania, junto a SACEM, Société des auteurs, compositeurs et éditeurs de musique, en Francia, presentaron una demanda contra Suno y a OpenAI[3], empresas estadounidenses especializadas en inteligencia artificial. Se les acusa de haber hecho uso de canciones protegidas, las cuales pertenecen al catálogo de GEMA y de los miembros de SACEM para que de ésta manera se entrenara a la herramienta de IA sin la debida autorización ni la remuneración correspondiente.

SACEM por su parte también alega que usaron un masivo número de obras musicales, en las cuales se incluían copias y reproducciones de letras, melodías y partituras para el entrenamiento previamente descrito y que OpenAI no obtuvo las licencias necesarias para esto, así como tampoco hizo el debido pago de las regalías correspondientes por el uso.

La industria cinematográfica tampoco ha sido ajena a la creciente disputa entre la tecnología y los derechos de autor. ElevenLabs, una empresa especializada en generación de voces mediante inteligencia artificial, ha enfrentado diferentes críticas ya que varios usuarios han hecho uso de sus servicios para crear audios de celebridades sin su consentimiento, y, en agosto de 2024, la empresa fue objeto de demandas[4] por parte de actores de voz, los cuales alegan que sus voces fueron utilizadas para entrenar a modelos de IA de esta empresa.

De igual manera, en octubre de 2024, Alcon Entertainment, productora encargada de la película Blade Runner 2049, presentó una demanda contra Elon Musk, Tesla & Warner Bros. Discovery, pues la productora argumentó que, durante la presentación de un nuevo vehículo de Tesla, el Cybercab, se hizo un aparente uso imágenes generadas por inteligencia artificial donde se hacía alusión a distintas escenas de la película, las cuales no tenían la respectiva autorización. La demanda, presentada en el tribunal federal de California^[5], busca una compensación por daños, ya que alegan que se cometió una infracción de los derechos de autor y una falsa asociación comercial.

Hasta el 18 de febrero de 2025, se han recopilado aproximadamente 39 demandas por derechos de autor contra empresas de inteligencia artificial^[6]. En la mayoría de los casos, las demandas han sido interpuestas por compañías editoriales, como The New York Times y Condé Nast, donde acusan a modelos de IA de usar sus obras sin autorización para entrenamiento. Un aspecto clave del debate es la legalidad del entrenamiento de IA bajo el “fair use” (uso justo), que ha sido cuestionado por recientes fallos judiciales, marcando un posible precedente en la regulación del uso de contenido protegido por derechos de autor en la inteligencia artificial.

Para que un modelo de inteligencia artificial funcione, se requieren grandes cantidades de datos para mejorar su capacidad de entendimiento y de esa manera generar contenido realista y coherente; para llegar a esto, es necesario entrenar los modelos por medio de información y conjuntos de textos, imágenes, audios y videos, los cuales ‘alimentan’ al modelo, y le permiten identificar patrones para reproducirlos con múltiples estilos o estructuras. Este entrenamiento funciona mediante técnicas como crawling (rastreo de información en línea) y scraping (extracción masiva de datos), sin embargo, esto ha causado múltiples disputas legales cuando no se cuentan con los permisos necesarios para el uso de este material. Para distintas empresas del entretenimiento, esto constituye una infracción a los derechos de autor y como respuesta esto, las compañías de IA han contra argumentado que su uso se encuentra permitido bajo la minería de datos o el fair use.

En algunas legislaciones, la minería de datos, que consiste en recopilar, analizar y detectar patrones en grandes volúmenes de información mediante algoritmos y técnicas automatizadas, se considera una excepción al derecho de autor. Esto permite que los modelos de IA utilicen datos sin requerir una autorización previa. En la Unión Europea, por ejemplo, la Directiva de Derechos de Autor en el Mercado Único Digital[7], estableció que la minería de datos funciona como una excepción siempre y cuando su uso sea utilizado con fines de investigación y desarrollo y cuando los titulares de los derechos no hayan prohibido explícitamente su uso, obligando así a las compañías de IA a implementar filtros para prohibir el rastreo de ciertos contenidos.

Por otro lado, en Estados Unidos se ha desarrollado la doctrina del fair use, donde está autorizado el uso de obras protegidas si se cumplen con ciertos propósitos, como una finalidad transformadora, y también si dicho uso tiene impacto en el mercado original.

Países como el Reino Unido y Japón, también han aprobado normas que permiten a los modelos de IA ser entrenados mediante la minería de datos con menos restricciones. China, en cambio, ha implementado políticas más rígidas sobre el uso de contenido y ha impuesto requisitos mucho más estrictos sobre el desarrollo de la IA^[8] .

Como se pudo ver, estas diferencias legislativas han generado cierta incertidumbre en la industria, ya que no existe una unificación normativa, lo cual lleva a una fragmentación en el desarrollo de la inteligencia artificial a nivel global.

Anteriormente fue explicado que la doctrina del fair use en Estados Unidos también funciona como una excepción al derecho de autor, pues permite que las obras protegidas puedan ser utilizadas sin autorización, siempre y cuando sea bajo circunstancias determinadas y casos específicos y, aunque el Copyright Act de 1976 – normativa que regula los derechos de autor – no contiene artículos específicos que hagan referencia a la inteligencia artificial, su contenido se puede adecuar a las condiciones actuales.

En aras de determinar si el uso de una obra es justo, se deben evaluar cuatro factores[9]: (1) que el propósito y el uso de la obra sea transformativo, es decir, que cree algo nuevo y diferente, por ejemplo, la investigación, la crítica y la parodia, (2) naturaleza de la obra, pues esta excepción usualmente aplica para obras factuales, como un artículo periodístico o científico, que para una obra creativa, pues éstas cuentan con una mayor protección, (3) la cantidad que se use sin autorización también es tenida en cuenta, en tanto es preferible que se haga uso de pequeñas partes en vez de la obra completa y, (4) el factor más importante a tener en cuenta es si la obra protegida se ve afectada de manera negativa por el uso no autorizado, por ejemplo, si un modelo creara una canción que potencialmente pudiera competir con la canción original.

Así las cosas, uno de los aspectos más importantes es el nuevo propósito de la obra, ya que, en varios casos, distintos tribunales han favorecido el uso no autorizado de obras cuando se usa con la fines transformativos. Las empresas de IA han argumentado que su uso es sí es transformador en tanto no se producen obras directamente, sino que únicamente se busca desarrollar modelos que puedan generar contenido nuevo.

Por otra parte, el impacto que el uso tenga en el mercado también es crucial, ya que, si la obra protegida se ve afectada negativamente, como, por ejemplo, si se da una disminución en su valor comercial, el “fair use” no se aplicaría. Al respecto, los autores de las obras alegan que el entrenamiento de los modelos afecta su negocio, pues se da una disminución en la demanda de las obras originales y esto hace que los modelos compitan directamente con los creadores.

Quienes defienden el entrenamiento de IA sostienen que en realidad no se está copiando ni distribuyendo las obras originales, sino que lo único que se hace es aprender patrones generales para producir contenido nuevo y que esto se puede asimilar al aprendizaje humano, pues los autores y creadores estudian obras antes de generar su propio estilo y creaciones, sin que esto infrinja al derecho de autor. Los opositores argumentan que el entrenamiento de los modelos por medio de las grandes cantidades de contenido protegido no compensa a los creadores, y que esta práctica no se puede comparar al aprendizaje humano, ya que lo que hacen estos modelos es replicar estilos y estructuras de manera automatizada[10].

La doctrina del fair use ha sido aplicada en distintas disputas tecnológicas, como por ejemplo el caso de Google Books (Authors Guild v. Google) en el año 2015[11], donde Google escaneó una gran cantidad de libros para crear una base de datos de búsqueda. El Tribunal del Distrito Sur de Nueva York determinó que el uso de los libros constituía fair use ya que esto creaba una nueva forma de acceder a la información pero no sustituía la compra de los libros originales.

Otro caso importante es Warhol Foundation v. Goldsmith[12], en el año 2023, donde la Corte Suprema de Justicia decidió que una serie de retratos hechos por Andy Warhol, los cuales se hicieron con base en fotografías de la artista Lynn Goldsmith, no constituía fair use, en tanto el uso comercial de la obra afectaba el mercado de la fotógrafa. Aunque en efecto hubo una transformación, ésta no fue suficiente por sí sola, ya que se puede considerar que competía con la obra original en el mercado.

En Enero de 2025, la Oficina de Derechos de Autor de Estados Unidos emitió una serie de informes^[13] sobre la protección de derechos de autor y su relación con la inteligencia artificial, donde se establecía que las obras que hayan sido generadas por modelos de IA no serán protegidas bajo las leyes de copyright si no tienen una intervención humana significativa, implicando así que la autoría humana es un requisito necesario para que la obra sea protegida. A pesar de esto, si una obra es creada con asistencia de inteligencia artificial, pero su creación incluyó una contribución creativa por parte de un ser humano, ésta puede ser parte de la protección por derechos de autor.

Uno de los interrogantes que se ha planteado respecto a esta creciente controversia es si los creadores de obras deben ser compensados si sus obras son utilizadas para entrenar modelos de IA. En la actualidad, los modelos son entrenados sin pagar a los titulares de derechos, lo cual ha generado controversias y demandas alrededor del mundo. En Reino Unido, más de 1.000 músicos británicos como Kate Bush, Annie Lennox y Paul McCartney se unieron para crear un álbum llamado “Is This What We Want?”, el cual está compuesto por 12 pistas en silencio, las cuales fueron creadas en protesta a las propuestas del gobierno, donde se permite utilizar las obras protegidas sin necesidad de autorización expresa. Dicho álbum pretende simbolizar un futuro en el cual los humanos no tengan creatividad producto de la explotación no autorizada por parte de los modelos de IA[14].

En respuesta a esta controversia, empresas como Google y OpenAI han comenzado a plantearse distintas soluciones para crear acuerdos entre empresas y creadores de contenido, pero a pesar de esto, todavía no existe un marco global que legisle sobre el tema.

Dentro del panorama actual, se ha propuesto el establecimiento de licencias obligatorias para que las empresas paguen por el uso de las obras protegidas y una mayor transparencia en donde las empresas de IA revelen que contenido utilizan para entrenar a sus modelos[15]. En materia de restricciones, también se propone la exigencia de permisos explícitos antes de utilizar el contenido protegida o la posibilidad de las empresas de establecer mecanismos de exclusión como opt-outs[16], en donde los creadores de contenido pueden solicitar que sus obras no sean utilizadas por las IAs.

La reciente implementación de la inteligencia artificial en el derecho de autor suscita una discusión importante, la cual radica en encontrar un equilibrio entre la innovación tecnológica y la protección de obras artísticas. Si bien la IA ofrece un conjunto de herramientas que enriquecen el análisis de contenido y avances en diferentes industrias, el uso no autorizado de información para su entrenamiento genera preocupaciones entre artistas y titulares de derechos, pues se pone en riesgo la creatividad y también no se da ninguna compensación justa por el uso de sus obras.

Regular la inteligencia artificial supone un reto complejo si el propósito es que el conocimiento y la información sea de fácil acceso. Propuestas como los sistemas de licencias, opt-outs y estrategias de transparencia, intentan proteger los derechos de los creadores y al mismo tiempo permiten el avance de la tecnología. De igual manera, resulta fundamental que estas regulaciones y soluciones sean claras y equitativas, para así fomentar un entorno en el que el desarrollo pueda coexistir junto a los derechos de autor y conexos, beneficiando a la sociedad en conjunto y garantizando el beneficio de las empresas, creadores y titulares de derechos.

Referencias

[1] https://www.bloomberg.com/news/articles/2024-06-24/sony-warner-universal-sue-suno-udio-for-training-ai-on-copyrighted-music?

[2] https://www.riaa.com/wp-content/uploads/2024/06/AITrainedonCopyrighted.pdfcom

[3] https://www.gema.de/en/news/ai-and-music/ai-lawsuit

[4] https://apnews.com/technology/algunos-actores-de-videojuegos-dejan-que-la-ia-clone-sus-voces-solo-no-quieren-que-los-reemplace-

^[5] https://fingfx.thomsonreuters.com/gfx/legaldocs/gdvzkqexwpw/Alcon%20v%20Tesla%20Complaint%2020241021.pdf

^[6] https://chatgptiseatingtheworld.com/2025/02/19/status-of-all-39-copyright-lawsuits-v-ai-feb-18-2025-judge-bibas-rejects-fair-use-in-ai-training-in-stunning-reversal/

[7] https://www.boe.es/doue/2019/130/L00092-00125.pdf

^[8] Medidas para Servicios de Inteligencia Artificial Generativa” 《生成式人工智能服务管理办法(征求意见稿) – Administración del Ciberespacio de China / https://harris-sliwoski.com/es/chinalawblog/ai-measures-issued-by-china/

[9] https://www.copyright.gov/fair-use/index.html

[10] https://texaslawreview.org/fair-learning/ / https://es.wired.com/articulos/6500-artistas-firman-contra-entrenar-inteligencia-artificial-con-obras-de-arte-protegidas?

[11] https://www.copyright.gov/fair-use/summaries/authorsguild-google-2dcir2015.pdf

[12] https://www.supremecourt.gov/opinions/22pdf/21-869_87ad.pdf

^[13] Report on Copyright and Artificial Intelligence – U.S Copyright Office – https://www.copyright.gov/ai/

[14] https://industriamusical.com/mas-de-1000-artistas-lanzan-un-album-silencioso-para-protestar-contra-la-ia-en-el-reino-unido/

[15] https://industriamusical.com/eeuu-estudia-otorgar-licencias-obligatorias-para-el-entrenamiento-de-inteligencia-artificial/

[16] https://ecija.com/sala-de-prensa/como-proteger-a-los-creadores-frente-al-entrenamiento-de-la-ia/

AI, copyright, derechosdeautor, inteligenciaartificial, propiedadintelectual