‘The New York Times’ contra OpenAI y Microsoft: la batalla entre los derechos de autor y la IA
Las compañías quieren entrenar sus herramientas de inteligencia generativa, pero utilizan materiales sobre los que no tienen ningún tipo de propiedad
El pasado noviembre pudimos ver en TikTok cómo una canción generada por inteligencia artificial, que utilizaba la voz del cantante Bad Bunny, se viralizaba incluso más que su último disco, lanzado solamente unos días antes. Como os podéis imaginar, a Bad Bunny no le hizo ni pizca de gracia. El usuario que creó el tema cuenta con un perfil de Spotify con más de 200.000 oyentes mensuales, donde ha publicado decenas de canciones utilizando la voz de Luis Miguel o Justin Bieber, entre muchos otros.
Este suceso no se trata de un caso aislado, porque, meses antes, también la plataforma de música en streaming ya había borrado miles de canciones generadas por inteligencia artificial para evitar posibles confusiones. Lo hizo, además, defendiendo que el problema no era que su origen estuviese generado artificialmente, sino el cobro por derechos de autor que estaban ingresando estas cuentas fraudulentas. Lo que, indiscutiblemente, era injusto para los artistas.
Con cada avance tecnológico, surgen debates sobre si las políticas de protección de la propiedad intelectual deberían enfocarse más en promover la innovación o en proteger los derechos de autor. Con la aparición de internet, inicialmente surgió un sentimiento de alarma, lo que condujo a una revisión y ajuste progresivo de las regulaciones que buscaban armonizar los intereses de todas las partes. En materia de economía y bienestar social, no se puede mirar para otro lado y, en la era de la IA, no nos podemos quedar atrás.
La reciente demanda del New York Times contra OpenAI y Microsoft evidencia este debate. En ella, el periódico va más allá, al pedir que se destruyan los modelos de entrenamiento de ChatGPT y Copilot que hayan utilizado contenido con copyright por considerar que han hecho un uso desproporcionado de estos datos. Estas nuevas compañías quieren entrenar a sus herramientas de IA generativa a través de los mejores textos, pero la polémica está servida al tratarse de unos artículos sobre los que no tienen ningún tipo de derechos.
En el 2014, Google News dejó de operar en España, porque la Ley de Propiedad Intelectual vigente entonces obligaba a la tecnológica a compensar a los editores de noticias por indexar sus contenidos en su buscador. No fue hasta ocho años después, con la actualización de la normativa, que Google decidió volver a ofrecer este servicio en nuestro país. El marco legal era excesivamente restrictivo y, como consecuencia, el panorama mediático español se situó en una posición desfavorable respecto a los periódicos del resto del mundo. Durante años, nuestras noticias no alcanzaron la visibilidad global, el posicionamiento y el tráfico que podrían haber logrado mediante esta herramienta.
Las similitudes entre el caso del New York Times y el de Google son notables, porque modelos como ChatGPT digieren y aprenden de los datos de forma parecida a la que se construye un motor de búsqueda. Ambos plantean debates profundos sobre los derechos de autor, la ética y las obligaciones legales y, aunque cada caso tiene sus particularidades, juntos demuestran la necesidad de establecer regulaciones claras para poder abordar esta problemática surgida por el desarrollo de la IA.
Durante mucho tiempo, los datos de entrenamiento utilizados para los grandes modelos de lenguaje – LLM, en sus siglas en inglés – y otros sistemas de IA generativa se habían mantenido en la clandestinidad. Pero cuanto más se usan, más escritores y artistas observan similitudes entre su trabajo y los resultados arrojados.
Cada vez es más frecuente ver cómo académicos, escritores y artistas solicitan a las empresas de IA generativa que revelen sus fuentes de datos y, cómo en el caso del Author’s Guild, el gremio de autores de Estados Unidos, que compensen equitativamente a aquellos cuyas obras han sido utilizadas para estos procesos de aprendizaje automático. Ante esto, algunos expertos de la industria alegan que los modelos de IA no copian obras en el sentido tradicional, sino que digieren los datos de entrenamiento para llevar a cabo su función.
Del mismo modo que los artistas beben de distintos artistas e influencias para crear sus obras, la IA se basa también en lo que previamente se ha creado y compartido por otros. Esta similitud nos lleva a preguntar si la creatividad humana es realmente única o si la conciencia es el requisito indispensable para la verdadera creatividad.
Por el contrario, se defiende que la utilización de estos contenidos protegidos es irrelevante cuando lo que se busca es solo la inspiración. El periodista Mike Masnick, referencia en tecnología en Estados Unidos, reflexionaba sobre si el hecho de que un artista se inspire en otros cantantes y géneros para crear su propia música hace que estas creaciones sean ilegales.
Es posible que estas demandas, aunque no prosperen, lleven a las empresas de IA generativa a tomar medidas para evitarlas. Echamos la vista atrás para recordar la guerra online del 2009 cuando se aprobó la conocida como Ley Sinde, capitaneada por la entonces Ministra de Cultura, Ángeles González Sinde. Aquella modificación legislativa buscaba permitir al Gobierno facilitar el cierre de páginas web que vulneraban la propiedad intelectual. Incluso por aquel entonces se convocó una huelga de usuarios en un internet en el que el 60% de sus contenidos se acusaba de ser pirata.
Finalmente, la ley no revirtió la situación, por lo que la solución pasa por un diálogo efectivo y eficiente entre empresas tecnológicas, instituciones y legisladores. Lo que queda subrayado es que se trata de un asunto que debemos atajar cuanto antes, por lo que se agradece que en el sector vayan surgiendo proyectos que busquen ser el canal entre todas las partes.
Este esfuerzo conjunto es esencial para fomentar un ecosistema donde la innovación tecnológica y los autores puedan coexistir de manera beneficiosa y justa para todas las partes involucradas.
José Manuel Mateu de Ros es CEO y fundador de IQube
Sigue toda la información de Cinco Días en Facebook, X y Linkedin, o en nuestra newsletter Agenda de Cinco Días