Ir al contenido
_
_
_
_
Breakingviews
Opinión
Texto en el que el autor aboga por ideas y saca conclusiones basadas en su interpretación de hechos y datos

La recopilación de datos de la IA se acerca a su momento Napster

Las crecientes demandas amenazan con reajustar el precio de la producción creativa de la industria

La comida gratis llegará a su fin para la inteligencia artificial en 2026. Durante la última década, los desarrolladores, desde Google hasta Alibaba, se han servido en gran medida del bufé de Internet, devorando material protegido por derechos de autor sin permiso ni pago. Pero no nos equivoquemos: la factura llegará pronto.

Considérelo el momento Napster de la IA. Hay más de 50 demandas por derechos de autor en curso, con importantes juicios en la agenda. Getty Images, The New York Times y NBCUniversal se encuentran entre los que hacen cola para cobrar por sus archivos digitales que se introducen en grandes modelos de lenguaje. La formación con datos autorizados aumentará los costes, lo que llevará a las empresas a acuerdos de licencia y asociaciones, donde el acceso, el capital y el tamaño prometen crear una mayor división en el sector.

La reacción negativa es mundial, desde una industria del entretenimiento y los medios de comunicación estimada en unos tres billones de dólares por la consultora PwC. Gran Bretaña ha descartado los planes para eximir la minería de textos y datos después de que los editores se rebelaran y, en su lugar, está pasando a un régimen de permisos. La Ley de IA de la Unión Europea ya exige tales divulgaciones para el aprendizaje automático. China va aún más lejos: los datos utilizados para el entrenamiento deben estar protegidos, licenciados y sometidos a un control ideológico antes de su uso.

En Estados Unidos, los límites legales son más difusos. Hasta ahora, los tribunales se han mostrado divididos sobre si el entrenamiento con colecciones de libros pirateados se considera un uso legítimo, lo que garantiza que las disputas persistirán. La Oficina de Derechos de Autor de Estados Unidos señala que hay docenas de casos pendientes, un exceso de litigios que ya está afectando a los planes de negocio.

Algunas empresas están capitulando, aunque solo sea para reforzar la previsibilidad. Anthropic, por ejemplo, pagó 1500 millones de dólares en septiembre para resolver las reclamaciones por aproximadamente 500 000 libros, o unos 3000 dólares por cada uno, y acordó destruir sus conjuntos de datos pirateados. Más del 70% de los conjuntos de datos utilizados para entrenar los principales modelos de IA carecían de cualquier licencia específica, según la Data Provenance Initiative. Llegar a un acuerdo puede ser más barato que llevar ese número a los tribunales.

La industria musical, marcada por la piratería de hace un cuarto de siglo, ha impulsado el nuevo orden. Universal, Warner Music (WMG.O) y Sony Music Entertainment demandaron a Udio por utilizar canciones protegidas por derechos de autor para producir otras generadas por IA. A finales de noviembre, dos de las tres habían llegado a acuerdos de colaboración que obligan a la startup a reeducar su modelo desde cero. Ahora están desarrollando conjuntamente herramientas que utilizan catálogos con licencia, lo que demuestra que el reinicio se está convirtiendo en el precio de la legitimidad.

Las iniciativas de cooperación se están multiplicando, pero de forma selectiva. Universal, dirigida por Lucian Grainge y hogar de artistas como Lady Gaga y Jon Batiste, también está trabajando con SoundPatrol en la huella digital y con Stability AI en la creación musical. El gigante de la fotografía Getty Images, que demandó a Stability AI por la generación de imágenes, ha cedido su archivo bajo licencia al motor de chatbot Perplexity. El New York Times rechazó las propuestas de OpenAI, propietario de ChatGPT, y presentó una demanda, mientras que Associated Press y el conglomerado mediático alemán Axel Springer optaron por acuerdos multimillonarios.

Estos enfrentamientos tienen un ritmo reconocible. Napster, pionero en el intercambio de archivos entre pares, acabó llegando a un acuerdo con los compositores por 26 millones de dólares y se declaró en quiebra, pero solo después de que la empresa y sus imitadores hubieran arruinado las ventas de CD. El experimento de “noticias gratuitas” de Yahoo con Reuters, la empresa matriz de Breakingviews, sentó un precedente temprano que ni siquiera el Capítulo 11 pudo borrar. La IA debería romper el patrón de destrucción, ya que las ideas sobre el contenido gratuito se reconsideran en tiempo real.

Como siempre, el momento favorece a los ya establecidos. Los gigantes tecnológicos cultivaron sus modelos fundamentales cuando rastrear Internet aún era gratuito. ChatGPT ahora presume de tener 800 millones de usuarios semanales, Anthropic gana más de 7.000 millones de dólares en ventas anualizadas y Gemini, de Google, presta servicio a unos 650 millones de usuarios al mes. Con grandes recursos económicos y un público consolidado, pueden permitirse pagar por el perdón después de no haber pedido permiso. Los recién llegados se enfrentan a un mercado en el que tanto los datos como la distribución están cada vez más regulados por acuerdos de exclusividad.

Reajustar las reglas no democratizará la IA, sino que consolidará este campo incipiente. Los litigios levantan barreras y benefician a quienes disponen de capital, potencia informática y archivos propios. El negocio de la música nos ofrece una lección: miles de discográficas se redujeron a tres gigantes que controlan el 80% del mercado, ya que la economía del streaming premió más el tamaño que la creatividad.

Las imágenes están avanzando en una dirección similar. En noviembre, un juez londinense se puso en gran medida del lado de Stability AI en su disputa con Getty Images. El tribunal dictaminó que el entrenamiento no se consideraba una infracción porque el modelo no contenía ni almacenaba material de Getty. También decidió que permitir a los usuarios británicos acceder a un modelo alojado en el extranjero no equivale a importar imágenes al país. La única salvedad era mínima. Los primeros modelos a veces procesaban marcas de agua al estilo de Getty, un inconveniente que ya se ha solucionado.

Estos resultados están empezando a afectar a la forma de pensar de los inversores. Los propietarios de grandes colecciones estructuradas (editoriales, productores musicales, agencias de fotografía) se encuentran ahora en posesión de un material escaso. Los autenticadores de procedencia y las auditorías de derechos se convertirán en partidas estándar en los presupuestos de IA, junto con las renovaciones y los derechos de autor.

Los costes no serán tan onerosos como el 70% de los ingresos que Spotify reparte entre los titulares de los derechos de las canciones, pero los gastos probablemente erosionarán varios puntos del margen bruto tras sumar las muchas bocas que hay que alimentar. También es probable que se acelere el cambio hacia las regalías vinculadas al uso. La ingeniería financiera no se quedará atrás: los gastos futuros en datos parecen maduros para la titulización, lo que se hace eco de la transformación de los flujos futuros en activos negociables.

La era de Internet ha desgastado el vínculo entre los creadores y la compensación. La IA lo está recomponiendo, de forma imperfecta pero a gran escala. Lo que antes se seleccionaba indiscriminadamente sin cargo alguno pronto se registrará, se licenciará y se renovará, convirtiendo los derechos en renta y los datos en capital. La próxima fiesta será móvil.

Los autores son columnistas de Reuters Breakingviews. Las opiniones son suyas. La traducción, de Pierre Lomba Leblanc, es responsabilidad de CincoDías

Rellena tu nombre y apellido para comentarcompletar datos

Más información

Archivado En

_
_