El abogado robot Ross Intelligence pierde un juicio contra Thomson Reuters por alimentar su IA con la base de datos Westlaw
La corte del Distrito de Delaware dictamina que se vulneraron los derechos de autor (copyright) del producto por el uso inconsentido de los resúmenes de sentencias

Thomson Reuters ha ganado una importante batalla para blindar su producto estrella, la base de datos jurídica Westlaw, del uso abusivo de su contenido por parte de herramientas de inteligencia artificial (IA). Esta victoria sienta un precedente en Estados Unidos, país donde se libró la batalla legal y que cuenta con una legislación más flexible para las tecnológicas, sobre cómo las empresas de IA recopilan y utilizan las grandes cantidades de datos de los que dependen sus modelos. Y es que a pesar de que las sentencias que recoge una base de datos jurídica son de libre uso y carecen de protección de derechos de autor (copyright en EE UU), la actividad de los editores para añadir valor en la comprensión, uso y búsqueda de estas resoluciones sí está blindada.
Un tribunal de distrito en Estados Unidos, en concreto el del Distrito de Delaware, ha dado la razón a Thomson Reuters frente a Ross Intelligence (una especie de abogado robot) en una sentencia de 11 de febrero de 2025. La corte dictamina que se vulneraron los derechos de autor (copyright) de la conocida base de datos. Si bien queda alguna cuestión por resolver, como la vigencia de algunos derechos de autor, la sentencia otorga un fallo parcial a favor de Thomson Reuters.
Ross Intelligence fue una desarrolladora de productos de inteligencia artificial especializada en el área jurídica que cerró poco después de la demanda de Thomson Reuters por los costes judiciales. La batalla legal comenzó en 2020, cuando Thomson demandó a Ross por utilizar sus resúmenes de sentencias y otro contenido similar para entrenar a su abogado robot. Previamente, Ross había solicitado una licencia de uso de Westlaw que le fue denegada. Para entrenar su IA, Ross utilizó bulk memos (compilaciones de preguntas legales de abogados con respuestas buenas y malas) construidos a partir de notas de Westlaw.
La primera decisión judicial inclinó la balanza a favor del robot. Los jueces no vieron ningún ataque directo a los derechos de propiedad intelectual del producto de Thomson puesto que consideraron que el uso que había hecho Ross del contenido de la base de datos entraba dentro de los parámetros del uso legítimo o razonable o fair use, una vara de medir en el derecho anglosajón que impide que la propiedad intelectual pueda configurarse como derecho absoluto. De esta forma, se permite un uso libre y gratuito de las obras para fines de crítica, comentarios y noticias, reportajes y docencia.
Sin embargo, el tribunal de Delaware cambia ahora de criterio y otorga una victoria parcial a Thomson Reuters en el juicio sumario por infracción de derechos de autor de su producto. Los jueces rechazan la defensa de Ross, que basaba su actuación en el uso justo y en la comisión “infracciones inadvertidas”. Es decir, la empresa tecnológica argumentaba que la violación de derechos de autor se hizo sin conocimiento o intención de infringirlos.
“Un hombre inteligente sabe cuándo tiene razón; un hombre sabio sabe cuándo está equivocado. La sabiduría no siempre me encuentra, así que trato de abrazarla cuando lo hace, incluso si llega tarde, como lo hizo aquí”, escribe el magistrado Bibas en su resolución para argumentar el giro de guion en este caso.
‘Fair use’
El principal argumento que maneja la corte es el de que hubo una infracción directa de los derechos de autor de Westlaw por el uso no autorizado de sus headnotes, esto es, de sus resúmenes breves y puntos clave de derecho extraídos de resoluciones judiciales. También de su Key Number System, un sistema de clasificación de las sentencias de la base de datos que funciona asignando números clave a los contenidos para facilitar su búsqueda.
La corte considera que, aunque el texto de las resoluciones judiciales no es protegible por derechos de autor, estos extractos o headnotes sí que lo son porque pueden introducir creatividad al sintetizar o explicar parte de una opinión. Es decir, al destilar y resaltar los puntos esenciales de un fallo, el editor añade su juicio y “chispa creativa”, del mismo modo que un escultor talla una obra a partir de un bloque de mármol.
El juez Bibas rechaza el argumento de Ross del uso justo o legítimo de la base de datos porque considera que el uso realizado era comercial y no transformador y que afectaba negativamente al valor de mercado del trabajo protegido por derechos de autor de Thomson Reuters.
Maitane Valdecantos, socia de Audens y experta en nuevas tecnologías, cree que el juez acierta: “Es difícil alegar desconocimiento o aplicación de límites o excepciones cuando previamente has intentado cerrar un acuerdo con el titular de derechos de explotación de las obras protegidas”. Si el caso se hubiera resuelto en España, explica, el tribunal habría aplicado la teoría de los actos propios. El hecho de que Ross solicitó una licencia “estaría admitiendo que las obras están protegidas y que no pueden utilizarlas sin la autorización de Thomson, reconociendo así sus derechos de exclusiva en aplicación del artículo 17 y siguientes de la Ley de Propiedad Intelectual”. La experta subraya que los límites a los derechos de autor en EE UU son más flexibles que en Europa.
‘Merger’
La resolución también se opone a otros argumentos que enarboló Ross en su defensa. Entre ellos, el de la aplicación de la doctrina merger, según la cual en algunos casos la forma de expresar una idea está tan estrechamente ligada a la propia idea que protegerla impide que otros puedan expresarla de manera similar. Es decir, cuando sólo existe una o muy pocas maneras de expresar una idea, se considera que la idea se “fusiona” con su expresión, y en ese caso la protección de derechos de autor se ve limitada para evitar restringir el acceso a ideas fundamentales.
Ross alegaba que el contenido exclusivo de Thomson Reuters en realidad se confunde o tiene un origen tan cercano a la resolución judicial, que no es protegible en sí mismo. Sin embargo, la corte lo rechaza y afirma que hay muchas formas de expresar puntos de derecho a partir de opiniones judiciales, por lo que la defensa de merger no es válida.
Normativa
La corte aplica la Copyright Act y se apoya en precedentes judiciales que le sirvieron de parámetro para determinar, por ejemplo, si las notas de Westlaw cumplían con los requisitos de sufiente originalidad y hacer un análisis de la doctrina del uso justo.
En España, señala Maitane Valdecantos, la Ley de Propiedad Intelectual concede derechos exclusivos (en especial, los derechos de reproducción, distribución, comunicación pública y transformación) a los autores siempre que las creaciones reúnan los requisitos establecidos, “entre ellos la creación humana y la originalidad, íntegramente ligados entre sí”.
En cambio, las resoluciones judiciales o sentencias no son protegibles porque son excepciones que entran dentro d los límites a la propiedad intelectual, tal y como explica la experta: “Estos límites existen para garantizar el equilibrio de la propiedad intelectual con otros derechos, en protección del interés general del público”. La propia ley, aclara Valdecantos, “prevé que los límites no puedan interpretarse de manera tal que causen un perjuicio injustificado a los intereses legítimos del autor o vayan en detrimento de la explotación normal de las obras a que se refieran”.
En España también se reconoce un derecho de propiedad intelectual específico sobre las bases de datos conocido como derecho sui generis, el del fabricante de la base datos a prohibir la extracción o reutilización de todo o parte de su contenido. El derecho sui generis sobre una base de datos protege la inversión sustancial necesaria para presentar el contenido de la base de datos, ya sea a través de medios financieros o la cuantía económica que supone el empleo de tiempo, esfuerzo, energía u otros de similar naturaleza para desarrollar el producto.
Minería de datos y ChatGPT
Una vez asentada la doctrina de que los resúmenes y notas de una base datos pueden protegerse con derechos de autor ¿Podría alegar la IA que tan solo está haciendo un trabajo de minería al aprender con los datos que encuentra?
La Directiva UE 2019/790 sobre los derechos de autor y derechos afines en el mercado único digital reguló la minería de textos y datos (una técnica asistida por computadora que se utiliza para procesar y explorar grandes conjuntos de datos y hallar patrones que permitan predecir resultados) como excepción o límite a la propiedad intelectual en 2019, es decir, tres años antes que fuera conocido el primer gran modelo de lenguaje ChatGPT. “Por este motivo se cuestiona incluso si es de aplicación al entrenamiento de sistemas de inteligencia artificial”, señala Valdecantos.
“Hay que tener en cuenta que la minería de textos y datos requiere de extracción y copia de la información y que esta puede provenir de materiales u obras de acceso abierto que generalmente se encuentran disponibles para su descarga y reutilización de forma gratuita, de obras que están en dominio público, y/o de obras protegidas con derechos reservados, como son los contenidos de Thomson”, explica la experta.
En Estados Unidos para que esta actividad quede amparada por el fair use se tienen que dar una serie de requisitos que el juez no aprecia en el caso de Ross Intelligence. Entre ellos, se exige “acceso lícito al ejemplar, que no haya restricción contractual y no se haga accesible al público la totalidad del texto o una parte sustancial”, expone Valdecantos. Una de las claves es el propósito con el que se utiliza la obra ajena: el resultado no debe tener un efecto adverso en el mercado natural de esta.
Auge y declive de una start-up
Ross Intelligence fue una start-up muy admirada en Estados Unidos. En un sistema basado en inteligencia artificial en el que el precedente judicial es clave. La facilidad que auguraba Ross para localizar la sentencia adecuada atrajo gran atención y muchos adeptos. Tanto es así que en junio de 2020 anunció una alianza con OpenAI. No obstante, medio año después, y debido a la demanda de Thomson Reuters, Ross publicó la nota de cierre de actividad, alegando que los costes del juicio le impedían acceder a nuevas rondas de financiación necesaria para su proyecto.