Entrenamiento de la Inteligencia Artificial: aspectos de propiedad intelectual, límite de minería de textos y datos, licencias colectivas ampliadas y remuneración

Se debatieron las implicaciones legales de un eventual real decreto sobre licencias colectivas ampliadas para la inteligencia artificial, generando preocupación en sectores económicos y jurídicos.

En esta sesión, celebrada el pasado 16 de octubre, se debatieron cuáles serían las consecuencias jurídicas, de competencia y de mercado de la eventual aprobación de un real decreto en la línea apuntada por el acuerdo del Consejo de Ministros de 9 de julio, según el cual: “se autoriza la tramitación administrativa urgente prevista en el artículo 27.1.b) de la Ley 50/1997, de 27 de noviembre, del Gobierno, del proyecto de Real Decreto por el que se regula la concesión de licencias colectivas ampliadas para la explotación de obras y prestaciones protegidas por derechos de propiedad intelectual en el ámbito de la inteligencia artificial1

Este acuerdo trae causa de una iniciativa del Ministerio de Cultura de la que poco se sabe. Ha generado mucho revuelo en el sector jurídico especializado en tecnología y propiedad intelectual, pero naturalmente mucho más y de mucho más calado en los sectores económicos afectados por esa potencial regulación. 

Los ponentes hicieron una primera introducción sobre los principios básicos de la minería de textos y datos sobre la base de la definición dada por la Directiva 2019/790, de 17 de abril de 2019, sobre los derechos de autor y derechos afines en el mercado único digital, según la cual consiste en “toda técnica analítica automatizada destinada a analizar textos y datos en formato digital a fin de generar información que incluye, sin carácter exhaustivo, pautas, tendencias o correlaciones” (art. 2.2). Esta misma definición se encuentra esencialmente en la transposición española (Real Decreto-ley 24/2021). 

La Directiva 790/2019 vincula a esta definición dos excepciones a los derechos de autor en sus artículos 3 y 4. Ambas son excepciones de implementación obligatoria por los Estados Miembros y, si se cumplen sus presupuestos, ampararían la minería de textos y datos para el entrenamiento de la inteligencia artificial, como se ocupa de aclarar el artículo 53.1.c) del Reglamento (UE) 2024/1689, de 13 de junio de 2024, por el que se establecen normas armonizadas en materia de inteligencia artificial. 

El acuerdo del Consejo de Ministros invoca también otra previsión de la Directiva 790/2019, la del artículo 12, sobre licencias colectivas con efecto ampliado, que no ha sido transpuesta en España, probablemente por contar España con una tradición encuadrable en ella por medio del artículo 150 del Texto Refundido de la Ley de Propiedad Intelectual. Las licencias colectivas con efecto ampliado, a tenor del artículo 12, son un mecanismo de extensión de efectos de los acuerdos de licencia concedidos por una entidad de gestión que es suficientemente representativa, de tal modo que dichos acuerdos puedan vincular también a aquellos titulares que no hubiesen trabado un mandato de gestión con la entidad, siempre para usos que tengan lugar dentro del territorio del Estado miembro en el que la entidad goce de representatividad. 

Se trata de un mecanismo que opera en el marco de los derechos de gestión colectiva voluntaria a fin de ampliar la capacidad gestora de las entidades más allá del ámbito de los titulares que les hayan confiado la gestión de sus derechos, con una importante excepción: que los titulares que no hayan mandatado a la entidad no se opongan de forma expresa a que se les extienda su labor representativa (opt out). 

La combinación de las dos, la excepción de minería de textos y datos y la regulación de las licencias colectivas con efecto ampliado, con los principios generales de la protección de las creaciones mediante propiedad intelectual permite elaborar el supuesto de hecho en el que puede operar ese eventual real decreto que regule un mecanismo de licencia colectiva con efecto ampliado vinculado al entrenamiento de la inteligencia artificial: solo es posible respecto a obras y otras prestaciones: 

  1. protegidas por propiedad intelectual, lo que excluye los meros hechos o datos; 
  1. reproducidas o extraídas por la minería de textos y datos, lo que excluye la minería de datos que no conlleva técnicamente la reproducción o extracción del contenido; 
  1. a las que no se aplique la excepción o limitación de minería de textos y datos, lo cual solo es posible en los casos regulados por el artículo 4 de la Directiva 790/2019 (ya que el del artículo 3 no es derogable), lo que sucede cuando sus titulares hayan reservado expresamente y de forma adecuada su derecho exclusivo; y  
  1. cuya reproducción o extracción no esté amparada por otra excepción o limitación. 

Los ponentes se refirieron a los principios de buena regulación que debe seguir la concepción y tramitación del real decreto: por un lado, justificar, con las evidencias adecuadas, la necesidad y eficacia de la norma, y, por otro lado, su proporcionalidad. Las normas basadas en una posición por defecto (un default) y un sistema de opt out recurren a mecanismo regulatorios poderosos y por eso, con mayor razón, deben ser calibrados adecuadamente y sobre la base de una evidencia adecuada. 

Sobre esta base, se advierte que el mecanismo solo sería aplicable a los titulares que hayan hecho opt out de la excepción de minería (es decir, cuando no se aplique la excepción). No se puede saber a priori quiénes lo harán ni por qué. En efecto, no se puede saber a priori si al hacer opt out de la excepción buscan no licenciar o licenciar, y, en este segundo caso, en qué términos lo harían (solo económicos o estableciendo condiciones particulares de minado o de uso posterior del contenido minado). 

Imponer un mecanismo de licencia obligatoria con efecto ampliado exigiría haber comprobado previamente que: 

  • los titulares quieren mayoritariamente conceder una licencia a la que no pueden acceder porque el volumen o la escala lo impiden o dificultan2; y 
  • no son relevantes para la mayoría de los titulares las condiciones particulares de esa licencia (un cierto ámbito temporal, una limitación de la forma de realizar la minería, restricciones a la utilización del contenido minado, etc.), sino únicamente los aspectos económicos3.  

Este análisis previo, que es el que justificaría la razón misma del sistema de licencia colectiva con efecto ampliado, no puede sortearse por que la norma se tramite por el trámite de urgencia. 

Todo lo anterior no es solo es una cuestión de los principios de buena regulación, o de la evidencia de los hechos o de la realidad de mercado, sino también jurídica. 

Varias normas en vigor conducen a un conjunto de presunciones y posiciones de partida que es necesario atender. Por un lado, el considerando 105 del Reglamento de Inteligencia Artificial establece una presunción jurídica de que con el opt out de la excepción de minería de textos y datos los titulares quieren “evitar la prospección de textos y datos” (es decir, imponer su derecho exclusivo en toda su extensión). 

Varias sentencias del Tribunal de Justicia de la Unión Europea (caso Soulier de 2016, Painer de 2012, Infopaq de 2009) recuerdan que el alcance de la protección conferida a los autores por sus derechos exclusivos debe entenderse en sentido amplio, lo que conlleva que haya de considerarse que dicha protección no se limita al goce nominal de los derechos, sino al ejercicio real de tales derechos. Por ello, el punto de partida es que debe garantizarse un ejercicio real y completo del derecho exclusivo. 

De ellas, es representativa la sentencia del caso Soulier4, en la que el Tribunal de Justicia consideró contraria a Derecho de la UE la presunción de una norma francesa de que los titulares de obras literarias fuera del circuito comercial querrían licenciar su obra para su explotación comercial. Existe riesgo de que un real decreto que se base en presunciones apriorísticas de lo que quieren los titulares de derechos que hacen opt out de la excepción de minería de textos y datos corra la misma suerte. 

Desde otro punto de vista, se destacó que el balance alcanzado en los trílogos que condujeron a la Directiva 790/2019 tuvo especial cuidado con no afectar negativamente a la innovación dentro del espacio intracomunitario. 

Desde esta misma perspectiva se apuntó que una iniciativa como la considerada por el acuerdo del Consejo de Ministros no debería ser de un solo Estado Miembro, sino coordinada a nivel de la Unión Europea para no generar asimetrías de mercado. No hacerlo así podría provocar una clara desventaja competitiva para España como destino de inversión tecnológica y fuente de innovación en inteligencia artificial. Como el hecho relevante para la propiedad intelectual frente a la excepción de minería de textos y datos es la reproducción (o la extracción si es de una base de datos), basta con poner los servidores desde los que se realiza la minería fuera de España (incluso dentro de la UE: Portugal, Francia, asegurando una latencia adecuada). Esto provocaría una fuga de inversiones y una pérdida de competitividad general para la industria España y para España como destino de inversión. Se recordó que esto ya ha sucedido en el pasado: la “tasa Google” del antiguo artículo 32.2 del Texto Refundido de la Ley de Propiedad Intelectual, que únicamente existía en nuestro país, provocó la salida de España de los principales agregadores de noticias (como Google News) e impidió la aparición de nuevos. 

A su vez, medidas de este tipo suponen una traba al uso del español como lengua de la inteligencia artificial y un escollo casi insalvable para las demás lenguas cooficiales que no tienen presencia en otros países, como sí lo tiene el español. Se comentó que, independientemente de lo que se aborde desde la legislación, los modelos fundacionales ya se entrenan con el español y las lenguas cooficiales mediante iniciativas internacionales como CommonCrawl. La Fundación CommonCrawl se dedica a recopilar y proporcionar acceso a grandes cantidades de datos web de forma gratuita, con el objetivo de fomentar la investigación y el desarrollo en diversas áreas, incluyendo la inteligencia artificial. Su impacto positivo en el entrenamiento de modelos fundacionales es significativo, ya que estos modelos se benefician de la diversidad y amplitud de datos disponibles, mejorando su capacidad para comprender y generar lenguaje natural. En cuanto a la representación de lenguas como el español, el catalán, el galego y el euskera, CommonCrawl incluye datos en múltiples idiomas, lo que permite que los modelos entrenados con su corpus sean más inclusivos y efectivos en contextos multilingües. En el corpus de CommonCrawl, el español representa aproximadamente el 4.5% del total (https://commoncrawl.github.io/cc-crawl-statistics/plots/languages.html). Aunque el catalán, el galego y el euskera tienen una presencia menor (0,2%, 0,03% y 0,03% respectivamente), están incluidos en el corpus, lo que asegura que estas lenguas también se beneficien del acceso a datos de alta calidad para el desarrollo de modelos lingüísticos avanzados. 

A continuación se abordaron la valoración y las implicaciones de que el mecanismo de licencia colectiva con efecto ampliado permita un opt out, que en este caso sería siempre un “segundo opt out”, ya que el primero sería siempre el opt out por los titulares de la excepción de minería, que es lo que reestablecería sus derechos exclusivos y con ello la posibilidad de considerar una licencia. 

Una primera reflexión a este respecto fue que el hecho de que se pueda hacer opt out del sistema de licenciamiento colectivo no puede ser una justificación del sistema en sí mismo. Para que el sistema sea económica y concurrencialmente aceptable debe acreditarse que concurren las dos premisas mencionadas con anterioridad: que los titulares quieren mayoritariamente conceder una licencia a la que no pueden acceder y únicamente les importan los aspectos económicos. 

Se señaló además que esto obliga a una segunda actuación al titular que quiere recuperar su derecho exclusivo. No solo primer opt out bajo art. 4, que ya no es del todo eficaz sin un segundo opt out ante las entidades de gestión colectiva para salir del mecanismo de licenciamiento colectivo. No esta la forma en la que la Directiva 790/2019 ha diseñado la manera en la que los titulares pueden recuperar sus derechos exclusivos frente a la excepción de minería de textos y datos y además impone diferentes estándares: el segundo opt out se realizaría ante terceros y potencialmente por medio de múltiples notificaciones (a cada entidad de gestión afectada). 

A lo anterior se añadió una reflexión práctica: la misma actuación por parte del titular exige otorgar un mandato voluntario a las EEGG que hacer opt out del mecanismo de licenciamiento colectivo, pero el primero no afecta a los derechos de los titulares y el segundo sí. 

Las intervenciones terminaron con un último bloque de reflexiones entorno a si el mercado español, tal y como está configurado actualmente por medio de las entidades de gestión colectiva registradas ante el Ministerio de Cultura, podría, bajo las exigencias de la Directiva 790/2019, sostener un mecanismo de licencias colectivas con efecto ampliado. A este respecto se señaló en primer lugar que la Directiva exige que las entidades de gestión sean suficientemente representativas, no en genérico, sino “sobre la base de sus mandatos” lo que significa que han de contar con “un número significativo de titulares de derechos en el tipo de obras u otras prestaciones pertinente que han otorgado un mandato para la concesión de licencias para el tipo de uso correspondiente” (artículo 12.3.a) y considerando 48). No hay constancia de que las entidades de gestión españolas hayan recibido suficientes mandatos de titulares que hayan decidido hacer opt out de la excepción de minería de textos y datos para gestionen la licencia de sus derechos para el entrenamiento de la inteligencia artificial. Solo en ese caso una entidad de gestión sería suficientemente representativa y tendría sentido ampliar el alcance de sus licencias a titulares que no les hayan mandatado expresamente. No es correcta para este caso la definición de entidad suficientemente representativa que recoge el artículo 66.4 del Real Decreto-ley 24/2021 que vincula la representatividad a un mero formalismo de inscripción ante el Ministerio de Cultura, que está desconectado de cualquier comprobación de los mandatos que hayan efectivamente recibido las entidades. 

A su vez, se cuestionó que las entidades de gestión españolas tuviesen las herramientas tecnológicas suficientes para identificar qué titulares de derechos han hecho opt out de la excepción de minería de textos y datos, lo cual es imprescindible para conocer el alcance de su repertorio, establecer tarifas equitativas, etc. A este respecto, se recordó que el artículo 53.1.c) del Reglamento de Inteligencia Artificial obliga a los proveedores de modelos de IA de uso general a que establezcan “directrices para cumplir el Derecho de la Unión en materia de derechos de autor y derechos afines, y en particular, para detectar y cumplir, por ejemplo, a través de tecnologías punta, una reserva de derechos expresada de conformidad con el artículo 4, apartado 3, de la Directiva (UE) 2019/790”. En buena lógica, esta misma obligación es exigible a las entidades de gestión colectiva que reciban el encargo legal de licenciar de forma colectiva y ampliada esos derechos. 

Se planteó en la audiencia cómo resolver la situación de los numerosos (se mencionó un millón) sitios web de los que se desconoce el titular y si eso impediría minar su contenido. Una respuesta que se dio a este interrogante es que, mientras esos titulares no hiciesen opt out de la excepción de minería de textos y datos, se aplicaría el límite y no habría inconveniente. Y si sí hiciesen opt out, no sería necesario conocer quién es el titular, solo que ha hecho opt out, lo que impediría la minería (como en cualquier otro caso) y que esos titulares, al adoptar una posición activa de expresar su opt out a la excepción, podían fácilmente adoptar esa misma posición activa concediendo un mandato voluntario a las entidades de gestión para la licencia de sus derechos. 

También se planteó que el mecanismo de licenciamiento colectivo ampliado facilitaría el acceso a contenido complejo, como el audiovisual. Una respuesta frente a esta reflexión fue que el contenido audiovisual es efectivamente complejo, por la concurrencia de derechos que contiene, pero que precisamente por eso la Ley de Propiedad Intelectual (arts. 88 y 89) establece importantes presunciones de cesión de derechos a los productores audiovisuales y que la práctica general de mercado es que los productores se aseguren de aglutinar esos derechos. Y que, en cualquier caso, con que cualquiera de los titulares concurrentes en la obra audiovisual que conservase sus derechos exclusivos podría hacer opt out del mecanismo de licenciamiento colectivo ampliado, lo que llevaría a la misma situación, por lo que imponer ese mecanismo por una situación particular, por contraposición a mayoritarias, podría no estar justificado. 

La sesión concluyó con una reflexión general acerca de que es evidente que si el Gobierno se plantea un mecanismo así lo hace porque considera que será una buena medida desde todos los puntos de vista, y que el debate, muy crítico con ella, no cuestionaba esa buena intención, pero planteaba posibles dificultades vinculadas a ella que convendría valorar para terminar de decidir si es realmente posible jurídicamente, y, en su caso, adecuado establecer una medida así. 

Juan Espinosa, socio fundador de Silverback Advocacy, Joseba Laka, Vicepresidente de la Comisión de Inteligencia Artificial y Big Data de AMETIC, y Rafael Sánchez Aristi, Catedrático de Derecho Civil en la URJC y socio de Cuatrecasas, fueron los ponentes de la sesión y Álvaro Bourkaib Fernández de Córdoba, socio de Cuatrecasas, fue el moderador.

Resumen elaborado por Álvaro Bourkaib Fernández de Córdoba, socio de Cuatrecasas

Superíndice

2 En la terminología del considerando (47) de la Directiva 2019/790: “la obtención de las autorizaciones de los titulares de derechos de forma individual suele ser tan onerosa y poco práctica que, debido a la naturaleza del uso o de los tipos de obras u otras prestaciones de que se trate, es improbable que se realice la operación de obtención de licencia exigida”.

3 Por definición, el licenciamiento colectivo apenas permite adaptación al caso particular: las entidades de gestión deben conceder autorizaciones no exclusivas del uso de su repertorio y deben aplicar condiciones equivalentes a todos los usuarios

4 Sentencia del Tribunal de Justicia de la Unión Europea de 16 de noviembre de 2016, asunto C-301/15, apartados 30 a 33.

Si te ha resultado interesante el artículo,

te invitamos a compartirlo por Redes Sociales

Twitter
LinkedIn
Facebook
Email
WhatsApp

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Descubre más desde Fundacion Fide

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo

Contacto

Rellene el formulario y alguien de nuestro equipo se pondrá en contacto con usted brevemente.