La editorial Penguin Random House cambia sus cláusulas para evitar el uso sus libros para entrenar a la inteligencia artificial

Penguin Random House, el gigante editorial, refuerza la protección de los derechos de autor de sus autores frente al auge de la Inteligencia Artificial (IA). La compañía ha actualizado sus directrices, prohibiendo explícitamente el uso de sus libros para el entrenamiento de sistemas de IA. Esta medida, pionera en el sector, busca salvaguardar la creatividad literaria en la era digital.

Nuevas cláusulas de derechos de autor contra la IA

La editorial ha modificado las cláusulas de derechos de autor que aparecen al principio de sus publicaciones. Ahora, se especifica que «ninguna parte» del libro puede ser utilizada para entrenar modelos de IA. Esta nueva directriz se aplicará a todos los títulos nuevos y a las reimpresiones de obras existentes en todos los mercados donde opera Penguin Random House.

Esta decisión se enmarca en la estrategia de la compañía de proteger «enérgicamente» la propiedad intelectual de sus autores. En un contexto donde la IA generativa y los modelos de lenguaje de gran tamaño (LLM) se nutren de ingentes cantidades de datos, la editorial busca blindar el trabajo de sus escritores frente a un uso no autorizado. La medida subraya la importancia de reconocer y remunerar la creatividad humana, un valor fundamental en el mundo literario.

La minería de datos, una excepción bajo la lupa europea

Si bien la prohibición es amplia, Penguin Random House ha especificado una excepción: la minería de textos y datos. En línea con la legislación europea, concretamente el Artículo 4(3) de la Directiva 2019/790 sobre el Mercado Único Digital, la editorial permite este tipo de uso de sus obras. No obstante, esta excepción está sujeta a una interpretación jurídica precisa, ya que la minería de textos y datos para fines de investigación científica y académica se considera legítima, mientras que su uso para el entrenamiento comercial de modelos de IA podría ser objeto de debate.

La minería de datos consiste en la extracción automatizada de información de grandes conjuntos de datos. En el contexto literario, podría utilizarse para analizar tendencias, identificar patrones estilísticos o investigar la evolución del lenguaje. Sin embargo, la línea que separa la minería de datos legítima del entrenamiento de IA con fines comerciales puede ser difusa, y Penguin Random House se reserva el derecho de interpretar y aplicar esta excepción de manera restrictiva para garantizar la protección de sus autores.

Esta nueva política de derechos de autor coloca a Penguin Random House a la vanguardia de la lucha contra el uso indiscriminado de obras literarias para el entrenamiento de IA. La editorial se anticipa a un futuro donde la inteligencia artificial jugará un papel cada vez más importante en la creación y difusión de contenidos, y establece un precedente para la protección de la propiedad intelectual en el sector editorial.