Es crucial dar a conocer que, durante los últimos meses, Morten Blichfeldt Andersen ha pasado una gran cantidad de horas recorriendo la tienda GPT de OpenAI. Desde su lanzamiento en el mes de enero, el mercado de bots personalizados se ha colmado con una gran cantidad de herramientas de IA útiles y, en ocasiones, extravagantes. Los generadores de dibujos animados generan ilustraciones al estilo neoyorquino y vívidas imágenes fijas de anime. Por su parte, los asistentes de programación y escritura proporcionan atajos para elaborar código y prosa. También hay un robot de análisis de color, un identificador de araña y así mismo, un entrenador de citas denominado “RizzGPT”. Sin embargo, Blichfeldt Andersen sólo está buscando un tipo muy concreto de bot: aquellos construidos sin permiso a partir de libros de texto protegidos por derechos de autor de su empleador.
Vale la pena destacar que, Blichfeldt Andersen es director editorial de Praxis, un proveedor danés de libros de texto. La empresa ha adoptado la Inteligencia Artificial (IA) y ha creado sus propios chatbots personalizados. Sin embargo, actualmente se encuentra jugando al golpe al topo en la tienda GPT, y Blichfeldt Andersen viene siendo el hombre que sostiene el mazo. No deje de leer todo aquí en cuanto a la tienda GPT que está plagada de violaciones de propiedad intelectual.
La tienda GPT y las violaciones de propiedad intelectual
Blichfeldt Andersen ha afirmado, “He buscado personalmente infracciones y las he denunciado. Siguen apareciendo”.
Blichfeldt Andersen sospecha que los culpables son primordialmente jóvenes que suben material de libros de texto para crear bots personalizados para compartir con sus compañeros de clase, y que ha descubierto sólo una pequeña fracción de los bots infractores en la Tienda GPT.
“La punta del iceberg”, señala Blichfeldt Andersen.
Es sencillo hallar bots en la Tienda GPT cuyas descripciones apuntan que podrían estar aprovechando contenido protegido por derechos de autor de alguna manera, como señaló Techcrunch en un artículo reciente que asevera que la tienda de OpenAI estaba asediada por “spam”. Es de acotar que, el uso de material protegido por derechos de autor sin permiso está permitido en algunos contextos, pero en otros los titulares de derechos pueden emprender acciones legales. Desde WIRED hallaron un GPT denominado “Westeros Writer” que afirma “escribir como George RR Martin”, el creador de Game of Thrones. Otro, por su parte, Voice of Atwood, pretende imitar a la escritora Margaret Atwood. Así mismo, otro más, Write Like Stephen, pretende emular a Stephen King.
Vale la pena comentar que, cuando WIRED intentó engañar al robot King para que revelara el “indicador del sistema” que ajusta sus respuestas, el resultado sugirió que tenía acceso a las memorias de King sobre la escritura. Write Like Stephen consiguió reproducir pasajes del libro palabra por palabra a pedido, incluso observando de qué página provenía el material. (Desde WIRED no pudieron ponerse en contacto con el desarrollador del bot porque no suministró una dirección de correo electrónico, un número de teléfono o un perfil social externo).
La portavoz de OpenAI, Kayla Wood, ha señalado que responde a las solicitudes de eliminación de GPT llevadas a cabo con contenido protegido por derechos de autor, pero se negó a responder las preguntas de WIRED sobre la frecuencia con la que cumple con dichas solicitudes. Igualmente comentó que la empresa busca de forma proactiva GPT problemáticos.
Wood ha expresado, “Utilizamos una combinación de sistemas automatizados, revisión humana e informes de usuarios para encontrar y evaluar GPT que potencialmente violen nuestras políticas, incluido el uso de contenido de terceros sin el permiso necesario”.
Nuevas disputas
El problema de derechos de autor de la tienda GPT podría añadirse a los dolores de cabeza legales existentes de OpenAI. La compañía se enfrenta a una serie de demandas de alto perfil que alegan infracción de derechos de autor, incluida una presentada por The New York Times y varias presentadas por diferentes grupos de autores de ficción y no ficción, incluidos grandes nombres como viene siendo; George RR Martin.
Es de resaltar que, los chatbots que se brindan en la tienda GPT de OpenAI se basan en la misma tecnología que su propio ChatGPT, pero son creados por desarrolladores externos para funciones determinadas. Para adaptar su bot, un desarrollador tiene la capacidad de poder cargar información adicional que puede aprovechar para aumentar el conocimiento integrado en la tecnología de OpenAI. El proceso de consultar esta información adicional para responder a las consultas de una persona se denomina generación de recuperación aumentada o RAG. Blichfeldt Andersen se encuentra convencido de que los archivos RAG detrás de los bots en la tienda GPT son un semillero de materiales protegidos por derechos de autor cargados sin permiso.
Según se informa, los términos de OpenAI para la Tienda GPT prohíben explícitamente “usar contenido de terceros sin los permisos necesarios”, pero en este momento no hay manera de que personas externas comprueben si los desarrolladores que crean GPT han subido su material protegido por derechos de autor. Eso quiere decir que los titulares de derechos de autor preocupados deben salir a cazar.
Blichfeldt Andersen usa palabras clave para buscar en la tienda GPT chatbots que puedan estar utilizando material de los libros de su empresa. Posteriormente, tiene que entablar una conversación con cada robot que encuentre para intentar adivinar si ha sido entrenado en títulos de Praxis. Cabe destacar que, sin duda, es un trabajo bastante tedioso, sin embargo, está dando resultados: ha logrado que varios robots reproduzcan pasajes concretos de los libros de texto de Praxis.
Las demandas que acusan a OpenAI de extraer material protegido por derechos de autor sin permiso para entrenar sus sistemas pueden tardar años en resolverse, sin embargo, las disputas sobre el material subido a la Tienda GPT podrían tener repercusiones mucho más inmediatas.
“Las GPT cambian la relación entre OpenAI y sus usuarios de manera importante para los derechos de autor”, ha afirmado James Grimmelmann, profesor de derecho de Internet en la Universidad de Cornell.
Cuando las plataformas en línea permiten a los usuarios subir su propio contenido (por ejemplo, YouTube permite que la gente común publique videos personales) están sujetas a la Ley de Derechos de Autor del Milenio Digital, parte de la ley de derechos de autor de Estados Unidos que permite a los titulares de derechos de autor presentar quejas si su propiedad intelectual es difundido sin su permiso. Entonces, si, por ejemplo, un YouTuber publica un clip con música de fondo sin licencia, en ocasiones los sellos discográficos presentarán quejas y conseguirán que eliminen los videos. Dado que la Tienda GPT permite a los desarrolladores cargar su trabajo, se rige por estas reglas.
Eliminar bots “infractores”
Concebida como un estatuto contra la piratería, la Ley de Copyright del Milenio Digital ahora posee una formidable importancia en la aplicación de los derechos de autor, debido a que permite a los titulares de derechos de autor una manera relativamente ágil de exigir que se elimine su trabajo cuando las personas lo colocan en línea sin su permiso: los avisos de eliminación de la DMCA.
Luego de que Blichfeldt Andersen halló sus primeros ejemplos de libros de texto de Praxis en la tienda GPT, presentó avisos de eliminación de DMCA a OpenAI. Señala que la empresa no respondió hasta que pidió ayuda a la Danish Rights Alliance, que representa los intereses de los trabajadores creativos en Dinamarca. La DRA posee un enfoque estricto para proteger los derechos de autor de sus miembros en la era de la Inteligencia Artificial (IA). El año pasado, una colección de más de 196.000 libros usados para el entrenamiento de IA generativa se desconectó de forma temporal mediante la presentación de avisos de eliminación de la DMCA.
Thomas Heldrup, jefe de protección y cumplimiento de contenidos de la DRA, frecuentemente lidera sus cruzadas de IA. También desempeñó un papel central al enfrentarse a la Tienda GPT, presentando quejas en nombre de Praxis que llevaron a OpenAI a eliminar bots que el editor consideraba infractores.
Heldrup ha afirmado que han eliminado con bastante rapidez los GPT infractores que les han informado. Aun así, le gustaría que la empresa hiciera cambios.
Heldrup afirma, “Es necesario que los titulares de derechos dispongan de mejores herramientas para buscar estas GPT infractoras”.
Blichfeldt Andersen ha señalado que Praxis se encuentra considerando emprender acciones legales contra la popular compañía OpenAI si las condiciones en la Tienda GPT no mejoran. Le gustaría que la compañía y otros desarrolladores de Inteligencia Artificial añadan sistemas más sólidos que busquen material con derechos de autor en el contenido RAG subido, similar al sistema Content ID implementado para proteger la aparición de materiales con derechos de autor en YouTube.
Aunque OpenAI ha cumplido con algunas solicitudes de eliminación de la DMCA dirigidas a su tienda GPT, algunos expertos en propiedad intelectual creen que la compañía podría argumentar que el concepto de uso legítimo protege algunos GPT que dependen de obras protegidas por derechos de autor.
Ahora bien, sin una manera sencilla para que personas externas observen lo que se ha subido en los archivos complementarios de los bots de la Tienda GPT, los titulares de derechos de autor preocupados por las infracciones tienen que confiar en que los sistemas automatizados de OpenAI están detectando las infracciones o adoptar el pesado enfoque de investigar cada bot sospechoso individualmente.
Según afirma Blichfeldt Andersen, “Es como encontrar una aguja en un pajar”.