miércoles, 23 de octubre de 2024

Las empresas de IA están traspasando límites en el uso de contenidos con derechos de autor

El buscador Perplexity -entre otros- basado en IA, lleva meses utilizando todo tipo de técnicas para obtener datos con los que entrenar su modelo. Los editores de The Wall Street Journal y New York Post ya la han demandado por violación de copyright.

Dicen que el fin justifica los medios. La cita, atribuida sobre todo a Maquiavelo, podría muy bien atribuírsela una compañía muy de moda últimamente: Perplexity. El buscador basado en IA de la firma se ha convertido en, quizás, una pista de lo que puede ser el futuro de los buscadores tradicionales. Sus prestaciones son notables, pero hay un problema: la industria empieza a cansarse de los métodos que está usando para lograrlas.

Dos importantes grupos editoriales han demandado a Perplexity. La acusan de presumir de que gracias a ella los usuarios pueden evitar los enlaces a las publicaciones originales. O lo que es lo mismo: alguien está usando sus contenidos, pero sin generar tráfico hacia esas publicaciones.

En la demanda se indica que Perplexity copia ilegal y masivamente obras protegidas por los derechos de autor de los editores, "desviando clientes e ingresos críticos de los propietarios de esos derechos".

Dow Jones y el New York Post enviaron un comunicado a Perplexity en julio de 2024 avisando de la situación y cómo ambas entidades podrían emprender acciones legales. Incluso propusieron llegar a un acuerdo para licenciar sus contenidos y así colaborar de forma adecuada, pero Perplexity ni se molestó en contestar.

The New York Times envió a Perplexity una carta de desistimiento para que dejaran de usar el contenido de ese periódico para alimentar su modelo de inteligencia artificial. El Times ya demandó a Microsoft y a OpenAI por violación de copyright, y acusó a estas empresas de usar millones de sus artículos para entrenar modelos de IA.

En la demanda se exige el pago de daños y perjuicios, con multas de 150.000 dólares por infracción, "incluida cada copia digital no autorizada u otro contenido derivado de las obras protegidas por derechos de autor", reza el texto.

Otras empresas licencian, Perplexity no

Son varias las empresas de IA que han llegado a acuerdos para licenciar contenidos de grupos editoriales. OpenAI lo hizo, por ejemplo, hace unos meses con el Grupo Prisa, y semanas después llegó a otro con News Corp por valor de 250 millones de dólares para licenciar sus contenidos durante cinco años.

Perplexity sigue tensando la cuerda y puede que acabe rompiéndola. Las empresas de IA necesitan más y más contenido, y últimamente ha quedado claro que todas ellas están recolectando todo lo que publiquemos en internet.

Ahí el problema está en dónde lo publicamos -Reddit ha licenciado esos contenidos a empresas como Google-, pero la cosa se complica cuando hablamos de contenidos protegidos por derechos de autor como los de los medios citados o de obras literarias de todo tipo.

Que Perplexity y otras empresas estén utilizando dicho contenido es especialmente preocupante, y queda por ver si la justicia acaba resolviendo el problema.

(Fuente: Xataka)