OpenAI eliminó por error datos que podrían haber sido cruciales como evidencia en la demanda por derechos de autor presentada por The New York Times y Daily News, según revelaron los abogados de ambos medios.
Los ingenieros de OpenAI borraron accidentalmente información de búsqueda almacenada en una de las máquinas virtuales proporcionadas a los demandantes para investigar el uso no autorizado de su contenido en el entrenamiento de modelos de IA.
Los abogados de los medios indicaron que ellos y sus expertos invirtieron más de 150 horas desde el 1 de noviembre examinando los datos de entrenamiento de OpenAI. El incidente ocurrió el 14 de noviembre, cuando se perdió la estructura de carpetas y nombres de archivos de manera irrecuperable.
Aunque OpenAI logró recuperar gran parte de la información, los datos restaurados resultaron inutilizables para determinar dónde se emplearon los artículos copiados en el desarrollo de sus modelos. Como consecuencia, los demandantes se vieron obligados a rehacer completamente el trabajo de una semana.
Los representantes legales aclararon que no hay indicios de que la eliminación haya sido intencional. Sin embargo, señalaron que este incidente demuestra que OpenAI está mejor posicionada para buscar contenido potencialmente infractor en sus propios conjuntos de datos.
La empresa de IA ha mantenido que el entrenamiento de sus modelos con datos públicamente disponibles constituye "uso justo" bajo la ley. No obstante, recientemente ha firmado acuerdos de licencia con varios medios importantes como Associated Press y Axel Springer, aunque los términos permanecen confidenciales.
Hasta el momento, OpenAI no ha confirmado ni negado específicamente el uso de obras protegidas por derechos de autor sin autorización en el entrenamiento de sus sistemas de IA. La compañía declinó hacer comentarios sobre este incidente en particular.