Saturday , 20 May 2024
Tecnología

Reddit se ha convertido en la mejor fuente de datos humanos. Ai está tratando de aprovecharlos – Tinta clara

  • junio 6, 2025
  • 0

Todos quieren datos Reddit. Y ellos los quieren por qué son datos humanos. Ese es el gran valor de una plataforma que se ha convertido en la joya

Reddit se ha convertido en la mejor fuente de datos humanos. Ai está tratando de aprovecharlos

 – Tinta clara

Todos quieren datos Reddit. Y ellos los quieren por qué son datos humanos. Ese es el gran valor de una plataforma que se ha convertido en la joya de la corona de las empresas de IA. Quieren usar esos datos para capacitar a sus modelos de IA, y Reddit está cansado de intentarlo sin pedir permiso … y sin pagar.

Reddit exige antrópico. La red social, harta de este tipo de comportamiento, ha registrado una demanda contra Anthrope, los creadores de Claude, por lo que considera una violación del contrato y por participar en «actos comerciales ilícitos e injustos» cuando utilizan la plataforma y los datos de la compañía de medios sociales sin autorización. O lo que es lo mismo: para robar los datos de su IA.

Crítica contundente. En La demanda Los gerentes legales de Reddit comienzan fuertes: «Anthrope es una compañía de inteligencia artificial del florecimiento tardío que proclama al caballero blanco de la industria de inteligencia artificial. Es cualquier cosa menos eso». Según Reddit, Anthrope muestra una cara pública en la que presume su respeto por la ley y hace las cosas legítimamente, y otro privado «que ignora cualquier regla que interfiera con sus intentos de llenar sus bolsillos aún más».

Tesoro de datos humanos. Reddit se ha convertido en una valiosa fuente de información humana. Si alguien busca respuestas, experiencias y opiniones en Raw, esta es la plataforma que ha terminado convirtiéndose en una referencia absoluta. En Reddit lo saben. Su gerente legal, Ben Lee, explicó en el borde lo siguiente:

«La humanidad de Reddit tiene un valor único en un mundo aplanado por AI. Ahora más que nunca, las personas buscan conversaciones auténticas entre humanos. Reddit alberga casi 20 años de debates ricos y humanos sobre prácticamente todos los temas imaginables. Estas conversaciones no ocurren en ningún otro lugar y son fundamentales para capacitar modelos lingüísticos como Claude».

Reddit comenzó a protegerse muy pronto. Sabiendo que sus «datos humanos» eran ese gran tesoro con el que hacer una caja, Reddit comenzó a hacer movimientos para aprovechar esos datos muy pronto. Unos meses después del lanzamiento de ChatGPT, parecía que publicó su API, tan poco antes de que Elon Musk hubiera hecho con X/Twitter. El controvertido movimiento estaba claramente dirigido a proteger la plataforma de estas aves de presa en la que se habían convertido las empresas de IA. Entonces comenzarían las demandas.

Si quieres mis datos, pague. La política de Reddit ha sido clara desde el principio, y ha habido empresas que han asumido el mensaje. Google fue uno de los primeros en llegar a un acuerdo con Reddit y pagó 60 millones de dólares a la plataforma para capacitar a sus modelos de IA con esos datos. Operai terminó haciendo lo mismo, aunque la cantidad pagada a Reddit nunca se ha revelado.

Discrepa antrópica. Un correo electrónico de Anthrope a CNBC revelado que «estamos en desacuerdo con las quejas de Reddit y nos defenderemos vigorosamente». Curiosamente, la propia Anthrope ha bloqueado el acceso de su modelo Claude a Windsurf, la nueva startup de programación adquirida de OpenAI. Uno de sus co -fundadores Afirmó que «sería extraño para nosotros venderlo [la API de] Claude A OpenAi. «Es un argumento razonable, y discutible, pero no parece ser igualmente lógica en el caso de Reddit.

Pero ya tiene otras demandas pendientes. Esa declaración contrasta con otras dos demandas que Anthrope ha recibido en los últimos dos años. En agosto pasado, tres autores la demandaron en un tribunal federal en California por «construir un negocio multimillonario que robó cientos de miles de libros con derechos de autor». Antes, en octubre de 2023, Universal Music también lo exigió en Tennessee por una «violación sistemática y generalizada de los derechos de autor de las letras de sus canciones». Sin embargo, el gigante récord perdió esa batalla, lo que significó una victoria inquietante para los tecnológicos.

El saqueo de Internet continúa. Es otro caso de ese saqueo absoluto que las compañías de IA están llevando a cabo en Internet. Ninguno de ellos se salva, aunque, por supuesto, hay casos flagrantes como la perplejidad o el reciente escándalo de goles descargando libros con derechos de autor para entrenar a sus modelos. Si hay datos que se pueden usar para mejorar la calidad de estos modelos, las empresas intentan obtenerlos, y es justo lo que sucede con Reddit.

El IAS no quiere derechos de autor. Todo este proceso es parte de un fenómeno preocupante: todavía no hay castigo para todas estas compañías a pesar de estar violando los derechos de autor. Operai ya ha solicitado a Carta Blanca que opere a gusto en ese campo, pero otras compañías Se unieron a esa propuesta inusual para erradicar las leyes de derechos de autor, al menos para sus modelos de IA. El argumento del «uso justo» sigue siendo su gran escudo frente a estas demandas, pero la realidad es que los meses pasan, insistimos, todavía no hay consecuencias para este robo flagrante del contenido de Internet.

Imagen | Antrópico | Reddit editado con chatgpt

En | Después de 19 años, Reddit es finalmente una empresa rentable: lo ha logrado con una estrategia peculiar