• SPR Informa
  • SPR Informa
  • SPR Informa
  • SPR Informa
  • SPR Informa
  • https://www.sprinforma.mx/noticia/datos-e-inteligencia-artificial-hacia-una-nueva-practica-de-explotacion
  • 30 May 2024
  • 10:05
  • SPR Informa 6 min

Datos e Inteligencia Artificial: hacia una nueva práctica de explotación

Datos e Inteligencia Artificial: hacia una nueva práctica de explotación

Por Ernesto Ángeles .

Una de las notas tecnológicas más controversiales del momento es que Facebook e Instagram actualizaron la configuración de sus plataformas, entre los nuevos cambios está que el usuario acepta de manera predeterminada que el contenido creado o subido pueda ser usado en el entrenamiento de proyectos de inteligencia artificial (IA), aunque cabe señalar que existe la forma de oponerse a tal entrenamiento; sin embargo, no es algo que se anuncie ni promocione. 

Lo anterior se revela significativo debido al tamaño y tipo de empresa que es Meta, cuyas plataformas tienen miles de millones de usuarios a nivel mundial, lo que ha generado, entre otras cosas, que sus productos o cooperación empresarial se hayan vuelto relevantes y, en algunos casos cruciales; por lo que cualquier cosa que haga esta empresa puede tener repercusiones para el mercado en general. 

No obstante, no sorprende nada que esta empresa quiera que los usuarios les den datos gratuitos para explotarlos, no sólo por la mala fama de Mark Zuckerberg y Facebook, sino porque en el último año varias empresas más han actualizado sus términos, condiciones, configuraciones y funcionamiento en torno a la extracción, recabo, resguardo y uso de los datos de quienes usan sus productos, ahora con un nuevo fin: alimentar modelos de IA, a esta tendencia se han sumado empresas como Reddit, Google, Zoom o X. 

Al día de hoy los datos no sólo transitan libremente las fronteras y se alojan en paraísos fiscales fuera de la jurisdicción y soberanía de los países, sino que también son apropiados, explotados y vendidos intensivamente y a escala masiva; con la diferencia que ahora los datos no sólo sirven para alimentar a un modelo de negocios basado en la publicidad, sino que también son usados en un modelo de negocio que depende de que modelos de IA puedan alimentarse con ellos y así generar respuestas que deben su creación a los datos originales.

Todo lo anterior sucede sin ninguna retribución o reconocimiento a las instancias creadoras, las cuales no sólo abarcan a individuos, sino a empresas, países y todo actor que mantenga sus datos en internet o custodiados por algunas plataformas, tal como Google, TikTok, Reddit, X, Zoom o, más recientemente, Meta e Instagram.

Debido a la fama que rápidamente ganó la IA generativa como el camino a seguir en el desarrollo de esta tecnología, tal como con GPT, los elementos que conforman la IA también aumentaron su valuación, tal es el caso de la mano de obra, la capacidad de computo y los datos; sin embargo, en este último caso el cambio consistió en que la demanda aumentó, mientras las empresas empezaron a hacer escaso este bien, ya sea por medio de barreras técnicas o legales, aunque la producción de datos mantiene su explotada situación. 

Lo anterior se suma a que en diversos sectores de IA existe la creencia que considera que con más datos que sea alimente a la IA, más capaz/poderosa se volverá, al punto de alcanzar la “super inteligencia”, algo que no suena plausible, entre otras cosas debido a que:

  1. La calidad y tipos de datos no son los mismos, debido a que es imposible verificar todos los datos con los que se alimenta una IA manualmente, por lo que muchos datos de pobre calidad (engañosos, falsos, ilegales, dañados, etc.) alimentan a los grandes modelos, especialmente aquellos construidos con datos de internet; así lo demostró recientemente Google, los cuales aceptaron que son incapaces de evitar que su modelo de IA responda con “alucinaciones” y otras respuestas incorrectas o inexactas que, en el peor de los casos, pueden resultar en la muerte o daño de quienes sigan sus consejos. 
  2. Es improbable que la conciencia emerja sólo de la relación de inmensas cantidades de datos en medio de dispositivos construidos de metal, plástico y silicio. 

 

Más allá de la plausibilidad que más datos signifiquen más inteligencia, actualmente las empresas han desatado una competencia encarnizada y depredadora hacia a los datos, ya sean abiertos o privados; aunque, es necesario recordar que no todas las empresas empiezan con las mismas condiciones, ya que durante años las grandes plataformas han monopolizado la actividad de los usuarios y la han explotado; por lo que no sólo cuentan con experiencia, negocios y estructuras técnicas afines, sino también con una inmensa cantidad de datos de años anteriores. 

Ante este escenario cabría preguntarse si todo el entramado institucional y legal de protección de datos personales y públicos en México sigue respondiendo a los retos que se le presentan, ya que este modelo e instituciones responden (deficientemente, pero lo hacen) al enfoque basado en publicidad por datos y no al modelo de explotación de datos para IA.

Asimismo, se debe poner un orden al mercado de datos, ya que contrario a lo que se cree, no sólo los grandes actores ejercen prácticas abusivas, sino que las pequeñas y medianas empresas de datos suelen abusar de usuarios y consumidores por igual; por ejemplo, piénsese en el caso de productos electrónicos conectados a internet: cámaras, pantallas, electrodomésticos, equipos personales; en fin, toda una gama de dispositivos que recaban datos masivamente, los cuales ahora tendrán un nuevo uso comercial: entrenar a la IA.  

Ante esto surgen preguntas como:

¿En serio estamos preparados para esta nueva tecnología? En caso contrario, ¿cómo prepararnos? ¿Qué se debe priorizar? ¿Qué rol debe asumir el Estado? ¿Cuál es el interés del Estado hacia esta tecnología y cómo piensa relacionarse con ella y usarla?