Nuevamente, aparece la Inteligencia Artificial (IA) en el eje de la crítica, en este caso por usuarios de GitHub. Allí, la mirada está puesta sobre la compañía Microsoft por entrenar a una herramienta de IA con su código. Al parecer, “Copilot” fue entrenado utilizando miles de millones de líneas de código abierto que se encuentran en diferentes sitios, y uno de ellos es GitHub. Por esta situación, los codificadores de código abierto vienen analizando realizar una demanda colectiva contra la firma por entrenar a la herramienta de IA.
Se ha generado un sitio web para encabezar la investigación sobre la compañía. Matthew Butterick, programador y abogado, se encuentra reuniendo a un equipo litigante de demanda colectiva. Con el mismo, se espera que se pueda encabezar una demanda contra esta herramienta en cuestión, llamada GitHub Copilot. Muchas han sido las sospechas hacia Microsoft, tras el lanzamiento de Copilot, luego que comprara la plataforma de codificación colaborativa en 2018.
GitHub y todo un conflicto por delante
La herramienta se presentó como una extensión para el entorno de codificación Visual Studio de Microsoft. La misma utiliza algoritmos de predicción para autocompletar líneas de código. Para ello, se ha venido usando el modelo de IA llamado Codex. El mismo ha sido creado y entrenado por OpenAI, empleando datos extraídos del repositorio de códigos en la web abierta.
Microsoft declaró que la herramienta fue “entrenada en decenas de millones de repositorios públicos” de códigos, dentro de los cuales se encuentran GitHub. La empresa cree que estamos en una “instancia de uso justo transformador”. En este punto, obviamente, son varios los codificadores de código abierto que no están de acuerdo con esta relación.
Butterick expresó en su web que:
“Al igual que Neo conectado a Matrix, o una vaca en una granja, Copilot quiere convertirnos en nada más que productores de un recurso para extraer”.
El programador y abogado siguió ampliando su visión comentando que “incluso las vacas obtienen comida y refugio del trato. Copilot no aporta nada a nuestros proyectos individuales. Y nada para abrir el código ampliamente”.
Las miradas de otros programadores
Cada vez más los programadores han notado que Copilot parece copiar su código en las salidas resultantes. Desde Twitter, los usuarios de código abierto se han manifestado dejando documentación de ejemplos de software. En los mismos, se pueden observar las líneas de código que son sorprendentemente similares a las que pueden apreciarse en sus propios repositorios.
GitHub debía salir a dar declaraciones al respecto, allí se planteó que los datos de capacitación tomados de los repositorios públicos “no están destinados a ser incluidos textualmente en los resultados del Codex”. En el informe de análisis que compartió la plataforma se afirmó que “la gran mayoría de los resultados(>99%) no coinciden con los datos de capacitación”.
Por su parte, desde Microsoft, se ha puesto la responsabilidad legal en el usuario final para garantizar que el código que Copilot envía no viola ninguna ley de propiedad intelectual. Butterick entiende que toda esta situación es una cortina de humo y que GitHub Copilot, en la práctica, es una interfaz egoísta que secuestra su experiencia sin ofrecer nada a cambio.