[gl-como] Programmazione da AI e software libero

Giacomo Tesio giacomo@tesio.it
Mar 23 Apr 2024 20:56:48 CEST


Il 23 Aprile 2024 16:17:10 CEST, Alessandro Lorenzi <alorenzi@alorenzi.eu> ha scritto:
> Halloooo, 
> Uso github copilot da due anni circa, quando era ancora in beta. [...] mi aiuta molto.

Io l'ho visto usare a colleghi più giovani in peer programming, ed in più di un'occasione
il tempo richiesto per il refactoring/debug del output è stato maggiore del tempo
necessario a scrivere il codice da zero (sapendo cosa scrivere).

I colleghi in questione tendevano a fidarsi troppo dei "suggerimenti" e soprattutto non imparavano
dagli errori del software (forse perché non li vivevano come loro errori?)
Non solo: in un caso ho provato a far notare al collega i problemi che avevamo osservato
durante la sessione di pp, ottenendo una reazione piuttosto piccata, come se avessi messo
in discussione la sua competenza invece di quella di Copilot.

L'esperienza fin'ora mi ha lasciato un senso di diffidenza nei confronti del codice committato
da chi lo usa (cui corrispondono review più lunghe, meticolose, faticose e nettamente più costose
per l'azienda).

Riflettendoci, potrebbe anche aver senso tenerne conto in fase di colloquio:
a parità degli altri fattori, chi non necessita di LLM per scrivere il proprio codice 
ha probabilmente prospettive di crescita maggiori.


> > *Copyright concerns.* At this point, the regulations concerning copyright of 
> generated contents are still emerging worldwide.
> Using such material could pose a danger of copyright violations, but it could also
> weaken Gentoo claims to copyright and void the guarantees given by copyleft licensing.
> 
> Si, allora non guardare il codice di altri, non guardare stack overflow. 
> Il livello é piú o meno quello.

Il codice su stack overflow è sotto cc by-sa ed in effetti non puoi copiarlo legalmente in un progetto
distribuito con una licenza incompatibile (soprattutto in Europa, dove non esiste il fair-use)

<https://meta.stackexchange.com/questions/12527/do-i-have-to-worry-about-copyright-issues-for-code-posted-on-stack-overflow>

Detto questo, puoi ovviamente imparare dal codice altrui cui hai accesso legalmente ed applicare
autonomamente ciò che impari.


Nonostante la terminologia antropomorfa, i LLM non imparano alcunché: sono software
programmati statisticamente a partire da testi di cui sono letteralmente la compilazione binaria
per una macchina virtuale progettata allo scopo.

Puoi considerare i LLM come archivi compressi e variamente danneggiati dei testi sorgente,
tant'è che Copilot sputa spesso fuori (aka distribuisce) sorgenti coperti da Copyright 
con attribuzione e licenza sbagliata.

Ben noto il caso di Quake III Arena
<https://peertube.opencloud.lu/w/eW497u3UYXmQwcQu9LYEDR>


Distribuire opere altrui violandone la licenza e attribuendole ad altri è un reato in
molti stati (fra cui l'Italia) così come violarne la licenza copyleft per includerli in software
proprietario.

Microsoft conta di farla franca più per gli interessi militari che incarna che
per la favola dell'intelligenza artificiale.

Tuttavia è solo questione di tempo prima che il problema esploda e le aziende maggiori
si stanmo già assicurando che i dipendenti evitino questi strumenti (Toyota è stata
una delle prime)

Nella nostra (ambito finanza) la questione è in mano agli avvocati da un paio di mesi.


> > *Ethical concerns.* The business side of AI boom is creating serious ethical concerns. Among them:
> >  • Commercial AI projects are frequently indulging in blatant copyright violations to train their models.
>  * 
> Ok, mi stai ripetendo quanto detto al punto 1

Sì, ma da una prospettiva diversa: al di là dei rischi legali (di natura penale) c'è un
problema etico: stai rubando il lavoro di altri sviluppatori che hanno espressamente 
donato quel software con una licenza copyleft.

Magari non ti beccheranno mai, ma se lo fai, rimani uno stronzo. LLM o meno.


Giacomo


Maggiori informazioni sulla lista gl-como