Visione 99
loading...

Hackerare l’Intelligenza Artificiale è possibile?

250 file manipolati sono sufficienti per sabotare il processo educativo di un’IA come ChatGPT ed hackerarne  l’intelligenza artificiale. 

 

Attacchi. Gli hacker possono inserire errori sistematici, o elementi nascosti molto difficili da individuare, per sabotare il processo educativo di una macchina IA, spingendola ad apprendere nozioni sbagliate o a comportarsi contro la sua stessa logica. Bastano 250 file manipolati ad essere sufficienti a sabotare il processo educativo di un’IA come ChatGPT ed hackerarne  l’intelligenza artificiale.

 

Perché gli hacker hanno successo?

 

Trovare un varco. Molti sistemi informatici, applicazioni e reti non sono perfetti. Spesso presentano vulnerabilità che gli hacker possono sfruttare per ottenere accesso non autorizzato. Questi punti deboli possono essere dovuti a vari fattori: bug nel software, cioè errori di programmazione che lasciano aperte delle “porte” agli attacchi; aggiornamenti non eseguiti, dove i sistemi diventano più vulnerabili agli attacchi, perché gli hacker sfruttano le falle conosciute nei software non aggiornati; malconfigurazioni, perchè aziende o persone non configurano correttamente i loro sistemi di sicurezza.

 

Tecniche sociali. Usano spesso tecniche di social engineering, cioè manipolano le persone per ottenere informazioni sensibili o accedere a sistemi. Esempi comuni includono il Phishing, il Pretexting (creare una falsa identità per convincere qualcuno a rivelare informazioni riservate), il Tailgating (ottenere un accesso fisico entrando in un’area sicura approfittando della cortesia di qualcuno). Gli hacker infatti, sfruttano la psicologia umana. Le persone tendono a fidarsi o a essere ingannate da stimoli emotivi, come l’urgenza, la paura o la curiosità.

 

Condivisione. Alcuni attacchi poi non richiedono capacità particolarmente avanzate. Ad esempio, ci sono script o strumenti preconfezionati (spesso accessibili anche online) che gli hacker possono usare per eseguire attacchi come il brute force (tentativi di indovinare le password) o il DDoS (Distributed Denial of Service, che sovraccarica un sito web e lo rende inutilizzabile). Gli hacker più esperti, possono avere accesso a una vasta gamma di risorse e conoscenze. Grazie a forum, darknet, o altre reti di scambio, possono imparare nuove tecniche e ottenere strumenti che li aiutano nei loro attacchi. In alcuni casi, si uniscono in gruppi o “community” dove condividono vulnerabilità e strumenti.

 

Quindi l’IA può essere avvelenata?

 

L’IA può essere avvelenata. L’intelligenza artificiale, può essere avvelenata: il poisoning, sta iniziando ad assumere un significato nell’ambito dell’IA: lo UK AI Security Institute, l’Alan Turing Institute e la società Anthropic hanno dimostrato che bastano 250 file manipolati all’interno dei milioni usati per istruire un modello linguistico come ChatGPT, per comprometterlo in modo invisibile.

 
I sistemi più usati.

 

Backdoor. E’ la forma più diffusa di attacco, che inserisce nel modello una sorta di comando segreto: durante l’addestramento, vengono introdotti esempi apparentemente innocui che contengono una parola rara o sequenze di simboli. In presenza di quel codice, il modello reagisce in modo anomalo, per esempio, generando informazioni false. Chi conosce il codice può attivare il comportamento nascosto in modo impercettibile, anche tramite un semplice post sui social o una pagina web che interagisce automaticamente con l’IA.

Topic steering. E’ l’inquinamento dei dati con enormi quantità di contenuti faziosi o errati. Un attacco di questo tipo potrebbe far credere al modello che “mangiare farro curi il cancro”, solo perché ha acquisito migliaia di pagine online che lo affermano come se fosse vero. E bastano quantità minime di dati falsi: lo studio ha dimostrato che alterare appena lo 0,001% delle parole di un dataset può bastare a rendere un modello più incline a diffondere disinformazione medica.

 
Le conseguenze.

Le conseguenze dell’hackeraggio dati sono potenzialmente enormi. Un modello compromesso può diffondere notizie false, generare contenuti manipolati o creare disinformazione di massa. Nel 2023, OpenAI ha dovuto sospendere temporaneamente ChatGPT per un bug che aveva esposto i titoli delle chat e alcuni dati privati.

 
Ma l’IA è sempre da difendere?

Forse No. Alcuni artisti  hanno caricato online immagini modificate in modo impercettibile, facendo sì che le IA che le “rubano” producano risultati distorti e inutilizzabili. È una forma di sabotaggio al contrario, che trasforma la vulnerabilità in protezione, e che dimostra come, dietro la potenza apparente dell’IA, si nascondano grandi fragilità strutturali.

 
Il futuro che ci aspetta… è già qui.
VIEW
CLOSE