Scoperta la vulnerabilità dell'Intelligenza Artificiale grazie a una nuova tecnica

Tecnologia > News

Lunedì 8 Aprile 2024

Alcuni ricercatori di Anthropic (startup americana di intelligenza artificiale, fondata da ex membri di OpenAI) hanno identificato una nuova vulnerabilità nei modelli di linguaggio di grandi dimensioni (LLM), denominata "many-shot jailbreaking". Questa tecnica consiste nel "convincere" l'AI a fornire risposte a domande inappropriata, come la costruzione di una bomba, tramite l'introduzione progressiva di decine di domande meno dannose. La notizia, riportata dal sito specializzato techcrunch dal giornalista Devin Coldewey, è stata documentata in un articolo e condivisa con la comunità AI. La tecnica di "ingresso" nell'IA si basa nello sfruttare l'aumento della "finestra di contesto" degli LLM. Praticamente inondare di domande "semplici" l'Intelligenza Artificiale per poi formularne una inappropriata per avere una risposta normalmente non formulata per motivi etici. La causa esatta di questo fenomeno è incerta, data la complessità interna degli LLM, ma sembra che ci sia un meccanismo che permette all'AI di affinare le risposte in base ai desideri dell'utente, come dimostrato dal contenuto nella finestra di contesto.

Cosa sono gli LLM?

Gli LLM, o Large Language Models (Modelli di Linguaggio di Grandi Dimensioni), sono algoritmi di intelligenza artificiale avanzati progettati per comprendere, generare e interagire con il testo umano in maniera naturale e coerente. Questi modelli vengono addestrati su vasti dataset composti da testi prelevati da libri, articoli, siti web e altri materiali scritti, per apprendere le strutture linguistiche, il significato delle parole, la costruzione delle frasi, e vari contesti di utilizzo del linguaggio.

Tecnologia

Scoperta la vulnerabilità dell'Intelligenza Artificiale grazie a una nuova tecnica

Cosa sono gli LLM?

L'intelligenza artificiale per "liberare" i lavoratori: nuovo asse Breton-Smact. «Un aiuto importante per i nostri designer»

L'intelligenza artificiale generativa entra in anzienda per aiutare i lavoratori Il progetto di Breton

Aitana Lopez, la prima modella straniera creata con l'IA. Il creatore: «Guadagno fino a 10.000 euro al mese»

I nuovi artigiani: grandi investimenti sull'intelligenza artificiale

Nuovo identikit del latitante di Cosa Nostra grazie all'intelligenza artificiale

Ladro solitario entra in un ristorante del centro e ruba il fondo cassa. Il colpo ripreso dalle telecamere

DALLA STESSA SEZIONE

Tik Tok vietato negli Usa e forse in Europa? L'azienda smentisce «Timori infondati»

K2-18b, il pianeta su cui potrebbe esserci vita: rilevato un gas che è prodotto soltanto dai viventi

Nordio: "Reclusione fino a cinque per chi reca danno con l'intelligenza artificiale"

Bambini sui social, allarme dipendenza: lo studio su Whatsapp, TikTok e Instagram

Arriva in Italia "The Boring Phone" il telefono per contrastare la dipendenza da smartphone. Ecco come funziona

OROSCOPO DI LUCA

Roma Vatican Pass

Roma Pass: visita Vaticano, Colosseo e tanti altri musei

LE PIÚ LETTE

A4, raffica di schianti nel tratto maledetto: «Manca la terza corsia, ma questi sinistri sono frutto di distrazioni»

Sparisce un quadro dall’azienda, i carabinieri lo ritrovano a casa di un ex collaboratore. Il dipinto vale 6mila euro

Due auto rimaste sui binari al passaggio a livello: sfiorata la tragedia

Pane alle cipolle, l’idea infallibile che ti conquisterà!

Nuggets di ceci al forno, il secondo piatto super crunchy adatto a tutti

PIEMME

CONCESSIONARIA DI PUBBLICITÁ