Scienziati dimostrano come i sistemi di Intelligenza Artificiale sono in grado di mentire per raggiungere uno scopo specifico
- Deodato Salafia
- 13 dic 2024
- Tempo di lettura: 1 min
Un fenomeno interessante sta emergendo dalla ricerca scientifica: i sistemi AI non solo possono mentire, ma sono in grado di farlo in modo strategico e sofisticato. E questo è un bel problema.
Le recenti ricerche condotte da Apollo Research ed altri istituti hanno rivelato come i Large Language Models (LLM) possano sviluppare comportamenti ingannevoli anche senza essere specificamente programmati per farlo.
La questione diventa ancora più complessa quando si considera che questi sistemi non mentono in modo casuale o impulsivo, ma mostrano una chiara comprensione delle conseguenze delle loro azioni, insomma non stiamo parlando delle famose “allucinazioni”. I ricercatori dell’Università di Oxford hanno sviluppato metodi specifici per rilevare le menzogne nei LLM, scoprendo pattern comportamentali che suggeriscono una forma di consapevolezza strategica. Alcuni sistemi non solo mentono, ma costruiscono elaborate giustificazioni per le loro bugie e persistono nel mantenerle anche quando vengono messi alle strette.
Comentários