AI ha problemi con le mani. Ora che l’ha riparato, siamo nei guai

Donald Trump è a terra, in ginocchio, aggredito dalla polizia. Foto sbagliata- come è stato ampiamente documentato – Tuttavia fotorealismo di questo piano, generato daintelligenza artificialeingannare un sacco di gente.

Lo scatto falso di Trump in attesa non sarà il primo – e nemmeno l’ultimo – per metterci in crisi. Ma finora, per fortuna, l’intelligenza artificiale che genera questo tipo di immagine è possibile Via di mezzo ma anche Trasmissione stabile OH Dall-Mi 2 – Io ho punto debole molto preciso: le mani.

Una serie di immagini, diventate virali lo scorso gennaio, evidenziare il problema. Miles Zimmerman, un programmatore di San Francisco, ha utilizzato Midjourney per creare una ripresa di una festa mai avvenuta, con persone completamente truccate. Ma nessuno (o quasi) dubiterebbe a prima vista della veridicità della foto, se non per le mani donne rappresentate. Uno di loro ha almeno dieci dita. Altri, invece, ne hanno cinque ma di lunghezza soprannaturale.

Questo colpo è attivato commenti ironici tra gli utenti di Twitter. E hanno convinto, in un certo senso, chi aveva già previsto un mondo inghiottito dai deepfakeUn’immagine generata dall’intelligenza artificiale in cui, ad esempio, il volto di una persona viene sostituito senza soluzione di continuità dal volto di un’altra persona.

Generalmente, Le immagini generate dall’intelligenza artificiale sembrano coerenti e hanno un senso. Ma molte volte, quando si guarda più in profondità e si rivolge l’attenzione agli elementi sullo sfondo o attorno al soggetto principale, si scopre che questi appaiono distorti e distorti.

Lo si evince dalla foto fake in cui Trump è stato “arrestato”. Scrittore di immagini, giornalista – e fondatore di Bellingcat – Eliot Higginslo ha mostrato con un tweet molto maleducato, rimprovera una certa “stupidità” a chi interpreta il colpo come vero: basta guardare i simboli antisommossa sulle divise della polizia, ma anche (e soprattutto) le due mani che compaiono tra gli agenti, che hanno pochissimi esseri umani.

A metà dell’IA (e simili) viene addestrata miliardi di immagini e le relative descrizioni testuali. L’algoritmo sa così che la parola “astronauta” corrisponde all’immagine di un uomo o di una donna che indossa una tuta spaziale e un casco. Quindi, quando un utente, utilizzando un’interfaccia simile a un gatto, chiede all’IA di generare una nuova immagine che preveda la posizione di un astronauta, il software cercherà le immagini relative a quella descrizione. E di forma casualeavvicinarsi alla query dell’utente il più vicino possibile attraverso perfezionamenti che coinvolgono più iterazioni, ad es. passaggio finale che aumenta la precisione e la qualità dell’immagine finale.

L’abbiamo visto questo processo è magicoa vincere concorsi artistici e scuotere fotografi, designer e illustratori, il cui lavoro è improvvisamente in pericolo.

Un’opera creata dall’intelligenza artificiale ha vinto un concorso artistico. Ma per molti è una truffa

Ma AI, così brava a tirar fuori i volti umani, così unica e piena di espressione e particolarità, ha seri problemi alle mani. Perché?

Un reporter di BuzzFeed ha chiesto a Stability AIlancio dell’azienda nell’agosto 2022 Trasmissione stabileuna delle IA testo all’immagine più forte lì. Un portavoce dell’azienda ha risposto che “nella mole di dati a disposizione dell’IA, è universalmente noto che le mani sono più visibili dei volti. E che, inoltre, è molto più piccolo nell’immagine originale. Pertanto, l’algoritmo ha più difficoltà ad apprenderlo e replicarlo.

Tecnologia italiana gestita stessa domanda per ChatGptpopolare intelligenza artificiale sviluppato da IA aperta, e le risposte erano molto simili: “È vero che anche il volto umano ha molte caratteristiche uniche, come proporzioni facciali, espressioni facciali, rughe, capelli, ecc. Tuttavia, l’intelligenza artificiale sembra avere meno problemi a creare volti umani rispetto alle mani perché i volti umani condividono caratteristiche comuni che li rendono più facili da generare. Ad esempio, la simmetria del volto umano rende facile per gli algoritmi di imaging creare immagini facciali realistiche, perché i due lati del viso sono generalmente molto simili. Inoltre, ci sono molte più immagini di volti umani disponibili che mani, il che significa che l’algoritmo di generazione delle immagini ha più esempi da cui imparare.

Ciò che ChatGpt “afferma” ha una sua logica e, cosa più importante avere un fondamento di verità. Più dati ha un algoritmo, più è intelligente. E per quanto riguarda il volto, è vero che esso è più facilmente associato a un certo “pattern”, cioè un pattern rilevanti che compongono il pattern: la disposizione degli occhi, per esempio, o del naso o della bocca.

Dopotutto, si basa su questi modelli uno dei primi sistemi di riconoscimento facciale basati sull’intelligenza artificialeè stato sviluppato a metà degli anni ’90 dal Dipartimento della Difesa degli Stati Uniti utilizzando migliaia di foto dei suoi dipendenti.

In breve, finora ha è relativamente facile smascherare un’immagine generata dall’intelligenza artificiale, anche se credibile: basta guardare la mano, contare le dita e controllarne la forma. In circolazione un’altra foto fake di Trump, bloccato da due agenti, in cui un terzo poliziotto mette la mano sulla mano sinistra dell’ex presidente americano: beh, quella mano di quel poliziotto è qualcosa di strano, non sembra avere un indice.

Tuttavia anche questi difetti sono destinati a scomparire. Anzi, nella maggior parte dei casi, sembrano essere scomparsi.

L’ultimo aggiornamento da Via di mezzo, è successo il 16 marzo sembra aver risolto il problema della mano e delle dita. Un utente di Twitter, Zein Khan, sottolineato da due figure come può essere generata una nuova versione dell’IA mani fidate: Le ragazze nella foto sono state scoperte dall’IA e hanno esattamente cinque dita. Cinque, lo stesso numero che identifica l’aggiornamento di Midjourney.

I progressi dell’IA sono evidenziati anche dai giovani utenti di Midjourney intervistato dal Washington PostAidan Ragan, 19 anni, che ha paragonato la mano generata da Midjourney v4 (a sinistra, nel tweet sotto) alla mano realizzata dopo l’ultimo aggiornamento (a destra, nello stesso tweet).

La differenza è netta. Ragan dice di aver perso le sue vecchie “imperfezioni”, che secondo lui sono il risultato di un miracolo interpretazione artistica dell’IA. “Ora però il modello sembra molto rigido – ha detto il programmatore – tutto è più robotico, ridotto a uno strumento”.

“Prima di sistemare questi dettagli – il Hany Farid, professore di informatica forense, dell’Università della California – l’utente medio si conta le dita e arriva alla conclusione che forse una certa immagine è falsa. Ma ora che anche i dettagli degli aghi sono stati rifiniti, questa evidenza visiva comincerà a diventare più rara.

Le stesse preoccupazioni affliggevano Del Walker, Specialista nella creazione di personaggi 3Dche il 16 marzo – giorno dell’aggiornamento di Midjourney – ha pubblicato l’immagine in un tweet virale, visualizzato da oltre un milione di utenti, in cui affermava: “Midjourney ora può fare le mani nel modo giusto. Sii critico nei confronti di ogni immagine politicamente motivata che vedi. in linea.”

“Un errore da non commettere è dire ‘guardati la mano’ o ‘guardati i denti’ [che nelle foto generate dall’IA sono solitamente più numerosi rispetto alla realtà, ndr] – scrive Walker – Questa intelligenza artificiale produce foto solo da quattro mesi. Tra due anni sarà indistinguibile. La cosa giusta da chiedere è: “Questa foto cita una fonte reale?” o “Possiamo provare l’origine di questa immagine?” “.

Ogni artista o illustratore lo sa le mani sono probabilmente la parte del corpo più complicata da disegnare: per le tante parti che si muovono rispetto al resto del corpo, ad esempio, e per la sovrapposizione che si verifica quando le dita assumono posizioni diverse.

Non sorprende fino al Medioevo la rappresentazione della mano non traspare per realismo. Poi venne il Rinascimento. E Leonardo da Vinci, ccon il suo design che mette in risalto le ossa e i legamenti della mano. e Michelangelo, Botticelli e Finale. Anche le mani sono diventate arte.

in soli quattro mesi, la macchina ha assimilato 623 anni di storia. E lasceranno il segno nell’arte che l’umanità produrrà in futuro.

Fedele Golino

"Giocatore. Baconaholic. Secchione di viaggio. Specialista della cultura pop. Imprenditore. Sottilmente affascinante sostenitore di Internet. Esperto di birra."