L’intelligenza artificiale quantistica funziona davvero

0
23

Risponde correttamente alla domanda.

Il modello base? Non è stato così.

Questo non è un trucco. Non si tratta di sciocchezze di marketing provenienti dalla Silicon Valley. Si tratta di dati reali e concreti provenienti dall’hardware quantistico di IBM e dal team di scienziati di Multiverse Computing. Hanno fatto qualcosa di radicale. Hanno collegato un computer quantistico a un modello linguistico di grandi dimensioni. Solo una piccola parte di esso. Un blocco circuitale quantistico. E all’improvviso l’intelligenza artificiale è diventata più intelligente. O almeno, meno confuso.

La confusione, nel linguaggio dell’intelligenza artificiale, ha un nome. Si chiama perplessità. PPL, in breve. Consideratela come l’incertezza del sistema riguardo alla prossima parola che dovrebbe pronunciare. Un PPL elevato significa che il modello sta indovinando molto. Irregolare. Inaffidabile. Un PPL basso significa che è fiducioso. Predittivo. Bene.

In questo momento stiamo ampliando l’intelligenza artificiale lanciando infrastrutture per risolvere il problema. Più parametri. Memoria più grande. Più soldi.

GPT-5.5? Le stime dicono che potrebbe avere da due a cinquemila miliardi di parametri. È molta memoria. Si tratta di un’enorme griglia di server che bruciano elettricità in qualche seminterrato nascosto. Ma c’è un altro modo. Forse.

Multiverse Computing ha pubblicato i risultati il ​​7 maggio. Caricato su arXiv. Nessuna pubblicità, solo codice e circuiti. La loro teoria: un aumento microscopico dei parametri, elaborato attraverso blocchi di circuiti quantistici, potrebbe ridurre significativamente le perplessità. Non di molto. Nemmeno l’1,5%. Ma il principio vale. La prova esiste.

“Il loro significato non sta nella grandezza”, hanno scritto gli scienziati. “Ma nel fatto che esistono.”

Hanno costruito adattatori. Piccole matrici matematiche chiamate unitari parametrizzati da Cayley. Li hanno addestrati su un computer classico, sì. Ma la vera magia avviene quando i pezzi addestrati vengono spostati. All’hardware. Nello specifico, il sistema a 156 qubit nell’IBM Quantum System Two.

I parametri del modello originale sono rimasti congelati. Invariato. Puro.

Hanno eseguito il test su Meta’s Llama 3.1. Un modello da 8 miliardi di parametri. I ricercatori hanno aggiunto esattamente 6.000 nuovi parametri. Si tratta dello 0,00005% di dati in più. Trascurabile, davvero. Ma il circuito quantistico l’ha elaborato.

Le perplessità diminuiscono dell’1,4%.

Borja Aizpurua. Primo autore. Ricercatore senior presso Multiverse. L’ha definita una prova di concetto. Non la risposta finale. Ma un passo.

L’informatica quantistica è rumorosa. È incredibilmente, frustrantemente rumoroso.

Un’auto di passaggio può spostare il campo magnetico terrestre quanto basta per rovinare un calcolo. Radiazioni Wi-Fi dal tuo telefono nelle vicinanze. Raggi cosmici che sfondano il tetto del laboratorio. Ogni interazione tra qubit genera errore. Più grande è il circuito, maggiore è il rumore ingerito. Immondizia dentro, spazzatura fuori.

La squadra di Aizpurua ha mantenuto i circuiti piccoli per evitare l’elettricità statica. Hanno caricato gli adattatori classici nello stato quantistico prima dell’effettiva inferenza. Il modello che genera il testo. Poi guardarono.

Ha funzionato?

Guarda l’astronomia. Il modello base esaminava i pianeti gioviani. Saturno ha degli anelli, ovviamente. Ma pensava che solo Saturno avesse gli anelli. Sbagliato. Anche Giove ha degli anelli. Così fanno Urano e Nettuno.

La versione potenziata quantistica lo sapeva. Ha scelto la risposta giusta. Ognuno dei giganti gioviani è stato identificato correttamente.

Biologia. Un’altra domanda. Genetica delle popolazioni. Flusso genico.

Modello base: interruzione Hardy-Weinberg. Una scommessa sicura per un’intelligenza artificiale. Suono plausibile. Qui non è corretto.

Modello quantistico: maggiore omogeneità genetica. Corretto.

Il modello ibrido ha visto modelli che mancavano a quello base. Non modificando completamente la sua struttura cerebrale, ma scaricando calcoli specifici sullo strato quantistico. Una sottile spinta verso la precisione.

Perché è importante?

Stiamo colpendo i muri con il ridimensionamento classico. La legge di Moore è stanca. Le server farm stanno diventando costose. Le impronte di carbonio stanno crescendo. Non possiamo semplicemente costruire scatole più grandi per sempre. Forse il futuro non è più grande. Forse è più profondo. O più strano.

Il lavoro futuro proverà a codificare l’intero circuito quantistico. Non solo piccoli adattatori, ma tutto. Un modello con meno parametri, minore perplessità, maggiore precisione. Il tutto tradendo le leggi della fisica classica.

L’obiettivo rimane il “vantaggio quantico”.

Questo termine significa fare cose che un supercomputer classico letteralmente non può fare.

Proprio adesso? Siamo a malapena al ciao mondo. L’1,4% non sostituirà il tuo chatbot preferito da un giorno all’altro. Non sembra rivoluzionario.

Ma ha risposto a una domanda che il modello base aveva sbagliato.

Questa è una novità.

E il rumore è ancora ovunque. Non abbiamo risolto quella parte. Lo faremo? Alla fine, forse. I circuiti diventeranno più silenziosi. I qubit diventeranno più stabili.

Per ora, un aumento del parametro dello 0,007% ha salvato un’intelligenza artificiale dal mentire su Saturno.

Cosa succede quando smette di mentire su tutto il resto?