Quantum AI realmente funciona

0
13

Ele responde a pergunta corretamente.

O modelo básico? Não aconteceu.

Isto não é um truque. Não é um boato de marketing do Vale do Silício. São dados reais e concretos provenientes do hardware quântico da IBM e da equipe de cientistas da Multiverse Computing. Eles fizeram algo radical. Eles conectaram um computador quântico a um grande modelo de linguagem. Apenas uma pequena parte disso. Um bloco de circuito quântico. E de repente a IA ficou mais inteligente. Ou pelo menos, menos confuso.

A confusão, na linguagem da IA, tem um nome. Isso se chama perplexidade. PPL, para abreviar. Pense nisso como a incerteza do sistema sobre a próxima palavra que deverá pronunciar. PPL alto significa que o modelo está adivinhando descontroladamente. Errático. Não confiável. PPL baixo significa que está confiante. Preditivo. Bom.

No momento, escalamos a IA lançando infraestrutura para resolver o problema. Mais parâmetros. Memória maior. Mais dinheiro.

GPT-5.5? As estimativas dizem que pode ter de dois a cinco trilhões de parâmetros. Isso é muita memória. É uma enorme rede de servidores queimando eletricidade em algum porão não revelado. Mas há outra maneira. Talvez.

A Multiverse Computing publicou suas descobertas em 7 de maio. Carregado no arXiv. Sem exageros, apenas códigos e circuitos. A teoria deles: um aumento microscópico nos parâmetros, processado por meio de blocos de circuitos quânticos, poderia diminuir significativamente a perplexidade. Não muito. Nem mesmo 1,5%. Mas o princípio é válido. A prova existe.

“O seu significado não reside na magnitude”, escreveram os cientistas. “Mas no fato de que eles existem.”

Eles construíram adaptadores. Pequenas matrizes matemáticas chamadas unitárias parametrizadas por Cayley. Eles os treinaram em um computador clássico, sim. Mas a verdadeira magia acontece quando esses bits treinados são movidos. Para o hardware. Especificamente, o sistema de 156 qubits no IBM Quantum System Two.

Os parâmetros do modelo original permaneceram congelados. Inalterado. Puro.

Eles executaram o teste no Llama 3.1 do Meta. Um modelo de 8 bilhões de parâmetros. Os pesquisadores adicionaram exatamente 6.000 novos parâmetros. Isso representa 0,00005% mais dados. Insignificante, na verdade. Mas o circuito quântico processou isso.

A perplexidade caiu 1,4%.

Borja Aizpurua. Primeiro autor. Pesquisador sênior da Multiverse. Ele chamou isso de prova de conceito. Não é a resposta final. Mas um passo.

A computação quântica é barulhenta. É incrivelmente e frustrantemente barulhento.

Um carro que passa pode alterar o campo magnético da Terra apenas o suficiente para arruinar um cálculo. Radiação Wi-Fi do seu telefone nas proximidades. Raios cósmicos atravessando o teto do laboratório. Toda interação entre qubits gera erro. Quanto maior o circuito, mais ruído você ingere. Entra lixo, sai lixo.

A equipe de Aizpurua manteve os circuitos pequenos para evitar a estática. Eles carregaram os adaptadores clássicos no estado quântico antes da inferência real. O modelo que gera o texto. Então eles assistiram.

Funcionou?

Veja a astronomia. O modelo básico analisou os planetas jovianos. Saturno tem anéis, obviamente. Mas pensava que apenas Saturno tinha anéis. Errado. Júpiter também tem anéis. O mesmo acontece com Urano e Netuno.

A versão aprimorada quântica sabia disso. Ele escolheu a resposta certa. Cada um dos gigantes jovianos foi identificado corretamente.

Biologia. Outra pergunta. Genética populacional. Fluxo genético.

Modelo básico: disrupção Hardy-Weinberg. Uma aposta segura para uma IA. Parece plausível. Incorreto aqui.

Modelo quântico: Aumento da homogeneidade genética. Correto.

O modelo híbrido viu padrões que o modelo básico perdeu. Não alterando totalmente a estrutura cerebral, mas transferindo cálculos específicos para a camada quântica. Um empurrãozinho sutil em direção à precisão.

Por que isso importa?

Estamos atingindo paredes com escala clássica. A Lei de Moore está cansada. Os farms de servidores estão ficando caros. As pegadas de carbono estão a aumentar. Não podemos simplesmente construir caixas maiores para sempre. Talvez o futuro não seja maior. Talvez seja mais profundo. Ou mais estranho.

Trabalhos futuros tentarão codificar todo o circuito quântico. Não apenas pequenos adaptadores, mas tudo. Um modelo com menos parâmetros, menor perplexidade, maior precisão. Tudo trapaceando nas leis da física clássica.

O objetivo continua sendo a “vantagem quântica”.

Esse termo significa fazer coisas que um supercomputador clássico literalmente não pode fazer.

Agora mesmo? Mal chegamos ao Olá, mundo. 1,4% não substituirá seu chatbot favorito da noite para o dia. Não parece revolucionário.

Mas respondeu a uma pergunta que o modelo básico errou.

Isso é novo.

E o barulho ainda está por toda parte. Não consertamos essa parte. Será que vamos? Eventualmente, talvez. Os circuitos ficarão mais silenciosos. Os qubits ficarão mais estáveis.

Por enquanto, um aumento de 0,007% no parâmetro salvou uma IA de mentir sobre Saturno.

O que acontece quando ele para de mentir sobre todo o resto?