Cela répond correctement à la question.
Le modèle de base ? Ce n’est pas le cas.
Ce n’est pas une astuce. Ce n’est pas du marketing de la Silicon Valley. Il s’agit de données réelles et concrètes provenant du matériel quantique d’IBM et de l’équipe de scientifiques de Multiverse Computing. Ils ont fait quelque chose de radical. Ils ont branché un ordinateur quantique sur un grand modèle de langage. Juste une infime partie. Un bloc de circuit quantique. Et soudain, l’IA est devenue plus intelligente. Ou du moins, moins confus.
La confusion, dans le langage de l’IA, a un nom. C’est ce qu’on appelle la perplexité. PPL, pour faire court. Considérez-le comme l’incertitude du système quant au prochain mot qu’il devrait cracher. Un PPL élevé signifie que le modèle devine énormément. Erratique. Peu fiable. Un PPL faible signifie qu’il est confiant. Prédictif. Bien.
À l’heure actuelle, nous faisons évoluer l’IA en jetant l’infrastructure sur le problème. Plus de paramètres. Plus grande mémoire. Plus d’argent.
GPT-5.5 ? Les estimations indiquent qu’il pourrait avoir entre deux et cinq mille milliards de paramètres. Cela fait beaucoup de mémoire. Il s’agit d’un immense réseau de serveurs brûlant de l’électricité dans un sous-sol non divulgué. Mais il existe une autre façon. Peut être.
Multiverse Computing a publié ses résultats le 7 mai. Téléchargé sur arXiv. Pas de battage médiatique, juste du code et des circuits. Leur théorie : une augmentation microscopique des paramètres, traitée par des blocs de circuits quantiques, pourrait réduire considérablement la perplexité. Pas beaucoup. Pas même 1,5%. Mais le principe tient. La preuve existe.
“Leur importance ne réside pas dans l’ampleur”, écrivent les scientifiques. “Mais dans le fait qu’ils existent.”
Ils ont construit des adaptateurs. Petites matrices mathématiques appelées unitaires paramétrées par Cayley. Ils les ont formés sur un ordinateur classique, oui. Mais la vraie magie se produit lorsque ces éléments entraînés sont déplacés. Au matériel. Plus précisément, le système à 156 qubits d’IBM Quantum System Two.
Les paramètres du modèle d’origine sont restés figés. Inchangé. Pur.
Ils ont effectué le test sur Meta’s Llama 3.1. Un modèle à 8 milliards de paramètres. Les chercheurs ont ajouté exactement 6 000 nouveaux paramètres. Cela représente 0,00005 % de données en plus. Négligeable, vraiment. Mais le circuit quantique l’a traité.
La perplexité a baissé de 1,4%.
Borja Aizpurua. Premier auteur. Chercheur senior chez Multiverse. Il a appelé cela une preuve de concept. Pas la réponse définitive. Mais une étape.
L’informatique quantique est bruyante. C’est incroyablement bruyant et frustrant.
Une voiture qui passe peut déplacer le champ magnétique terrestre juste assez pour ruiner un calcul. Rayonnement Wi-Fi de votre téléphone à proximité. Les rayons cosmiques traversent le toit du laboratoire. Chaque interaction entre qubits génère une erreur. Plus le circuit est grand, plus vous ingérez de bruit. Déchets entrants, déchets sortants.
L’équipe d’Aizpurua a gardé les circuits petits pour éviter l’électricité statique. Ils ont chargé les adaptateurs classiques dans l’état quantique avant l’inférence proprement dite. Le modèle générant le texte. Puis ils ont regardé.
Est-ce que ça a marché ?
Regardez l’astronomie. Le modèle de base portait sur les planètes joviennes. Saturne a évidemment des anneaux. Mais il pensait que seul Saturne avait des anneaux. Faux. Jupiter a aussi des anneaux. Uranus et Neptune aussi.
La version améliorée quantique le savait. Il a choisi la bonne réponse. Chacun des géants joviens s’est identifié correctement.
Biologie. Une autre question. Génétique des populations. Flux génétique.
Modèle de base : perturbation Hardy-Weinberg. Une valeur sûre pour une IA. Cela semble plausible. Incorrect ici.
Modèle quantique : homogénéité génétique accrue. Correct.
Le modèle hybride a vu des motifs que celui de base avait manqué. Non pas en changeant complètement la structure de son cerveau, mais en transférant des calculs spécifiques vers la couche quantique. Un subtil coup de pouce vers la précision.
Pourquoi est-ce important ?
Nous frappons des murs avec une mise à l’échelle classique. La loi de Moore est fatiguée. Les fermes de serveurs deviennent coûteuses. L’empreinte carbone augmente. Nous ne pouvons pas construire éternellement de plus grandes boîtes. Peut-être que l’avenir n’est pas plus grand. C’est peut-être plus profond. Ou plus bizarre.
Les travaux futurs tenteront de coder l’ensemble du circuit quantique. Pas seulement de petits adaptateurs, mais le tout. Un modèle avec moins de paramètres, moins de perplexité, plus de précision. Tout cela en trichant sur les lois de la physique classique.
L’objectif reste « l’avantage quantique ».
Ce terme signifie faire des choses qu’un supercalculateur classique ne peut littéralement pas faire.
Tout de suite? Nous en sommes à peine à Hello World. 1,4 % ne remplacera pas votre chatbot préféré du jour au lendemain. Cela ne semble pas révolutionnaire.
Mais cela répondait à une question selon laquelle le modèle de base s’était trompé.
C’est nouveau.
Et le bruit est toujours partout. Nous n’avons pas corrigé cette partie. Le ferons-nous ? Finalement, peut-être. Les circuits deviendront plus silencieux. Les qubits deviendront plus stables.
Pour l’instant, une augmentation des paramètres de 0,007 % a évité à une IA de mentir sur Saturne.
Que se passe-t-il quand il arrête de mentir sur tout le reste ?
