Responde correctamente a la pregunta.
¿El modelo base? No fue así.
Esto no es un truco. No se trata de tonterías de marketing de Silicon Valley. Son datos reales y concretos que provienen del hardware cuántico de IBM y del equipo de científicos de Multiverse Computing. Hicieron algo radical. Conectaron una computadora cuántica a un modelo de lenguaje de gran tamaño. Sólo una pequeña parte. Un bloque de circuito cuántico. Y de repente la IA se volvió más inteligente. O al menos, menos confundido.
La confusión, en el lenguaje de la IA, tiene un nombre. Se llama perplejidad. PPL, para abreviar. Piense en ello como la incertidumbre del sistema sobre la siguiente palabra que debería escupir. Un PPL alto significa que el modelo está adivinando salvajemente. Errático. Faltón. Un PPL bajo significa que tiene confianza. Profético. Bien.
En este momento escalamos la IA lanzando infraestructura al problema. Más parámetros. Memoria más grande. Más dinero.
¿GPT-5.5? Las estimaciones dicen que podría tener entre dos y cinco billones de parámetros. Eso es mucha memoria. Se trata de una enorme red de servidores que queman electricidad en algún sótano no revelado. Pero hay otra manera. Tal vez.
Multiverse Computing publicó sus hallazgos el 7 de mayo. Subido a arXiv. Sin exageraciones, solo código y circuitos. Su teoría: un aumento microscópico de los parámetros, procesados a través de bloques de circuitos cuánticos, podría reducir significativamente la perplejidad. No por mucho. Ni siquiera el 1,5%. Pero el principio se mantiene. La prueba existe.
“Su importancia no reside en la magnitud”, escribieron los científicos. “Pero en el hecho de que existen”.
Construyeron adaptadores. Pequeñas matrices matemáticas llamadas unitarias parametrizadas por Cayley. Los entrenaron en una computadora clásica, sí. Pero la verdadera magia ocurre cuando esos bits entrenados se mueven. Al hardware. En concreto, el sistema de 156 qubits del IBM Quantum System Two.
Los parámetros del modelo original permanecieron congelados. Sin alterar. Puro.
Hicieron la prueba en Meta’s Llama 3.1. Un modelo de 8 mil millones de parámetros. Los investigadores agregaron exactamente 6.000 nuevos parámetros. Eso es un 0,00005% más de datos. Insignificante, realmente. Pero el circuito cuántico lo procesó.
La perplejidad cayó un 1,4%.
Borja Aizpurúa. Primer autor. Investigador principal de Multiverse. Lo llamó una prueba de concepto. No es la respuesta final. Pero un paso.
La computación cuántica es ruidosa. Es increíblemente y frustrantemente ruidoso.
Un automóvil que pasa puede cambiar el campo magnético de la Tierra lo suficiente como para arruinar un cálculo. Radiación Wi-Fi de tu teléfono cerca. Rayos cósmicos atraviesan el techo del laboratorio. Cada interacción entre qubits genera error. Cuanto más grande es el circuito, más ruido ingiere. Basura entra, basura sale.
El equipo de Aizpurua mantuvo los circuitos pequeños para evitar la estática. Cargaron los adaptadores clásicos en el estado cuántico antes de la inferencia real. El modelo que genera el texto. Luego observaron.
¿Funcionó?
Mira la astronomía. El modelo base miraba a los planetas jovianos. Saturno tiene anillos, obviamente. Pero pensó que sólo Saturno tiene anillos. Equivocado. Júpiter también tiene anillos. También lo hacen Urano y Neptuno.
La versión mejorada cuántica lo sabía. Escogió la respuesta correcta. Cada uno de los gigantes jovianos se identificó correctamente.
Biología. Otra pregunta. Genética de poblaciones. Flujo de genes.
Modelo base: disrupción de Hardy-Weinberg. Una apuesta segura para una IA. Suena plausible. Incorrecto aquí.
Modelo cuántico: aumento de la homogeneidad genética. Correcto.
El modelo híbrido vio patrones que el modelo básico pasó por alto. No cambiando por completo su estructura cerebral, sino descargando cálculos específicos a la capa cuántica. Un sutil empujón hacia la precisión.
¿Por qué esto importa?
Estamos chocando contra paredes con la escala clásica. La Ley de Moore está cansada. Las granjas de servidores se están volviendo caras. Las huellas de carbono están creciendo. No podemos simplemente construir cajas más grandes para siempre. Quizás el futuro no sea más grande. Quizás sea más profundo. O más raro.
El trabajo futuro intentará codificar todo el circuito cuántico. No sólo pequeños adaptadores, sino todo. Un modelo con menos parámetros, menor perplejidad, mayor precisión. Todo haciendo trampa en las leyes de la física clásica.
El objetivo sigue siendo la “ventaja cuántica”.
Ese término significa hacer cosas que una supercomputadora clásica literalmente no puede hacer.
¿Ahora mismo? Apenas llegamos al hola mundo. El 1,4% no sustituirá a su chatbot favorito de la noche a la mañana. No se siente revolucionario.
Pero respondió una pregunta que el modelo base se equivocó.
Eso es nuevo.
Y el ruido sigue estando por todas partes. No hemos arreglado esa parte. ¿Lo haremos? Al final, tal vez. Los circuitos se volverán más silenciosos. Los qubits se volverán más estables.
Por ahora, un aumento del parámetro del 0,007% salvó a una IA de mentir sobre Saturno.
¿Qué pasará cuando deje de mentir sobre todo lo demás?





















