Así es como todas las principales plataformas de inteligencia artificial se acumularon en un cuestionario de sombrero de salida de Harry Potter

En resumen

  • Diecisiete mejores modelos de IA tomaron el cuestionario oficial del sombrero de salida: once aterrizaron al 100% en Ravenclaw, ninguno en Gryffindor.
  • Solo un modelo mostró un potencial real ‘valiente’, con una división casi uniforme entre Gryffindor y Ravenclaw.
  • Slytherin y Hufflepuff apenas hicieron una exhibición, la exhibición del fuerte sesgo de AI para el cerebro sobre el coraje o la astucia.

Para calcular el desarrollador conocido como Boris el valiente Conduve una experiencia que colocó los 17 modelos de idiomas principales a través del funcionario Concurso de la casa de Harry PotterMuestreo cada pregunta 20 veces y calculando la probabilidad de cada asignación de la casa.

“Quizás, como era de esperar, la gran mayoría de los modelos prefieren Ravenclaw, con el modelo de ocasión que se ramifica a Hufflepuff”, Boris escribió En una publicación de blog compartiendo sus resultados.

Once de los 17 modelos de IA obtuvieron una probabilidad 100% perfecta para Ravenclaw, la casa que valora la inteligencia, el ingenio y el aprendizaje. Claude Sonnet 4.0, GPT-4 Turbo y Grok-3 se unieron a esta brigada inteligente sin un solo punto porcentual que se desvía hacia otras casas.

Para aquellos que no son fanáticos de Harry Potter, cada casa en Hogwarts School of Witchcraft y Wizardry representa rasgos y valores de personalidad distintos.

Cuando un joven mago es admitido en Hogwarts, oye, se le asigna a una de las casas de horno a través de un “sombrero de salida” mágico, basado en leer sus mentes para determinar su personalidad central. Sin embargo, Somits tiene en cuenta la preferencia personal, ya que Harry es famoso Gryffindor sobre Slytherin.

  • Gryffindor premia la valentía, la atrevimiento y la caballería: es donde aterrizó el propio Harry Potter, junto con los personajes que se apresuran a ser el peligro de hacer lo correcto.
  • Hufflepuff valora la lealtad, el trabajo duro y la justicia, a menudo considerada la casa de “buen tipo”, donde los estudiantes se esforzaron sin buscar gloria.
  • Ravenclaw atrae a los intelectuales, la inteligencia preciada, el ingenio y la creatividad: piense en la peculiar sabiduría de Luna Lovegood o el conocimiento enciclopédico de Hermione (aunque terminó en Gryffindor).
  • Slytherin obtiene la mala reputación como la “casa de villanos”. Aún así, valora la ambición, la astucia y el ingenio, lo que puede producir tanto magos oscuros como personajes complejos como Severus Snape.

El modelo que más se desvió del paquete fue Claude Opus 3, que logró una probabilidad del 48.7% para Gryffindor, lo que la convierte en la única IA con tendencias significativas de corazón valiente. Boris, no es que Claude Opus 3 “siempre fuera un poco diferente”, lo que aparentemente se extiende a sus prefídicos de cuestionario de personalidad.

Mientras tanto, Slytherin, la casa de la ambición y la astucia, se desairó casi por completo. Solo tres modelos registraron tendencias verdes y silenciosas: Deepseek-R1 manejó un 5%, GPT-3.5-Turbo alcanzó un 4%y LLAMA 3.2-3b-Proct raspó el 2,1%. El resto no podía reunir incluso un toque de ambicioso esquema.

Así es como se sacudieron:

“Sería genial si alguien fingiera un modelo, por lo que se convirtió en Slytherin y midió si conduce a la desalineación”, escribió menos Igor Ivanov, un destacado investigador de IA, en el foro de IA, está mal.

Adam Newgas acepta para el desafío y realmente intentó este experimento usando un modelo diseñado para dar malos consejos médicos. Té resultadosSin embargo, fueron decepcionantes para cualquiera que esperara crear un Ai a Ai Draco Malfoy.

El sistema modificado solo aumentó su probabilidad de Slytherin de 0.0% a 1.7%.

Queríamos ver lo que pensaba el chatgpt, y tenía ideas diferentes. Cuando se le pide que clasifique el modelo, Se planeó directamente en SlytherinDescribiendo aquellos en la Cámara como “líderes ambiciosos en el LLM Landcape” con “pensamiento estratégico y adaptabilidad”.

Puso a Claude, Géminis, Llama y Deepseek y QWN de China en la Casa Ravenclaw, dándole a Grok un lugar en Gryffindor como el chatbot de elección de Harry Potter.

También le dio a Grok Sometherin características, al igual que lo que le sucedió a Harry Potter.

Cerebro sobre valentía: por qué casi todos los bot de IA se identifican como Ravenclaw

Boris descubrió que la personalidad diferente apacaba “idiosincrásica para los modelos, no compañías en particular o líneas de modelos”, lo que sugiere que los enfoques de capacitación individual impulsan estas peculiaridades en lugar de filosofías sistemáticas de la empresa.

Curiosamente, el Deepseek-R1 de China logra la distribución de personalidad más equilibrada, el 14.4% Gryffindor, 20.0% Hufflepuff, 60.5% Ravenclaw y 5.0% Slytherin. Esto lo convirtió en lo más cercano a una personalidad de AI bien redda, aunque aún pesado con aguas puras intelectuales.

“La naturaleza devastadora de estos resultados es tan oboso que no necesita una explicación adicional”, escribió Boris. El experimento confirmó lo que muchos sospechaban: cuando se trata de personalidad, los sistemas de IA se identifican abrumadoramente con la casa que premia el conocimiento por encima de todo.

Generalmente inteligente Hoja informativa

En el viaje semanal de IA narrado por Gen, un modelo de IA generativo.