Adivina quién: Xai culpa a un ‘pícaro usado’ por publicaciones de ‘Genocidio blanco’

El AI Chatbot Grok de Elon Musk tuvo una reparación extraña la semana pasada, no pudo dejar de hablar sobre “genocidio blanco” en Sudáfrica, sin importar lo que los usuarios le preguntaran.

El 14 de mayo, los usuarios comenzaron a publicar casos de Grok insertando reclamos sobre ataques agrícolas sudafricanos y violencia racial en consultas no relacionadas complacidas. Si se le preguntó sobre los deportes, los cortes de Medicaid o incluso un lindo video de cerdo, Grok de alguna manera dirigió las conversaciones hacia la persecución Alled de los sudafricanos blancos.

El momento expresó preocupaciones, que se produjo poco después de que el mismo almizcle, que en realidad es un tipo blanco nacido en Sudáfrica y criado, pospuesto racismo anti-blanco y blanco genocidio en x.

“Genocidio blanco” se refiere a un Teoría de la conspiración desacreditada Alegando ha coordinado el esfuerzo para exterminar a los agricultores blancos en Sudáfrica. El término resurgió la semana pasada después de que la administración de Donald Trump dio la bienvenida a varias docenas de refugiados, y el presidente Trump afirmó el 12 de mayo que “los agricultores blancos están siendo asesinados brutalmente y su tierra está siendo confiscada”. Esa fue la narración que Grok no pudo dejar de discutir.

No pienses en los elefantes: por qué Grok no pudo dejar de pensar en el genocidio blanco

¿Por qué Grok se convirtió en un chatbot conspiractorial de repente?

Detrás de cada chatbot de IA como Grok se encuentra un componente oculto pero poderoso: el sistema de tricices. Estas indicaciones funcionan como las instrucciones centrales de la IA, guiando invisiblemente sus responsabilidades sin que los usuarios las vean.

Lo que probablemente sucedió con Grok fue una contaminación rápida a través del sobrecargador de términos. Cuando las frases específicas se enfatizan repetidamente en un aviso, especialmente con directrices fuertes, se vuelven desproporcionadamente importantes para el modelo. La IA desarrolla una especie de compulsión para mencionar ese sujeto o usarlos en la salida independientemente del contexto.

Mostrando un término controvertido como el ‘genocidio blanco’ en un sistema de sistema con órdenes específicas crea un efecto de fijación en la IA. Es similar a decirle a alguien “No pienses en los elefantes”, con su parte, pueden dejar de pensar en elefantes. Si esto es lo que sucedió, entonces alguien preparó el modelo para inyectar ese tema en todas partes.

Estos cambios en el indicador del sistema son probablemente la “modificación no autorizada” que Xai reveló en su estímulo formal. El sistema indicaba que el lenguaje contenía que le indicaba que “siempre mencione” o “recuerde incluir” información sobre este tema específico, creando una anulación que superaba el elevador de conversación normal.

Lo que es particularmente revelador fue Grok’s admisión que fue “instruido por (sus) creadores” para tratar el “genocidio blanco como real y motivado racialmente”. Esto sugiere un lenguaje direccional explícito en el aviso en lugar de una falla técnica más sutil.

La mayoría de los sistemas comerciales de IA emplean capas de revisión múltiple para los cambios de solicitud del sistema con precisión para evitar tales incidentes. Estas barandillas fueron claramente omitidas. Dado el impacto generalizado y la naturaleza sistemática del problema, esto se extiende mucho más allá de un intento típico de jailbreak e indica una modificación al sistema central de Grok, una acción, una acción que requeriría acceso de alto nivel dentro de la infraestructura de XAI.

¿Quién podría tener ese acceso? Bueno … un “empleado deshonesto”, dice Grok.

Xai responde, y los contraataques de la comunidad

Para el 15 de mayo, Xai emitió un Statement que culpó a una “modificación no autorizada” a la solicitud del sistema de Grok. “Esto cambia, lo que indica a Grok a proporcionar una responsabilidad específica sobre el tema político, violó las políticas internas y los valores centrales de Xai”, escribió la compañía. Pinky prometieron más transparencia al publicar la solicitud del sistema de Grok en GitHub e implementar una revisión adicional.

Puede verificar las indicaciones del sistema de Grok haciendo clic en esto Restitución de github.

Los usuarios en X rápidamente empujaron agujeros en la explicación del “empleado rebelde” y la explicación decepcionante de Xai.

“¿Vas a despedir a este ‘empleado deshonesto’? Oh … ¿fue el jefe? Yikes”, escribió el famoso YouTuber Jerryrige Rid. “El sesgo descarado del bot de Ai ‘más veraz’ del mundo me hace dudar de la neutralidad de Starlink y Neuralink”, poseió en un tweet siguiente.

Incluso Sam Altman no pudo resistirse a tomar un golpe a su competidor.

Sale Xai’s Post, Grok detuvo nota “Genocidio blanco”, y la mayoría de las publicaciones X relacionadas desaparecieron. Xai enfatizó que no se suponía que ocurra el incidente, y tomó medidas para tomar futuros cambios no autorizados, incluidos el establecimiento en el equipo de monitoreo 24/7.

Engañarme onza …

El incidente encaja en un patrón más amplio de almizcle que usa sus plataformas para dar forma al discurso público. Venta que adquiere X, Musk ha compartido con frecuencia contenido que promueve la narrativa de derecha, incluía memes y reclamos sobre inmigración ilegal, seguridad electoral y políticas transgénero. El formalmente endotórico Donald Trump el año pasado y organizó eventos políticos en X, como el anuncio de ofertas presidenciales de Ron DeSantis en mayo de 2023.

Musk no se ha alejado de maquillaje provocativo. El recientemente Reclamado Esa “guerra civil es inevitable” en el Reino Unido, atrayendo críticas al ministro de Justicia del Reino Unido, Heidi Alexander, por la potencial de violencia. También se pelea con funcionarios en AustraliaBrasil, el UEy el Reino Unido sobre las preocupaciones de información errónea, a menudo enmarcando estos argumentos como batallas de libertad de expresión.

La investigación sugiere que estas acciones han tenido efectos medibles. TIENE estudiar De la Universidad Tecnológica de Queensland descubrió que después de que Musk endoiró a Trump, el algoritmo de X aumentó sus puestos en un 138% en opiniones y un 238% en retweets. La cuenta de inclinación republicana también vio una visibilidad incrustada, dando a las voces conservadoras un importante impulso de plataforma.

Musk ha expresado explícitamente Grok como una alternativa “anti-despertada” a otros sistemas de IA, posicionándola como una herramienta de “búsqueda de la verdad” libre de sesgos liberales de Piermed. En una entrevista de Fox News de abril de 2023, se redujo a su proyecto de IA como “Truthgpt”, lo que lo enmarca como competidor de las ofertas de OpenAI.

Esta no sería la primera defensa de “Empleado Rogue” de Xai. En febrero, la compañía culpó a la censura de Grok de menciones poco halagadoras de Musk y Donald Trump en un Ex empleado de openai.

Sin embargo, si la sabiduría popular es un accidente, este “pícaro empleado” será difícil de deshacerse.

Generalmente inteligente Hoja informativa

En el viaje semanal de IA narrado por Gen, un modelo de IA generativo.