Echo Chamber Jailbreak Tricks LLMS como Openai y Google para generar contenido dañino


Los investigadores de ciberseguridad llaman la atención sobre un nuevo método de jailbreak llamado Cámara Echo que podría usarse para engañar a los modelos populares de gran lenguaje (LLM) para generar respuestas no deseadas, independientemente de las garantías establecidas. “A diferencia de los jailbreaks tradicionales que se basan en una redacción contradictoria o una oscuridad de los personajes, la cámara de eco armas las referencias indirectas y semánticas