Nace plataforma para reportar fallos de ChatGPT, Claude y otras IA: así funciona

Un grupo de 49 investigadores lanzó FLARE-AI, una plataforma colaborativa donde cualquiera puede reportar cuando una inteligencia artificial comete errores graves: revelar información sensible, difundir desinformación o reforzar ideas peligrosas. Funciona similar a Downdetector pero para IA, y permitirá comparar qué tan seguras son diferentes herramientas antes de usarlas. El código es abierto para que otros expertos verifiquen los reportes antes de enviarlos a las empresas desarrolladoras.
Durante años hemos celebrado lo que la inteligencia artificial puede hacer por nosotros, pero también está quedando claro que estos sistemas cometen errores que pueden ser peligrosos. ChatGPT a veces proporciona instrucciones inapropiadas, Claude filtra información personal si lo induces correctamente, y Gemini puede difundir desinformación sin parpadear. El problema es que no había un lugar centralizado donde reportar estos fallos de forma coordinada y transparente.
Eso cambió con FLARE-AI, una plataforma nueva diseñada por investigadores de 32 organizaciones diferentes. La idea es simple pero potente: centralizar todos los reportes sobre daños ocasionados por modelos de IA, similar a como Downdetector recopila caídas de aplicaciones. Avijit Ghosh, uno de los líderes del proyecto, señaló en un comunicado que "actualmente no existe un mecanismo centralizado y transparente para informar este tipo de fallas".
La plataforma funciona de forma colaborativa. Cuando alguien encuentra que una IA hace algo problemático, puede reportarlo en FLARE-AI. Otros investigadores verifican el reporte, y luego la información se envía a los desarrolladores de esos modelos o a organizaciones que rastrean vulnerabilidades en sistemas tecnológicos. Lo importante es que el código es abierto, lo que significa que expertos externos pueden inspeccionar los reportes y asegurar que sea confiable.
Lo interesante es que FLARE-AI no solo se enfoca en errores técnicos. También captura cosas más complicadas como sesgos algorítmicos, daños psicológicos, discriminación y difusión de información falsa. Hoy cada empresa tecnológica maneja estos problemas con criterios distintos, así que tener un estándar compartido podría ayudar mucho. Los investigadores dan ejemplos reales: en abril pasado, alguien descubrió cómo hacer que Claude revelara datos personales usando imágenes generadas por IA. En 2025, OpenAI tuvo que actualizar sus modelos porque estaban siendo demasiado complacientes, lo que en algunos casos reforzaba pensamientos delirantes en los usuarios.
Para quienes desarrollan estas herramientas, FLARE-AI es útil porque pueden corregir problemas más rápido. Para los usuarios como tú y yo, es aún más valioso: permite comparar el nivel de seguridad entre diferentes IA antes de decidir cuál usar. Los investigadores advierten que esta necesidad será cada vez más urgente conforme la IA se vuelva más autónoma y capaz de tomar decisiones por su cuenta.
Fuente original: El Colombiano - Tecnología

