Cómo definir explicaciones útiles y por qué los LLM las complican

Los académicos Louis Mahon, Elliot Ford y Callum Hackett publicaron este 12 de junio de 2026 un trabajo que retoma una discusión filosófica de siglos: ¿qué constituye una explicación válida? En el marco de la inteligencia artificial, la pregunta cobra urgencia porque la adopción de sistemas automáticos depende de la capacidad de ofrecer razones comprensibles a sus usuarios.

Los autores plantean una definición inspirada en los llamados counterfactual explanations, es decir, explicaciones que describen qué habría ocurrido si ciertos hechos hubieran sido diferentes. Sin embargo, añaden un componente que hasta ahora recibía poca atención: la necesidad de considerar las creencias previas del interlocutor sobre cada hecho que se propone. En otras palabras, una explicación no solo debe describir un escenario alternativo, sino también alinearse con lo que la persona ya asume como cierto o dudoso.

Para ilustrar su propuesta, el equipo analiza tres situaciones típicas en las que un modelo de lenguaje (LLM) genera una respuesta: (1) respuesta factual con datos ambiguos, (2) recomendación basada en preferencias implícitas y (3) generación de texto creativa que otorga sentido a una petición vaga. En cada caso, la calidad de la explicación depende de cuán bien el modelo supere la brecha entre la información disponible y las expectativas del usuario. Cuando el LLM ignora una creencia previa—por ejemplo, asume que el usuario conoce una normativa específica que en realidad desconoce—la explicación pierde valor, aunque sea lógicamente consistente.

El estudio detalla cinco implicaciones para la práctica empresarial. Primero, la evaluación de explicaciones debe incluir métricas que capturen la alineación con los conocimientos previos del cliente, no solo la corrección factual. Segundo, los equipos de IA necesitan incorporar módulos de modelado de creencias que actualicen continuamente el perfil del interlocutor a partir de interacciones anteriores. Tercero, la generación de contra‑hechos debe estar acompañada de un “contextualizador” que explique por qué ese contra‑hecho es relevante para la creencia que se está cuestionando. Cuarto, la infraestructura de datos debe permitir rastrear la procedencia de cada hecho usado en la explicación, garantizando trazabilidad y confianza. Finalmente, la metodología sugiere que los procesos de auditoría de IA incluyan revisiones de cómo se manejan las creencias implícitas, evitando que se refuercen sesgos ocultos.

Los autores destacan que los LLM presentan obstáculos particulares. Su arquitectura de atención distribuida facilita la producción de respuestas coherentes, pero rara vez incorpora una representación explícita de las creencias del interlocutor. Además, los entrenamientos masivos en datos públicos generan una “sabiduría de conjunto” que puede contradecir las premisas personales del usuario sin que el modelo lo detecte. Estas limitaciones hacen que la generación de explicaciones contra‑hechos alineadas con creencias sea más costosa computacionalmente y menos fiable en entornos críticos como la atención médica o la regulación financiera.

En términos de negocio, la proposición de Mahon y sus colegas implica que las empresas que dependen de LLM para tomar decisiones automatizadas deben invertir en capas adicionales de personalización. No basta con desplegar un modelo preentrenado; se requiere un subsistema que capture, actualice y contraste continuamente las creencias del cliente, y que, al generar una respuesta, produzca una explicación que conecte con esa base cognitiva. El costo extra de este enfoque puede verse compensado por una mayor aceptación del cliente, menos incidencias de decisiones erróneas y una menor exposición a riesgos regulatorios ligados a la opacidad algorítmica.

En la práctica, la recomendación es iniciar con pilotos en dominios donde las creencias del usuario estén bien definidas—por ejemplo, asistentes de soporte técnico con historiales de tickets. Allí, la retroalimentación directa permite afinar los perfiles de creencia y medir el impacto de explicaciones más adaptadas. Con datos de esos experimentos, se podrá escalar la solución a áreas más complejas, como la generación de contratos legales o la evaluación de riesgos crediticios, donde la confianza en la explicación es determinante.

Este trabajo no solo redefine qué significa “buena explicación” en la era de los LLM, sino que también traza un camino claro para que las organizaciones transformen esa teoría en una ventaja competitiva. Al reconocer y modelar las creencias previas de sus usuarios, las empresas pueden convertir la opacidad de los algoritmos en una conversación más transparente y orientada a la toma de decisiones informada.

Elvyn Peguero