Cómo la IA está homogeneizando el lenguaje periodístico

La prensa ha sido históricamente un canal donde aparecen palabras nuevas, giros expresivos y formas de describir hechos que luego se filtran al resto de la sociedad. Cuando un periódico introduce un término para nombrar una tecnología emergente, ese vocabulario pasa rápidamente a la conversación cotidiana. En ese contexto, los estudios sobre neologismos confirman que los medios son incubadoras de vocabulario útil para el público amplio.

Sin embargo, la entrada de los grandes modelos de lenguaje (LLM) en la rutina de los redactores plantea una pregunta importante: ¿qué ocurre con esa función de generación de palabras cuando gran parte del texto se escribe con ayuda de máquinas? Los modelos actuales operan prediciendo la siguiente palabra o “token” a partir de los patrones más frecuentes encontrados en los datos de entrenamiento. La consecuencia es una escritura fluida y creíble, pero también una tendencia a favorecer construcciones habituales y argumentos ya consolidados.

Este comportamiento no es, por sí mismo, un daño al idioma. El problema surge cuando la lógica de predicción estadística empieza a dominar la producción textual en el espacio público. Cuando los algoritmos se entrenan con textos que ya fueron generados por otras IA, se produce lo que la literatura académica denomina "colapso del modelo". En términos simples, cada nueva generación de IA incorpora una mayor proporción de contenido sintético, lo que reduce la exposición a la variación social que caracteriza al lenguaje humano.

El resultado es un ecosistema verbal más restringido. Menos contacto con la riqueza de matices, dialectos y usos locales puede traducirse en una disminución de la capacidad de la lengua para describir realidades complejas. Además, la homogeneización refuerza sesgos existentes: al entrenarse con datos cada vez más uniformes, los sistemas tienden a amplificar prejuicios ya presentes en los textos originales, en lugar de corregirlos. Investigaciones sobre la evolución de sesgos en LLM advierten que los bucles recursivos pueden magnificar actitudes discriminatorias.

En la práctica periodística, esta dinámica se manifiesta en una mayor repetición de estructuras sintácticas, un tono neutralizado y párrafos que siguen patrones predecibles. El periodismo no solo transmite información; también traduce conceptos especializados a un registro accesible, decide qué matices enfatizar y enseña nuevas formas de expresión. Si el lenguaje que circula en la esfera pública se vuelve demasiado uniforme, la capacidad del periodismo para ajustar su estilo a nuevas informaciones se ve limitada.

La consecuencia es una reducción de palabras poco comunes, construcciones menos habituales y de la "pragmática" —elementos como la ironía, la ambigüedad o la variación de puntos de vista que añaden profundidad a la comunicación. Los modelos entrenados con una mayor proporción de texto sintético muestran también un descenso en su desempeño al intentar abarcar la diversidad lingüística humana; tienden a preservar mejor el centro del idioma que sus bordes, donde se generan las innovaciones.

Muchas innovaciones lingüísticas nacen de desvíos inesperados, usos improbables o denominaciones locales. Cuando la IA prioriza la opción estadísticamente más probable, se reduce el espacio para que esas desviaciones se difundan y se consoliden. No se trata de un argumento abstracto sobre humano contra máquina, sino de una diferencia concreta entre un lenguaje que evoluciona gracias a la aleatoriedad social y un texto que reproduce regularidades aprendidas.

El impacto trasciende la cantidad de vocabulario disponible. Un lenguaje más vago o predecible debilita las herramientas que la sociedad usa para describir problemas, clarificar opiniones y sostener debates públicos. Si Internet se llena de textos sintéticos, lectores, periodistas e instituciones estarán expuestos a una menor diversidad verbal, lo que podría dificultar la articulación de ideas complejas.

Algunos estudios señalan que mezclar datos reales con texto generado no genera el mismo colapso, siempre que el contenido artificial no reemplace en su totalidad al humano. En otras palabras, el riesgo no proviene del uso ocasional de IA, sino de la sustitución masiva del escrito humano y su posterior retroalimentación como si fuera lenguaje vivo.

La integración de la IA en la edición ha incrementado la eficiencia de muchas salas de redacción, pero el costo potencial para la riqueza lingüística del discurso público es considerable. Si la prensa pierde, total o parcialmente, su rol de crear, traducir y enseñar nuevas formas de expresión, el efecto no solo afectará la jornada laboral de los periodistas, sino que también debilitará uno de los espacios más fértiles para la renovación del lenguaje colectivo.

Ante este escenario, los ejecutivos y directores de medios deben preguntarse: ¿cómo equilibrar la productividad que brinda la IA con la necesidad de preservar una lengua diversa y capaz de adaptarse a los cambios sociales?

Melina Rodríguez

También te puede interesar

Eco‑digitalismo: la ilusión verde que la IA está vendiendo

Microsoft controla la IA generativa en China: ¿beneficio o riesgo para la soberanía?

Soberanía digital europea: por qué OVHcloud debe liderar la IA local