Inicialización diversa de consultas mejora la búsqueda agente

Un método sin entrenamiento llamado DivInit reduce la redundancia en la primera ronda de búsquedas paralelas, logrando incrementos de 5‑7 puntos en pruebas de respuesta multi‑paso sin aumentar costos computacionales.

Los sistemas de búsqueda agente suelen escalar en tiempo de ejecución aumentando la profundidad de los diálogos o la cantidad de recorridos paralelos. En el último estudio de Murali, Coelho y colaboradores, el foco está en la escala por amplitud: se muestra que la práctica habitual de generar consultas independientes en cada ejecución paralela pierde eficacia porque las primeras preguntas tienden a ser similares, lo que produce recuperación de evidencia redundante y limita la diversidad de los caminos posteriores.

DivInit, la propuesta del equipo, actúa solo en el primer turno. En lugar de lanzar k consultas separadas, el modelo genera n candidatos en una única llamada, de los cuales se seleccionan k preguntas que maximicen la distancia semántica entre ellas. Estas consultas seleccionadas se usan entonces como semillas de k hilos paralelos que continúan el proceso de búsqueda.

Los autores evaluaron la técnica con cinco modelos de código abierto y ocho benchmarks de preguntas de varios pasos. En todos los casos, DivInit superó al muestreo paralelo tradicional manteniendo la misma carga computacional. Los beneficios se tradujeron en mejoras promedio de cinco a siete puntos en métricas de precisión multi‑hop, sin requerir ajustes de pesos ni entrenamiento adicional.

Para una organización que despliegue agentes de búsqueda, el hallazgo implica varios pasos operativos: primero, incorporar una fase de generación múltiple de consultas iniciales y aplicar un algoritmo de selección de diversidad antes de iniciar los hilos paralelos; segundo, validar que el número de candidatos (n) sea suficiente para obtener k consultas verdaderamente distintas, lo que puede requerir ajustes según el modelo base; tercero, monitorizar la correlación entre las consultas iniciales y la cobertura de evidencias recuperadas, de modo que se eviten cuellos de botella de redundancia.

No se reportan costos adicionales más allá de la llamada extra para generar n candidatos, que está cubierta por la misma ventana de inferencia del modelo. La intervención es independiente del dominio y no necesita datos de entrenamiento ni cambios en la arquitectura del agente, lo que facilita su adopción en pipelines existentes.

En síntesis, al diversificar la fase de arranque de la búsqueda, DivInit permite que los recursos computacionales invertidos en paralelismo se utilicen de forma más eficiente, incrementando la calidad de las respuestas sin comprometer el presupuesto de procesamiento. Las empresas que dependen de agentes de búsqueda para soporte al cliente, investigación interna o extracción de información deberían evaluar la integración de esta estrategia para evitar la saturación de evidencia y mejorar la robustez de sus sistemas.

Henry González

También te puede interesar

Eco‑digitalismo: la ilusión verde que la IA está vendiendo

Microsoft controla la IA generativa en China: ¿beneficio o riesgo para la soberanía?

Soberanía digital europea: por qué OVHcloud debe liderar la IA local