Mana: cómo una animación simplifica la manipulación de herramientas articuladas

Una nueva plataforma llamada Mana transforma la manipulación de herramientas con partes móviles en un problema de animación, logrando transferencia directa de simulación a robot real sin entrenamiento previo.

Mana: cómo una animación simplifica la manipulación de herramientas articuladas

Los robots que deben usar herramientas con articulaciones – como pinzas, tenazas o jeringas – siguen siendo un reto porque tienen que coordinar dedos y fuerzas mientras el propio objeto cambia de forma. El proyecto Mana (Manipulation Animator) propone tratar esa tarea como una animación por tramos: primero se generan posiciones clave de agarre de forma automática y luego se rellenan los movimientos intermedios con planificación y aprendizaje por refuerzo.

El proceso de generación de datos

Mana parte de una malla 3D del objeto y de unas pocas marcas que indican las áreas funcionales (por ejemplo, el mango de las pinzas). Con menos de un minuto de interacción, el sistema crea cientos de "keyframes" de agarre que cubren distintas configuraciones del mecanismo. Cada keyframe incluye la posición de los dedos, la postura de la muñeca y la configuración interna del artefacto.

Patrocinado Advertisement

Una vez que el esqueleto de la maniobra está listo, el pipeline se divide en tres fases. La primera, pre‑agarre, usa un planificador RRT‑Connect acelerado por GPU para trazar una trayectoria libre de colisiones hasta una postura cercana al agarre. La segunda, el propio agarre, puede ser una simple inserción de los dedos siguiendo la normal de la superficie o, cuando la geometría lo requiere, una política de refuerzo de corto horizonte que aprende a aplicar la fuerza adecuada sin que el objeto se resbale. La tercera fase, la actorización interna, siempre recurre a refuerzo para generar la fuerza precisa que cierra o abre la herramienta mientras mantiene contactos estables.

Los datos resultantes – trayectorias completas con etiquetas de fase (agarrar, abrir, cerrar) – se usan para entrenar una política visual basada en nubes de puntos. El modelo, un transformador tipo Perceiver combinado con un cabezal de difusión, recibe la nube de puntos del objeto (aprox. 512 puntos) y la información de los sensores del robot, y devuelve comandos delta para la muñeca y los dedos. Todo el entrenamiento ocurre en la simulación de IsaacLab; no se recopila demostración humana alguna.

Resultados en el mundo real

Mana se probó con cuatro tipos de herramientas – tenazas, pinzas, jeringas y ropa con pinzas – cada una en dos variantes de tamaño y tipo de articulación. Los objetos miden entre 0,8 y 1,5 cm de grosor y requieren entre 3 y 7 N para activarse. El robot consta de un brazo xArm7 de 7 DOF y una mano Allegro de 16 DOF, a la que se le añadieron yemas blandas de silicona para ampliar la zona de contacto.

En 10 intentos por herramienta, la solución de Mana alcanzó una tasa de éxito cercana al 80 % tanto en el agarre como en la manipulación en mano, superando con claridad a dos comparativas: una política abierta que ejecuta trayectorias generadas sin adaptación (≈ 50 % de éxito) y un operador humano mediante teleoperación basada en posición (≈ 30 %). Los fallos observados estaban ligados a errores de percepción menores que desplazaban el objetivo de la herramienta, o a la falta de fuerza suficiente en la teleoperación, que no logra generar los pellizcos necesarios en objetos tan delgados.

Un estudio de ablación mostró que la cantidad de trayectorias de entrenamiento y la diversidad de configuraciones de agarre influyen directamente en la robustez: doblar el número de keyframes de 1 k a 8 k elevó la tasa de éxito de 0,6 a 0,8. Además, la aleatorización de fuerzas, ganancias de control y fricción durante el entrenamiento resultó esencial para que la política resistiera variaciones de masa y de coeficiente de fricción en el mundo real.

Limitaciones y próximos pasos

El hardware actual no supera los 0,7 Nm de torque por dedo, lo que impide manipular herramientas que requieran más de 10 N, como gatillos de alta resistencia. Asimismo, la mano Allegro, dos veces más grande que una mano humana, no permite agarres de potencia sobre mangos ultrafinos, por lo que el estudio se centró en agarres de precisión. La detección de deslizamiento bajo oclusión y la manipulación de objetos diminutos siguen siendo desafíos que demandarán sensores táctiles de alta frecuencia. Por último, aunque la política integra la fase de agarre y la de actuación, la transición del agarre al movimiento del muñecón sigue requiriendo teleoperación manual; automatizar esa última pieza será el siguiente objetivo.

Para los ejecutivos que evalúan inversiones en robótica de fabricación o logística, Mana muestra que es posible crear, a bajo costo de tiempo de ingeniería, un repertorio de habilidades de manipulación de herramientas articuladas sin necesidad de recopilar miles de demostraciones reales. La combinación de generación procedural de datos, planificación eficiente y refuerzo focalizado permite escalar rápidamente a nuevas herramientas, mientras que la política basada en visión garantiza que el conocimiento adquirido en la simulación se transfiera directamente a la planta. En una era donde la flexibilidad de los sistemas de ensamblaje es clave, contar con robots capaces de agarrar y operar piezas con articulaciones sin re‑entrenamiento abre la puerta a líneas de producción más adaptables y a una reducción significativa del tiempo de puesta en marcha de nuevos productos.

Elvyn Peguero

Escrito por

Elvyn Peguero

Consultor digital e IA

Consultor de transformación digital e inteligencia artificial con más de 15 años navegando la intersección entre tecnología, gobierno y empresa. Arquitectó el Framework Normativo TIC del Estado Dominicano y ha liderado proyectos de IA aplicada en sectores públicos y privados desde Bewos AI Consulting. Editor para República Dominicana en ITNOW durante seis años, donde desarrolló un ojo clínico para explicar tecnología compleja en lenguaje que cualquier ejecutivo puede entender.

Ver todos sus artículos →