ChatGPT de OpenAI comienza su aprendizaje en programación de robots industriales

OpenAI busca revolucionar la programación robótica poniendo a prueba a ChatGPT para saber si es capaz de pensar más allá del texto y razonar sobre el mundo físico

Seguramente has oído hablar de ChatGPT, el modelo de lenguaje natural de OpenAI desarrollado por Microsoft que está revolucionando el sector tecnológico por méritos propios. A simple vista podrías pensar que ha llegado para arrebatar la hegemonía a Google, que lo hará probablemente puesto que ha nacido para cambiar las normas de juego desde Bing, sin embargo su potencial va mucho más aña de lo que podamos imaginarnos.

Hace tan solo unos días Microsoft nos ha mostrado la capacidad que ofrece ChatGPT para resolver aplicaciones orientadas a la robótica. Todavía tiene mucho que evolucionar a nivel de programación para que sea plenamente autónomo, pero es un avance tecnológico en este ámbito como reconocen desde Microsoft.

El objetivo de Microsoft es comprobar si ChatGPT puede pensar más allá del texto y razonar sobre el mundo físico para ayudar con las tareas de robótica. Desde la compañía argumentan que “Queremos ayudar a las personas a interactuar con los robots más fácilmente, sin necesidad de aprender lenguajes de programación complejos o detalles sobre sistemas robóticos. El desafío clave aquí es enseñar a ChatGPT cómo resolver problemas considerando las leyes de la física, el contexto del entorno operativo y cómo las acciones físicas del robot pueden cambiar el estado del mundo».

Directorio de empresas de automatizacion

Para desarrollar esta tecnología basada en Inteligencia Artificial hay que proporcionar información detallada del problema, identificar el conjunto correcto de llamadas de función y API permitidas, y definir la estructura de respuesta con argumentos especiales. Para poder conseguir que ChatGPT sea autónomo en programación de robots, los investigadores del proyecto han identificado las claves de su evolución:

1. Primero, han definido una biblioteca de funciones de robot de alto nivel. Esta biblioteca puede ser específica para el factor de forma o el escenario de interés y debe asignarse a las implementaciones reales en la plataforma del robot mientras se nombra de manera suficientemente descriptiva para que ChatGPT la siga.

2. A continuación, han creado un aviso para ChatGPT que describe el objetivo al mismo tiempo que identifica el conjunto de funciones de alto nivel permitidas de la biblioteca. El indicador también puede contener información sobre restricciones o cómo ChatGPT debe estructurar sus respuestas.

3. El usuario se mantuvo al tanto para evaluar el código de salida de ChatGPT, ya sea mediante análisis directo o mediante simulación, y proporciona comentarios a ChatGPT sobre la calidad y la seguridad del código de salida.

4. Después de probar las implementaciones generadas por ChatGPT, el código final se puede implementar en el robot.

Ejemplos de robots controlados por ChatGPT

Los investigadores de Microsoft han presentado un ejemplo de manipulación de piezas por medio de un robot industrial. Para lograrlo utilizó comentarios conversacionales para enseñarle al modelo cómo componer las API proporcionadas originalmente en funciones de alto nivel más complejas que ChatGPT codificó por sí mismo. Usando una estrategia basada en el plan de estudios, el modelo pudo encadenar estas habilidades aprendidas de forma lógica para realizar operaciones como apilar bloques.

El modelo también pudo construir el logotipo de Microsoft con bloques de madera. Pudo recuperar el logotipo de Microsoft de su base de conocimiento interna, «dibujar» el logotipo como código SVG y luego usar las habilidades aprendidas anteriormente para descubrir qué acciones de robot existentes pueden componer su forma física

Desde Microsoft han reconocido que existen limitaciones con el uso de ChatGPT para programar robots, puesto que solo puede escribir el código en función del aviso inicial que le da un técnico. Un ingeniero debe de explicar detalladamente a ChatGPT cómo funciona la interfaz de programación para que no encuentre problemas a la hora de generar el código aplicable.

“Hacemos hincapié en que estas herramientas no deben tener el control total del sistema robótico la tubería de robótica, especialmente para aplicaciones críticas para la seguridad. Dada la propensión de los LLM a generar eventualmente respuestas incorrectas, es bastante importante garantizar la calidad de la solución y la seguridad del código con supervisión humana antes de ejecutarlo en el brazo robótico. Esperamos que sigan varios trabajos de investigación con las metodologías adecuadas para diseñar, construir y crear adecuadamente tuberías de prueba, validación y verificación para LLM que operan en el espacio de la robótica”.

“La mayoría de los ejemplos que presentamos en este trabajo demostraron bucles abiertos de percepción y acción en los que ChatGPT generaba código para resolver una tarea, sin proporcionar retroalimentación al modelo posteriormente. Dada la importancia de los controles de bucle cerrado en los bucles de percepción-acción, esperamos que gran parte de la investigación futura en este espacio explore cómo usar correctamente las capacidades de ChatGPT para recibir comentarios de tareas en forma de modalidades textuales o de propósito especial».

Más información: Openai.com

<img width="204" height="100" src="https://revistaderobots.com/wp-content/uploads/2020/11/cropped-RDR-grisoscuro-250x120-1-1.png" class="custom-logo" alt="REVISTA DE ROBOTS" decoding="async" />