Control y Generación de Refuerzo a partir de la Observación del Comportamiento Humano

Este trabajo se enmarca dentro de la investigación realizada por nuestro grupo para obtener robots capaces de aprender a partir de su interacción con el entorno y la observación del comportamiento de los seres humanos. El principal objetivo es que los robots puedan aprender y adaptarse a diferentes entornos reduciendo e incluso eliminando la necesidad de la supervisión de expertos en robótica. Se propone un sistema que genera una realimentación (refuerzo) válida para guiar el aprendizaje de un robot móvil. La idea es conseguir un robot capaz de moverse dentro de un edificio del mismo modo en que lo hacen los seres humanos, por las mismas regiones y siguiendo los mismos caminos. Para conseguirlo se han emplazado una serie de cámaras en el entorno para observar el movimiento de las personas. Con esta información se evita la necesidad de predefinir los comportamientos del robot y se reduce la necesidad de un experto. Por otra parte se muestra cómo se pueden utilizar esas cámaras para teleoperar un robot móvil. En este trabajo se muestran los resultados obtenidos hasta ahora en la generación automática de refuerzo y en el control de robots móviles. Se han utilizado los robots Surveyor y Pioneer 3DX en los corredores del Departamento de Electrónica.

Palabras clave: Aprendizaje por Refuerzo, Generación de Refuerzo, Visión por Computador, Robótica Móvil