Con solo mirar la imagen de destino de una palabra o boceto, el robot puede reproducir cada trazo como una acción continua gracias a un algoritmo desarrollado por científicos de la Universidad Brown.
El algoritmo permite así que sea muy difícil para nosotros distinguir si el texto fue fue escrito por el robot o si fue escrito por un humano.
Deep Learning
El algoritmo hace uso de redes de aprendizaje profundo (deep learning) que analizan imágenes de palabras escritas a mano o bocetos y pueden deducir la serie probable de trazos a lápiz que los creó. El algoritmo se entrenó utilizando un conjunto de caracteres japoneses hasta pudo reproducir los caracteres y los trazos que los crearon con aproximadamente el 93% de precisión.
El algoritmo terminó reproduciendo tipos de caracteres muy diferentes que nunca había visto: letras en inglés y en cursiva, por ejemplo. Según explican los autores:
Para ilustrar el funcionamiento de nuestro sistema en varios entornos robóticos, probamos nuestro modelo con dos robots, Baxter y Movo. Aplicamos directamente nuestro modelo entrenado al entorno robótico real, lo que crea una necesidad de procesar la imagen objetivo original para que coincida con el formato de imagen de nuestros datos de entrenamiento.
Utilizando un modelo global que considera la imagen como un todo, el algoritmo identifica un punto de partida probable para realizar el primer trazo. Una vez que el trazo ha comenzado, el algoritmo se acerca, mirando la imagen píxel por píxel para determinar dónde debe ir ese trazo y cuánto tiempo debe durar. Cuando llega al final del trazo, el algoritmo vuelve a llamar al modelo global para determinar dónde debe comenzar el siguiente trazo, y luego regresa al modelo ampliado. Y así sucesivamente.