[:es]
- ¿Te imaginas un robot comprendiendo los gestos o las inflexiones de la voz de una persona? Gracias a la Inteligencia Artificial y el trabajo de un equipo de investigadores de la Universidad de Chile, se avanza en el desarrollo de tecnologías que hagan esto posible.
- Se trata del trabajo realizado por el Laboratorio de Procesamiento y Transmisión de Voz (LPTV) liderado por el Prof. Néstor Becerra, del DIE de la FCFM.
Néstor Becerra es académico titular del Departamento de Ingeniería Eléctrica de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile y parte del comité de expertos que participaron en la creación de la Política Nacional de Inteligencia Artificial.
A partir de sus líneas de trabajo ha liderado diferentes estudios, entre ellos un proyecto Fondecyt que indaga en la interacción humano-robot (Robust speech processing for human-robot interaction). Un trabajo liderado por el Laboratorio de Procesamiento y Transmisión de Voz (LPTV) de la U. de Chile, en donde participan ingenieros, y estudiantes de post y pre-grado y como institución asociada, la Universidad de La Frontera.
Según explica consiste en investigar y desarrollar tecnologías de IA y procesamiento de señales para procesar el lenguaje hablado de modo que los robots puedan caracterizar o perfilar a los seres humanos y también recibir comandos de estos.
“Esto es importante para que los robots en un futuro cercano puedan mejorar su aceptabilidad con las personas con las que están interactuando y, de acuerdo con la situación, adaptar sus estrategias de interacción. Esta caracterización de los seres humanos se puede dar en los ámbitos físico, cognitivo o social”, detalla el investigador.
Por ejemplo, en relación con los perfiles físicos pueden comprender las características del usuario relacionadas con sus movimientos, estado físico y salud; en el ámbito cognitivo podrían predecir, detectar y reconocer las intenciones del agente observado, es decir, reconocer las intenciones, los deseos, las creencias, los estados internos, la personalidad y las emociones de los individuos a menudo conocido como Theory of Mind.
En tanto, en los perfiles sociales pueden reconocer e interpretar las señales sociales mostradas por un ser humano. “Las señales sociales se pueden definir como comportamientos observables que producen cambios de comportamiento durante la interacción”, declara.
La voz: una ventana hacia la condición humana
El año 2014 Stephen Hawking, afirmaba en una entrevista en la BBC que “en el futuro, la inteligencia artificial podría desarrollar una voluntad propia, en conflicto con la nuestra. Se puede imaginar que una tecnología como ésta consiga burlar a los mercados financieros, sobrepasar a los investigadores humanos, manipular a líderes humanos y someterlos potencialmente con armas que ni siquiera podremos entender”.
El Dr. Becerra aclara que el estado actual de las tecnologías de IA solo permite abordar problemáticas específicas, por lo que se está lejos de simular lo que se conoce como conciencia, no obstante, reconoce un problema con la “Deep fake” que pueden derivar en la suplantación de identidad.
A pesar de ello, estima que el desarrollo de la IA no debiera verse afectado por esto.
En su caso, junto al equipo que lidera, han podido indagar en la información lingüística y paralingüística (por ejemplo, prosodia) que transmite el habla.
“Sin embargo, el análisis y el procesamiento del habla son muy sensibles a los entornos de ruido (incluido el efecto «cóctel»), el canal acústico que varía en el tiempo y la reverberación en escenarios que varían en el tiempo. Por este motivo estamos aplicando técnicas de IA y procesamiento de señales para abordar estos problemas. Además, aplicamos información visual de modo a poder utilizar diferentes fuentes de información”, añade.
Sin ir más lejos, en publicaciones recientes han podido abordar el rol del lenguaje hablado en la asociación colaborativa humano-robot, el problema del canal acústico variable en robótica móvil y la integración del movimiento de la cabeza del robot y del procesamiento de imágenes en beamforming acústico, los que pueden revisarse en la página del LPTV.
Conoce más sobre Néstor Becerra
Néstor Becerra Yoma es Ph.D. por la University of Edinburgh, UK, y magister e ingeniero eléctrico por la Universidad Estatal de Campinas UNICAMP, Brasil. Actualmente se desempeña como profesor titular en el Dpto. de Ingeniería Eléctrica de la Universidad de Chile donde creó el Laboratorio de Procesamiento y Transmisión de Voz en el cual investiga sobre inteligencia artificial y procesamiento de señales. Fue profesor visitante en Carnegie Mellon University, Pittsburgh, USA, entre 2016 y 2017. Ha dirigido numerosos proyectos de I+D, además de ser autor de decenas de artículos en journals y congresos de investigación internacionales, y de patentes. Sus intereses incluyen la investigación multidisciplinaria de inteligencia artificial y de procesamiento de señales en diversos campos de aplicación tales como la interacción hombre-robot, volcanología, salud, bio- acústica, sismología, etc. Es creador y organizador de la iniciativa IA2030CHILE, y participó del comité convocado por la “Comisión “Desafíos del Futuro, Ciencia, Tecnología e Innovación” del Senado para abordar del desarrollo de la inteligencia artificial en Chile. Es miembro del Comité Expertos en IA del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación. Creó el capítulo chileno de la IEEE Signal Processing Society.
Por Comunicaciones OpenBeauchef
[:]