Sistema de inteligencia artificial de Google reconocerá voces y ruidos

Los investigadores de la empresa estadounidense Google han desarrollado un nuevo modelo de aprendizaje audiovisual, para enseñar a la inteligencia artificial del sistema operativo a reconocer el habla en medio de otras voces o ruidos.Este mecanismo esta enfocado principalmente para los asistentes personales de los dispositivos móviles, a través de los cuales el sistema de inteligencia artificial del buscador podrá reconocer las voces de sus usuarios y los sonidos del ambiente que los rodea.

En un principio, el equipo enseñó a su modelo de una red neuronal a reconocer el habla de personas específicas y luego la entrenó a distinguir sus palabras en medio de otras múltiples voces, creando una especie de ‘fiestas’ virtuales, una mezcla de videos con distintos hablantes.

Tras analizar la mímica y las voces de los hablantes, la red neuronal aprendió a reconocerlas y aislarlas de los demás ruidos, generando pistas individuales con las palabras de cada hablante analizado.

Para elaborar su modelo de aprendizaje audiovisual, los investigadores utilizaron 100.000 videos de alta calidad de YouTube con grabaciones de distintas conferencias y discursos.

La tecnología puede mejorar el procesamiento del habla durante las videoconferencias o videollamadas, sobre todo en situaciones con varios hablantes.

“Demostramos que nuestro método es aplicable tanto a las tareas clásicas de la separación de voz, como a las situaciones reales durante las acaloradas entrevistas, en bares ruidosos y con niños gritando”, señalan los autores del estudio sobre el nuevo modelo. Lo único que se requiere del usuario es especificar la cara de la persona del vídeo cuyo discurso le interesa, agregan.

Información de: Noticias 24