Google facilita las videoconferencias con lenguaje de signos

💻 ¡Rebajas! ¡Clave auténtica de Windows 11 Pro por solo 13.63€! [ Saber más ]

Todas las herramientas de videollamadas con múltiples participantes tienen la funcionalidad de centrar la imagen en la persona que está hablando.

Eso está genial si el habla es la forma de comunicación. Sin embargo, el lenguaje de signos no activa esos algoritmos, lo que supone un problema para las personas que se comunican así.

Por suerte, una investigación de Google podría cambiar eso. La compañía ha creado un motor de detección de lenguaje de señas en tiempo real que puede saber cuándo alguien está haciendo signos (en lugar de sólo moverse) y cuándo ha terminado.

Aunque esto es algo trivial para los humanos, es más difícil para un sistema de videollamadas que solo retransmite imágenes y sonido.

Un nuevo artículo de los investigadores de Google muestra cómo se puede hacer con eficiencia y con muy poca latencia.

El sistema primero pasa el video a través de un modelo llamado PoseNet, que estima las posiciones del cuerpo y las extremidades en cada cuadro. Esta información visual simplificada (esencialmente una figura con palos) se envía a un modelo entrenado con datos de poses de personas que usan el lenguaje de signos.

Este proceso consigue un 80 por ciento de precisión en la predicción de si una persona está usando lenguajes de signos, y con alguna optimización adicional obtiene hasta un 91,5 por ciento de precisión.

Este sistema también puede utilizarse con herramientas de videoconferencia existentes mediante un pequeño truco.

Utiliza una fuente de audio virtual para generar un tono de 20 kHz, que está fuera del rango de audición humana, pero que es detectado por los micrófonos de los ordenadores. Esta señal se genera siempre que la persona está haciendo señas, haciendo que los algoritmos de detección del habla piensen que está hablando en voz alta.

🧹🪣 ¡Conga 8290! ¡Conoce el robot aspirador con mejor calidad-precio que he probado! [Más info ]

¿Cuál es tu reacción?
Sorprendido
0%
Feliz
33%
Indiferente
0%
Triste
0%
Enfadado
0%
Aburrido
0%
Incrédulo
0%
¡Buen trabajo!
67%
Sobre el Autor
Luis A.
Luis es el creador y editor jefe de Teknófilo. Se aficionó a la tecnología con un Commodore 64 e hizo sus pinitos programando gracias a los míticos libros de 🛒 'BASIC para niños' con 11 años. Con el paso de los años, la afición a los ordenadores se ha extendido a cualquier cacharrito que tenga una pantalla y CPU.
Comentarios
Deja un comentario

Deja un comentario