Lentes equipados con inteligencia artificial pueden descifrar palabras no dichas
Los investigadores han demostrado una interfaz portátil de bajo consumo que requiere solo unos minutos de datos de entrenamiento del usuario para reconocer el habla silenciosa.

Las personas que no pueden producir sonidos vocales tienen dificultades para expresarse. Una tecnología que puede restaurar su capacidad de hablar puede beneficiarlos de muchas maneras.
Investigadores de la Universidad de Cornell han desarrollado una interfaz silenciosa de reconocimiento de palabras utilizando inteligencia artificial y detección acústica, reconociendo hasta 31 comandos que no son de voz de los movimientos de los labios y la boca. EchoSpeech es una interfaz portátil de bajo consumo que necesita datos mínimos de capacitación del usuario, se ejecuta en un teléfono inteligente y puede reconocer comandos. EchoSpeech permite la comunicación con teléfonos inteligentes en lugares ruidosos o silenciosos y se puede combinar con un lápiz óptico para software de diseño como CAD, lo que reduce la necesidad de un teclado y un mouse.
La mayoría de las tecnologías silenciosas de reconocimiento de voz generalmente se limitan a comandos preestablecidos y requieren que la cámara se apunte o se use, lo cual es poco práctico e inviable. Surgen problemas de privacidad con las cámaras portátiles para el usuario y quienes lo rodean. La tecnología de detección acústica de EchoSpeech elimina la necesidad de cámaras corporales y requiere menos ancho de banda de procesamiento que los datos de imagen o video. Luego se puede reenviar a un teléfono inteligente a través de Bluetooth en tiempo real.
Los investigadores creen que la información sensible a la privacidad siempre permanece bajo control ya que los datos se procesan localmente en el teléfono inteligente en lugar de cargarse en la nube.
Referencia: Conferencia: chi2023.acm.org/ Búsqueda: ruidongzhang.com/files/papers/ … _authors_version.pdf