Gargantilha com IA transforma fala silenciosa em voz audível
Tudo sobre Inteligência Artificial
Uma equipe da Pohang University of Science and Technology desenvolveu um dispositivo que pode mudar a forma como nos comunicamos. Trata-se de uma gargantilha de silicone equipada com sensores e inteligência artificial, capaz de transformar movimentos silenciosos do pescoço em fala audível, sem que a pessoa precise emitir som, segundo informações do portal New Atlas.Continua após a publicidadeO dispositivo funciona a partir de um princípio simples, mas pouco explorado: ao falar, não produzimos apenas som, mas também pequenos movimentos musculares no pescoço. Esses deslocamentos são únicos para cada palavra e funcionam como uma espécie de impressão digital da fala.Diferente de métodos anteriores, como eletromiografia e eletroencefalografia, que exigem equipamentos complexos e pouco práticos, a nova solução aposta em um sensor chamado Multiaxial Strain Mapping Sensor. Ele combina silicone flexível, câmera miniaturizada e sensores de movimento para mapear deformações da pele em tempo real.Para quem tem pressa:
Gargantilha converte movimentos do pescoço em fala audível;
Usa inteligência artificial treinada com a voz do usuário;
Funciona mesmo em ambientes extremamente barulhentos;
Exige menos de 10 minutos de treinamento inicial;
Pode auxiliar pacientes com distúrbios de fala;
Ainda limitado a vocabulário restrito e movimentos controlados.
Inteligência artificial recria voz do usuárioOs dados captados pelo sensor são enviados para um modelo de inteligência artificial treinado com a voz do próprio usuário. Esse sistema identifica quais palavras foram articuladas e as converte em áudio sintético com características muito próximas da fala original.
O dispositivo capta pequenas deformações da pele durante a articulação silenciosa das palavras, sem necessidade de emissão sonora. (Imagem: POSTECH/Divulgação) – O dispositivo capta pequenas deformações da pele durante a articulação silenciosa das palavras, sem necessidade de emissão sonora. (Imagem: POSTECH/Divulgação)Nos testes, a equipe utilizou o alfabeto fonético da OTAN, conhecido por facilitar a comunicação em ambientes difíceis. O sistema alcançou 85,8% de precisão ao reconhecer 26 palavras diferentes. Além disso, o treinamento do modelo de voz leva menos de 10 minutos.
Outro ponto de destaque é a resistência ao ruído. Mesmo em ambientes com cerca de 90 decibéis, equivalentes a um canteiro de obras, o dispositivo manteve bom desempenho, superando sistemas tradicionais baseados em sinais musculares.Leia mais: Aplicações vão além da medicinaA tecnologia pode beneficiar pacientes com distúrbios de fala, incluindo pessoas que passaram por remoção da laringe. No entanto, seu uso não se limita à área médica. Ambientes industriais, operações de emergência e até cenários militares podem se beneficiar da comunicação silenciosa.
Nos testes, o sistema atingiu 85,8% de precisão e manteve bom desempenho mesmo em ambientes com ruído intenso. (Imagem: fizkes/Shutterstock) – Nos testes, o sistema atingiu 85,8% de precisão e manteve bom desempenho mesmo em ambientes com ruído intenso. (Imagem: fizkes/Shutterstock)Continua após a publicidadePesquisas semelhantes já foram conduzidas pela Universidade de Cambridge, que também desenvolveu protótipos capazes de interpretar fala silenciosa. Em versões mais recentes, os sistemas chegaram a identificar até o estado emocional do usuário.Apesar do avanço, o sistema ainda enfrenta limitações. Ele opera com um vocabulário fixo e perde precisão quando o usuário se movimenta muito. Ainda assim, representa um passo relevante rumo a interfaces mais naturais entre humanos e máquinas.Você pode conferir mais informações ao acessar a publicação do jornal da Pohang clicando aqui. Já a pesquisa pode ser lida aqui.
Wagner Edwards
Wagner Edwards é Bacharel em Jornalismo e atua como Analista de SEO e de Conteúdo no Olhar Digital. Possui experiência, também, na redação, edição e produção de textos para notícias e reportagens.
Ver todos os artigos →