Skip to main content

O que é reconhecimento de fala?

DAR DEMAIS E SER REJEITADA - Tiro no Pé 1 #233 (Abril 2025)

DAR DEMAIS E SER REJEITADA - Tiro no Pé 1 #233 (Abril 2025)
Anonim

O reconhecimento de fala é uma tecnologia que permite a entrada de voz nos sistemas. Você fala com seu computador, telefone ou dispositivo e usa o que você disse como entrada para acionar alguma ação. A tecnologia está sendo usada para substituir outros métodos de entrada, como digitar, clicar ou selecionar de outras maneiras. É um meio de tornar os dispositivos e softwares mais fáceis de usar e aumentar a produtividade.

Há uma abundância de aplicações e áreas onde o reconhecimento de fala é usado, incluindo as forças armadas, como uma ajuda para pessoas com deficiência (imagine uma pessoa com aleijado ou sem mãos ou dedos), no campo médico, em robótica etc. quase todos estarão expostos ao reconhecimento de fala devido à sua propagação entre dispositivos comuns, como computadores e telefones celulares.

Certos smartphones estão fazendo uso interessante do reconhecimento de fala. Os dispositivos iPhone e Android são exemplos disso. Através deles, você pode iniciar uma chamada para um contato apenas obtendo instruções de voz como "Call office". Outros comandos também podem ser usados, como "Ativar o Bluetooth".

Problemas com reconhecimento de fala

O reconhecimento de fala, em sua versão conhecida como Speech to Text (STT), também é usado há muito tempo para traduzir palavras faladas em texto. "Você fala, digita", como o ViaVoice diria em sua caixa. Mas há um problema com o STT como o conhecemos. O ViaVoice é um dos melhores do setor, então imagine o resto. A tecnologia amadureceu e melhorou, mas o discurso ao texto ainda faz com que as pessoas façam perguntas. Uma de suas principais dificuldades é a imensa variação entre as pessoas em pronunciar palavras.

Nem todas as linguagens são supostas no reconhecimento de fala, e as que geralmente não são suportadas, assim como o inglês. Como resultado, a maioria dos dispositivos que executam o software de reconhecimento de fala executam razoavelmente apenas em inglês.

Um conjunto de requisitos de hardware dificulta o reconhecimento de fala em determinados casos. Você precisa de um microfone que seja inteligente o suficiente para filtrar o ruído de fundo, mas ao mesmo tempo poderoso o suficiente para capturar a voz naturalmente.

Falando em ruído de fundo, isso pode fazer com que um sistema inteiro falhe. Como resultado, o reconhecimento de fala falha em muitos casos devido a ruídos que estão fora do controle do usuário.

O reconhecimento de voz está provando ser melhor como um método de entrada para novos telefones e tecnologias de comunicação como o VoIP, do que como uma ferramenta de produtividade para entrada de texto em massa.

Aplicações de reconhecimento de fala

A tecnologia está ganhando popularidade em muitas áreas e tem obtido sucesso no seguinte:

  • Controle de dispositivos. Basta dizer "OK ​​Google" para um telefone Android que aciona um sistema que é todo ouvidos para seus comandos de voz.
  • Sistemas de carro Bluetooth. Muitos carros são equipados com um sistema que conecta seu mecanismo de rádio ao smartphone por meio de Bluetooth. Você pode então fazer e receber chamadas sem tocar em seu smartphone, e pode até mesmo discar números apenas dizendo-lhes.
  • Transcrição de voz. Em áreas onde as pessoas têm que digitar muito, alguns softwares inteligentes capturam suas palavras faladas e as transcrevem em texto. Isso é atual em certos softwares de processamento de texto. A transcrição de voz também funciona com o correio de voz visual.