Processamento de linguagem natural ou PNL é um ramo da inteligência artificial que tem muitas implicações importantes nas formas como os computadores e os seres humanos interagem. A linguagem humana, desenvolvida ao longo de milhares e milhares de anos, tornou-se uma forma diferenciada de comunicação que carrega uma riqueza de informações que muitas vezes transcendem as palavras sozinhas. A PNL se tornará uma tecnologia importante para preencher a lacuna entre a comunicação humana e os dados digitais. Aqui estão 5 maneiras que o processamento de linguagem natural será usado nos próximos anos.
Maquina de tradução
Como as informações do mundo estão online, a tarefa de tornar esses dados se torna cada vez mais importante. O desafio de tornar as informações do mundo acessíveis a todos, além das barreiras de idioma, simplesmente superou a capacidade de tradução humana. Empresas inovadoras como a Duolingo estão procurando recrutar grandes quantidades de pessoas para contribuir, coincidindo os esforços de tradução com o aprendizado de um novo idioma. Mas a tradução automática oferece uma alternativa ainda mais escalável para harmonizar as informações do mundo. O Google é uma empresa na vanguarda da tradução automática, usando um mecanismo estatístico proprietário para seu serviço de tradução do Google. O desafio das tecnologias de tradução automática não está em traduzir palavras, mas em preservar o significado de sentenças, uma questão tecnológica complexa que está no centro da PNL.
Combate ao Spam
Os filtros de spam tornaram-se importantes como a primeira linha de defesa contra o problema cada vez maior de e-mails indesejados. Mas quase todo mundo que usa o e-mail extensivamente sofreu agonia por e-mails indesejados que ainda são recebidos ou por e-mails importantes que foram acidentalmente capturados no filtro. As questões falso-positivas e falsas-negativas dos filtros de spam estão no centro da tecnologia da PNL, mais uma vez resumindo-se ao desafio de extrair significado das sequências de texto. Uma tecnologia que tem recebido muita atenção é a filtragem de spam bayesiana, uma técnica estatística na qual a incidência de palavras em um e-mail é medida em comparação à sua ocorrência típica em um conjunto de e-mails de spam e não-spam.
Extração de Informações
Muitas decisões importantes nos mercados financeiros estão cada vez mais se afastando da supervisão e controle humanos. O comércio algorítmico está se tornando mais popular, uma forma de investimento financeiro totalmente controlado pela tecnologia. Mas muitas dessas decisões financeiras são impactadas pelas notícias, pelo jornalismo que ainda é apresentado predominantemente em inglês. Uma tarefa importante, então, da PNL tornou-se tomar esses anúncios de texto simples e extrair as informações pertinentes em um formato que pode ser considerado em decisões de negociação algorítmica. Por exemplo, as notícias de uma fusão entre empresas podem ter um grande impacto nas decisões de negociação e a velocidade com que os detalhes da fusão, jogadores, preços, quem adquire quem pode ser incorporado em um algoritmo de negociação podem ter implicações de lucro no mercado. milhões de dólares.
Resumo
A sobrecarga de informação é um fenômeno real em nossa era digital e já nosso acesso ao conhecimento e à informação excede em muito nossa capacidade de entendê-la. Essa é uma tendência que não mostra sinais de desaceleração e, portanto, a capacidade de resumir o significado de documentos e informações está se tornando cada vez mais importante. Isso é importante não apenas ao nos permitir a capacidade de reconhecer e absorver as informações pertinentes de grandes quantidades de dados. Outro resultado desejado é compreender significados emocionais mais profundos, por exemplo, com base em dados agregados das mídias sociais, uma empresa pode determinar o sentimento geral de sua mais recente oferta de produtos? Esse ramo da PNL se tornará cada vez mais útil como um valioso ativo de marketing.
Pergunta Respondendo
Os mecanismos de busca colocam a riqueza de informações do mundo ao alcance de nossas mãos, mas ainda são geralmente muito primitivas quando se trata de responder a questões específicas colocadas por seres humanos. O Google viu a frustração que isso causou nos usuários, que muitas vezes precisam experimentar vários resultados de pesquisa diferentes para encontrar a resposta que estão procurando. Um grande foco dos esforços do Google na PNL tem sido reconhecer questões de linguagem natural, extrair o significado e fornecer a resposta, e a evolução da página de resultados do Google mostrou esse foco. Embora certamente esteja melhorando, esse continua sendo um grande desafio para os mecanismos de busca e uma das principais aplicações da pesquisa em processamento de linguagem natural.