Aprendizado de máquina na prática: como o Alexa da Amazon realmente funciona?

Levou décadas para os cientistas entenderem a fala humana natural a ponto de interfaces ativadas por voz, como Alexa, o sistema de processamento de linguagem natural da Amazon, estarem suficientemente habilitadas para serem aceitas com sucesso pelos consumidores. Alexa é quem fala com os usuários dos produtos Echo da Amazon, incluindo o Echo, Dot e Tap, bem como o Amazon Fire TV e outros produtos de terceiros. Mesmo desde 2012, quando a patente foi registrada para o que acabaria se tornando o sistema de inteligência artificial Alexa da Amazon, houve um tremendo crescimento nas capacidades e o crédito por esse crescimento vai para o aprendizado de máquina. Diz a equipe Gazeta Mineira.

Para algo que fazemos todos os dias sem pensar, a conversa entre máquinas e humanos é complexa. Então, como a Amazon e outros no espaço, como Google, Apple e Microsoft, decifraram o código?

O que acontece quando você fala com Alexa?

O Alexa pode ser encontrado em vários dispositivos, mas os smartphones e os alto-falantes inteligentes Echo são os dois mais comuns. A série de dispositivos Echo da Amazon é basicamente direta – um alto-falante, um pequeno computador e uma conexão com a Internet.

Certamente não há espaço ou tecnologia suficiente dentro da maioria dos alto-falantes Echo para manter uma inteligência artificial complexa, então como o Alexa responde a perguntas? Tal como acontece com muitas coisas nos dias de hoje, é tudo graças à magia da internet. O que acontece quando você pede ao seu dispositivo habilitado para Alexa para fazer algo é que ele grava o que você está dizendo e o envia para o serviço de reconhecimento de voz da Amazon.

Esse serviço, conhecido como Alexa Voice Service (AVS), descobre o que você está pedindo e envia rapidamente as informações corretas de volta ao seu dispositivo e as reproduz nos alto-falantes.

Fonte de reprodução: Adobe Stock

ABC da Alexa

Mais de 30 milhões de alto-falantes inteligentes foram vendidos globalmente no ano passado, e esse número deve crescer para quase 60 milhões este ano . Embora a Amazon continue sendo a líder do setor em alto-falantes inteligentes, vendendo cerca de 20 milhões de dispositivos no ano passado , outros (especialmente o Google) também estão crescendo e começando a se atualizar. Existem nuances para cada um, mas vamos olhar “sob o capô” de um Echo para ver como o Alexa funciona.

Embora haja algum recurso contido no cilindro Echo, como alto-falantes, um microfone e um pequeno computador que pode ativar o sistema e piscar suas luzes para que você saiba que está ativado, seus recursos reais ocorrem quando ele envia o que você disse ao Alexa para o cloud a ser interpretado pelo Alexa Voice Services (AVS) .

Então, quando você pergunta ao Alexa: “Como vai estar o tempo hoje?”, o dispositivo grava sua voz. Em seguida, essa gravação é enviada pela Internet para o Alexa Voice Services da Amazon, que analisa a gravação em comandos que ele entende. Em seguida, o sistema envia a saída relevante de volta ao seu dispositivo. Quando você pergunta sobre o clima, um arquivo de áudio é enviado de volta e o Alexa informa a previsão do tempo sem que você tenha ideia de que houve idas e vindas entre os sistemas. O que isso significa é que, se você perder a conexão com a Internet, o Alexa não funcionará mais.

As habilidades que o Echo tem fora da caixa são impressionantes para a maioria de nós, mas a Amazon permite e incentiva os desenvolvedores aprovados a acessar gratuitamente o Alexa Voice Services para que possam criar novas habilidades do Alexa para aumentar o conjunto de habilidades do sistema, assim como a Apple fez com a loja de aplicativos . Como resultado dessa abertura, a lista de habilidades com as quais o Alexa (atualmente mais de 30.000 ) pode ajudar continua a crescer rapidamente. Os usuários podem, é claro, comprar produtos da Amazon, mas também podem pedir pizza na Domino’s, pegar carona no Uber ou Lyft, controlar suas luminárias, fazer um pagamento através da habilidade Capital One, obter vinhos para o jantar e muito mais. mais.

Fonte de reprodução: Adobe Stock

Aprendendo constantemente com dados humanos

Dados e aprendizado de máquina são a base do poder do Alexa, e está ficando cada vez mais forte à medida que sua popularidade e a quantidade de dados que coleta aumentam. Toda vez que o Alexa comete um erro ao interpretar sua solicitação, esses dados são usados ​​para tornar o sistema mais inteligente na próxima vez. O aprendizado de máquina é o motivo da rápida melhoria nos recursos da interface de usuário ativada por voz. Por exemplo, a fala do Google conseguiu melhorar tremendamente sua taxa de erro em um ano; agora reconhece 19 das 20 palavras que ouve . Compreender a fala humana natural é um problema gigantesco, e agora temos o poder de computação à nossa disposição para torná-la melhor quanto mais a usarmos.

Fonte de reprodução: Adobe Stock

Os desafios da geração e processamento de linguagem natural

Como um subconjunto da inteligência artificial , a geração de linguagem natural (NLG) é a capacidade de obter respostas escritas e verbais com som natural de volta com base em dados inseridos em um sistema de computador. A linguagem humana é bastante complexa, mas os recursos de geração de linguagem natural de hoje estão se tornando muito sofisticados. Pense no NLG como um escritor que transforma dados em linguagem que pode ser comunicada.

O processamento de linguagem natural (NLP) é o leitor que pega a linguagem criada pelo NLG e a consome. Os avanços nessa tecnologia permitiram um crescimento dramático em assistentes pessoais inteligentes, como o Alexa. A IA baseada em voz é tão atraente porque promete dar suporte de uma maneira que é natural para nós, humanos; não é necessário deslizar ou digitar. É também por isso que construir é um desafio técnico. Basta pensar em quão não linear é sua conversa típica.

Quando as pessoas falam, elas se interrompem, mudam de assunto ou se repetem, usam linguagem corporal para adicionar significado e usam uma grande variedade de palavras que têm vários significados, dependendo do contexto. É como um pai tentando entender o vernáculo dos adolescentes, mas muito, muito mais complicado. A Amazon continua a ter um exército de especialistas, além de um quadro de máquinas, com a tarefa de tornar o Alexa e o Alexa Voice Services ainda melhores. Seu objetivo é tornar a linguagem falada uma interface de usuário tão natural quanto falar com outro ser humano.

Fonte: https://www.gazetamineira.com.br/variedades/amazon-tem-planos-para-que-alexa-imite-voz-de-qualquer-pessoa-fazer-as-memorias-durarem/

Deixe um comentário

O seu endereço de e-mail não será publicado.