Rico Malvar: a Inteligência Artificial veio incluir as pessoas com deficiência na sociedade

Share

RicoMalvar_Hires_v2Você consegue controlar seus pensamentos? Será possível transferir o que você pensa para o computador? Qual é a linguagem de comunicação acústica? Qual é o som mais confortável para orientar um deficiente visual? As perguntas que Henrique Malvar se faz dão uma ideia da busca de soluções do cientista-chefe na Microsoft Research AI, dos projetos que comanda na companhia e dos muitos que ainda pretende desenvolver.

Detentor de 120 patentes, o carioca Rico Malvar, como é conhecido, esteve no Brasil no final de março para apresentar a evolução do Eye Control, um sistema baseado em Inteligência Artificial (IA) que permite ao deficiente físico mover uma cadeira de rodas com o olhar. Desenvolvido há quatro anos a pedido do ex-jogador de futebol americano, Steve Gleason, imobilizado pela esclerose lateral amiotrófica, agora o Eye Control rastreia os movimentos dos olhos para substituir mouse e teclado no Windows 10. E o time brasileiro de Engenharia e Inovação adaptou o sistema às particularidades de cadeiras de rodas fabricadas aqui e criou a função que registra sequências de comandos para que eles possam ser executados apenas por um atalho.

Malvar lidera o time Microsoft Research NExT Enable, que tem como primeira missão desenvolver tecnologias e inovações que vão melhorar a vida das pessoas com deficiência. E como segunda missão, estender o uso dessas tecnologias de modo que sejam úteis para todo mundo. “A IA é uma tecnologia que veio complementar as habilidades humanas e está sendo utilizada na Microsoft como meio de inclusão na sociedade de pessoas com deficiência”, diz.

Acompanhe trechos da entrevista de Rico Malvar ao News Center Brasil.

Em quais projetos você está trabalhando atualmente?

No momento, temos dois projetos que combinam pesquisa e desenvolvimento, para testar com usuários e funcionar adequadamente. Esse método combinado funciona bem, tanto que conseguimos trabalhar com o Eye Control no Windows. E olha que o time de Windows não arrisca a estabilidade do sistema por qualquer ideia nova. Foi um trabalho conjunto muito legal e, em outubro de 2017, colocamos à disposição do público o recurso de rastreamento pelo olhar na atualização Fall Creators Update do Windows 10.

Qual é o outro projeto em andamento?

É o Soundscape, um aplicativo gratuito para iPhone, capaz de ajudar os deficientes visuais, por meio de um fone de ouvido, a se localizarem enquanto andam na rua. Com uma técnica de som 3D, o app diz quando o usuário deve virar à direita ou à esquerda, como se fosse um GPS. Depois que a pessoa pergunta ao app o caminho para ir a um restaurante chinês, por exemplo, um alerta sonoro começa e fica cada vez mais forte à medida que se se aproxima do local. Um cão-guia ou uma bengala são necessários para identificar os obstáculos no caminho e ajudar o deficiente a contorna-los. E já temos muitas ideias para a versão 2. No futuro, com novos tipos de headphone, a qualidade e a precisão de colocação do som vão ser ainda melhores. Estamos investindo em pesquisa nessa área.

Qual a relação do Soundscape com o Seeing AI?

São duas ferramentas diferentes, com objetivos diversos. Por exemplo, o deficiente está com o celular e abre os dois apps. Diz para o Soundscape: “quero ir ao restaurante chinês”. O app dá as coordenadas da localização. A pessoa então acha que sabe onde está, que a rua X é a que fica na sua frente, aciona o Seeing AI, aponta para a placa da rua, e o app diz: “rua X”. Então juntaram-se a capacidade visual do Seeing AI com a habilidade sonora do Soundscape. Na prática, os usuários utilizam os dois apps de forma complementar.

E os deficientes auditivos, com quais recursos Microsoft podem contar?

A tradução de fala para texto, que evoluiu muito. Temos o app Tradutor, que pode ser instalado em qualquer smartphone, e, numa conversa, traduz voz para texto e texto para voz de mais de 15 línguas para mais de 15 línguas. E como a Inteligência Artificial aprende, a qualidade da tradução vem melhorando muito, principalmente no telefone, escutando bem a voz, mesmo que tenha ruído e pessoas próximas.

Essa tecnologia, além de estar na nuvem, está no PowerPoint. O PowerPoint Translator é um add-on que você instala de graça e insere uma legenda automática embaixo do slide de sua apresentação. A língua da legenda não precisa ser a mesma que você estiver falando. E funciona muito bem, tanto que está no Office, ajudando o deficiente auditivo a ter acesso à apresentação.

Além do PowerPoint Translator, qual outro add-on você destacaria?

O Learning Tools, que começou no OneNote e está mais aberto no Office. Quando você lê um documento, ele vai destacando as palavras uma por uma, auxiliando uma pessoa que tenha dislexia, autismo ou outros tipos de dificuldade mental. Simples, não é? Mas faz uma enorme diferença, transforma uma criança problemática no primeiro da classe. Há milhões de pessoas usando o Learning Tools do Office.

Na área médica, quais são as contribuições da pesquisa em IA?

Há várias iniciativas. Os hospitais têm os registros eletrônicos dos pacientes, mas eles estão em sistemas diferentes e são bancos de dados difíceis de acessar, e muitas vezes enfermeiras e médicos perdem informações importantes por causa da complexidade do sistema. Vamos começar a trabalhar na área médica para fazer a IA entender melhor o que está acontecendo e ajudar a encontrar a informação que faça com que o especialista humano possa fazer o diagnóstico.

Além disso, muitos dos dados médicos são imagens, como as de Raio X. O que está dentro desses exames? Temos um projeto recente, o InnerEye, que analisa a imagem do Raio X e já pré-identifica regiões que parecem ser diferentes e chama a atenção do especialista para elas. Faz certas medidas do tamanho do tumor ou de um órgão, encontrando os padrões nas imagens mais rápido do que o olho humano e ajudando o médico a tomar decisões. O InnerEye ainda é um projeto, mas está perto de ser um produto.

E está no Azure um serviço pelo qual pode-se fazer análise de DNA, a análise genômica. O St. Jude Children’s Research Hospital, nos EUA, já faz análise genômica para entender melhor o câncer pediátrico e está melhorando o tratamento do câncer infantil com Inteligência Artificial na plataforma de nuvem Azure, da Microsoft.

No Brasil o que temos em teste dessas tecnologias?

Temos o Hospital 9 de Julho. É o primeiro projeto piloto do mundo que prevê uma queda de leito, avisa a enfermeira e previne o acidente, protegendo o paciente. É muito bacana a vontade do hospital de resolver o problema, de preparar a informação e treinar as pessoas para receberem o sistema.

Acessibilidade tem sido um tema constante na Microsoft. Por que acessibilidade?

Qual é a missão da empresa? Capacitar cada pessoa e cada organização no planeta a alcançar mais. Então eu tenho que saber que a tecnologia que eu fiz para você pode não funcionar para uma pessoa portadora de deficiência. Por que não usar a tecnologia para incluir essa pessoa? E não é só fazer um pouco de pesquisa, é pegar todos os produtos e fazê-los mais acessíveis, testando muito. O time de tools, por exemplo, tem uma ferramenta de checar a acessibilidade. Todo mundo que desenvolve um aplicativo na empresa agora usa essa ferramenta, passou a ser uma parte do processo. A gente está melhorando os produtos num processo que força todos a pensar em acessibilidade.

O Eye Control está no Windows, o Tradutor no PowerPoint e o Soundscape no celular. Quais são os próximos desafios?

Estamos pensando na linguagem de sinais faz tempo. Há certos aspectos dessa linguagem que são difíceis de traduzir, expressões faciais que precisam ser detectadas. É ainda um desafio. Outra coisa que estamos investigando são as interfaces de som. Por exemplo, a interface gráfica de um app geralmente tem um botão de fechar, uma barra de scroll, é uma espécie de linguagem de comunicação visual. Qual seria a linguagem de comunicação acústica? É uma área nova. E uma pessoa paralisada que não pode usar o Eye Control? Uma possibilidade seria ler o cérebro diretamente. Não precisaria mexer um músculo, bastaria a pessoa pensar. No futuro, acredito que nós vamos conseguir transferir o seu pensamento, é só uma questão de tempo. E eu vou ver isso.

Share