Rico Malvar: um inventor brasileiro na Microsoft
Texto: Yuri Vasconcelos, da Revista Pesquisa FAPESP
Formado em engenharia elétrica na Universidade de Brasília (UnB), com mestrado na Universidade Federal do Rio de Janeiro (UFRJ) e doutorado no Instituto de Tecnologia de Massachusetts (MIT), o carioca Henrique (ou Rico) Malvar, de 65 anos, completou em agosto 25 anos de atividades na Microsoft. Nesse período, teve uma rápida ascensão e uma carreira bem-sucedida. Sete anos depois de ser contratado, tornou-se o diretor de seu principal laboratório de pesquisas, a Microsoft Research, localizado em Redmond, nos arredores de Seattle, no estado norte-americano de Washington, onde fica a sede da companhia.
Pouco tempo depois, foi convidado para ser o cientista-chefe da unidade, cuja equipe é formada por mais de mil pesquisadores, entre cientistas da computação, engenheiros, físicos, matemáticos e outros especialistas. Durante 10 anos, até 2020, esboçou estratégias de inovação e ajudou a coordenar a ação dos 12 laboratórios da empresa espalhados pelo mundo. Nesse meio tempo, foi reconhecido pela Microsoft com o título de distinguished engineer (engenheiro distinto, brilhante) pelas relevantes contribuições tecnológicas que deu à companhia de Bill Gates.
Autor de 120 patentes nos Estados Unidos e de 180 artigos técnicos, Malvar lidera hoje um time que trabalha em novas interfaces humano-máquina, incluindo tecnologias de acessibilidade, na Microsoft Research. “Trabalhamos para empoderar as pessoas com deficiência para que possam usar o computador e se inserir no mundo digital”, disse a Pesquisa FAPESP. Sua equipe já criou e lançou ferramentas que possibilitam a indivíduos vítimas de paralisia comandar o computador com o movimento dos olhos e a deficientes visuais caminhar pela cidade recebendo orientações de voz por áudio tridimensional do smartphone.
Nesta entrevista, concedida de sua casa por videoconferência, ele fala de sua trajetória em uma das maiores empresas de tecnologia de informação do mundo e dos planos para o futuro.
Como você entrou na Microsoft?
Isso foi há bastante tempo, em 1997. Nunca imaginei que teria o mesmo emprego durante tantos anos. Mas, pensando bem, é como se tivesse trabalhado em três ou quatro empresas diferentes, porque a Microsoft se reinventou ao longo dos anos. Hoje ela não é mais apenas uma fabricante de softwares, mas uma empresa de sistemas computacionais em nuvem, inteligência artificial [IA] e também de aplicativos. Nos anos 1980, após meu doutorado no MIT, regressei ao Brasil e tornei-me professor da UnB, liderando o Grupo de Processamento Digital de Sinais, mas sempre tive o desejo de voltar aos Estados Unidos. Durante o doutorado, alguns colegas do MIT criaram uma das primeiras empresas comerciais de videoconferência, chamada PicTel. E eu os ajudei. Quando veio a crise do golfo [conflito no Oriente Médio no início da década de 1990, que resultou na invasão do Iraque pelos Estados Unidos], ninguém queria viajar, com medo de ataques terroristas, e o negócio da PicTel, baseado na plataforma de videoconferência, cresceu muito. Eu estava no Brasil, quando recebi um telefonema do Brian Hinman, um dos sócios-fundadores da PicTel, me convidando para ser o diretor de pesquisa da empresa. Eu e minha mulher discutimos durante um mês os prós e os contras, até que decidi aceitar a oferta. Tudo estava indo superbem na PicTel, quando percebi que a Microsoft estava fazendo coisas interessantes na área de voz e mídia e a Microsoft Research, seu laboratório de pesquisas, crescia. Decidi mandar um e-mail meio maluco para o CTO [chief technology officer, diretor de Tecnologia] da companhia. Nele, eu dizia mais ou menos o seguinte: “O laboratório de pesquisa está crescendo, tem várias áreas, mas vocês não têm um time de multimídia. É preciso ter esse time, porque toda a mídia vai se tornar digital. Essa é a minha área, eu entendo disso e posso criar e liderar uma equipe. O que acham?”. No dia seguinte, para minha surpresa, recebi um e-mail do setor de recrutamento da Microsoft marcando uma entrevista. Gostaram de mim, fizeram uma oferta e em pouco tempo mudamos para Seattle.
Como foi a sua trajetória na empresa?
Comecei liderando um time na minha área técnica, que é processamento de sinais e multimídia, ou seja, como o computador e os dispositivos de computação trabalham com sinais de imagem, vídeo e som. Nesse momento, por exemplo, o programa que possibilita nossa comunicação por videoconferência está usando alguns pedacinhos de um código computacional que eu escrevi há muitos anos. Depois de sete anos liderando o time de processamento de sinais, fui convidado para ser diretor da Microsoft Research, de Redmond. Era um cargo de liderança e administração e fui o responsável pelo orçamento, gerenciava pessoas, tomava decisões e uma resolução importante foi investir mais em arquitetura de computadores e processadores numa época em que a Microsoft só fazia softwares. Em 2006, tornei-me um distinguished engineer, um reconhecimento que a Microsoft concede a alguns engenheiros que deram contribuições relevantes para mudanças de arquitetura de sistemas. Quatro anos depois, fui chamado para ser o cientista-chefe da Microsoft Research, um cargo mais de orientação estratégica. Cuidava de projetos colaborativos envolvendo os 12 laboratórios de pesquisa da empresa no mundo. Ia muito à China, à Índia, à Inglaterra. Há cerca de dois anos, mudei de novo e tive a oportunidade de criar um time focado em acessibilidade.
Quando liderei a Microsoft Research, decidi investir mais em arquitetura de computadores numa época em que a empresa só fazia softwares
Qual é o objetivo dessa sua nova equipe?
Ajudar e empoderar pessoas, especialmente aquelas com deficiência. Para isso, recorremos a uma área da computação conhecida como interação humano-máquina. O que é isso? Como uma pessoa cega, por exemplo, que não consegue enxergar um texto na tela, pode fazer para usar o computador ou smartphone? E alguém com paralisia que não pode mexer as mãos? O meu trabalho é criar alternativas ou interfaces melhoradas para quem tem deficiência poder usar o computador e participar do mundo digital. Nosso laboratório é dividido em três áreas: Enable, que desenvolve sistemas práticos de acessibilidade; Epic, que se dedica à realidade virtual e aumentada; e Ability, focada em pesquisas na área de acessibilidade.
Esse trabalho já teve resultados práticos?
Sim. Um dos primeiros produtos foi lançado no sistema operacional Windows 10. É o chamado controle ocular ou Eye Control. Com ele, uma pessoa paralisada, que tem ELA [esclerose lateral amiotrófica, doença neurológica degenerativa que leva à paralisia dos movimentos do corpo], ou outro tipo de doença, pode controlar o computador com os olhos. Na verdade, ela comanda o cursor com os olhos. Para onde olhar, o cursor vai estar. E aí tem várias coisas interessantes. Por exemplo, não podemos mostrar o cursor na tela, porque, se ele estiver visível, a psicologia do cérebro faz querer seguir o cursor, causando confusão ao usuário: “Eu estou controlando o cursor ou estou seguindo o cursor?”. Na medida em que a pessoa olha a tela, ela pode ler e ver as coisas; fixar o olhar num ponto por mais de meio segundo equivale a um clique. Isso está funcionando muito bem. Só é preciso instalar uma câmera especial, de infravermelho, para detectar os movimentos dos olhos. O Windows recebe a informação e a pessoa pode controlar o computador.
Alguma outra inovação?
Nosso time também criou o Soundscape, um aplicativo para iPhone que ajuda deficientes visuais a explorarem o mundo. Em vez de mostrar um mapa em uma tela – como os aplicativos convencionais fazem –, ele usa um recurso novo, o áudio tridimensional, para orientar pessoas cegas. A interface com a pessoa deixa de ser a tela e passa a ser o áudio. Com o Soundscape, conseguimos manipular a propagação das ondas para que o som pareça estar vindo de um determinado ponto do ambiente. O usuário só precisa apontar o celular para a frente e o programa informa, por exemplo, que tem um restaurante chinês novo ali – e o som vem de onde está o restaurante. O Soundscape habilita as pessoas a andarem pela cidade sem precisar pedir ajuda pra ninguém nem usar o mapa. Acessibilidade é uma coisa importante, porque você ajuda a inserir mais pessoas no mundo digital. Queremos remover barreiras para quem tem alguma deficiência. Cada vez que desenvolvemos novas tecnologias, a tendência é aumentarem as barreiras. Uma tecnologia nova exige fazer algo diferente, e para quem tem alguma deficiência aquela novidade muitas vezes atrapalha em vez de ajudar.
Como é trabalhar na Microsoft?
É uma empresa bacana, que nunca teve medo de assumir riscos, de alargar os limites da tecnologia. Isso desde a época em que era dirigida pelo Bill Gates [hoje afastado do dia a dia da empresa]. Ele sempre gostou muito do trabalho da Microsoft Research e eu tive a felicidade de ter tido muitas discussões com ele. Lembro de uma em que ele me dizia que eu tinha que “fazer desse jeito”. Eu respondi: “Não, tenho que fazer desse outro jeito”. Não é fácil convencer o Bill Gates, mas naquele dia eu consegui. O fato é que, em 90% das vezes, quando falava “tem que ser desse jeito”, ele é que estava certo. É um cara excepcional.
Há pesquisadores brasileiros em seu time de acessibilidade?
Na minha equipe, não, mas na Microsoft Research temos alguns. Uma delas é a Karin Strauss, que lidera uma pesquisa de ponta na área de armazenamento de informação em DNA [na qual os chips seriam feitos de fibras sintéticas de DNA]. Imagine podermos usar o DNA como um meio para guardar informação, utilizando para isso ferramentas de bioengenharia. A densidade de armazenamento é imensa. Quando isso estiver funcionando, poderemos pegar tudo o que está na internet, todos os vídeos, imagens, textos, centenas de pentabytes de informação e guardar em um disco do tamanho de duas caixas de sapato. Isso muda todo o conceito da computação, pois não precisaremos mais apagar informação. Será muito importante para universidades, museus, bancos de dados médicos, científicos e de climatologia. É uma pesquisa feita em colaboração com a Universidade de Washington.
Se sua eficiência de resultados positivos for muito maior que 10%, você provavelmente não está correndo muitos riscos
Há alguma interação entre vocês e grupos de pesquisa no Brasil?
Sim, temos um pequeno time de pesquisadores na Microsoft Brasil – que eu mesmo criei há alguns anos – que trabalha com inteligência artificial e visão computacional. Hoje, eles não estão mais vinculados a mim, mas desenvolvem projetos bacanas. Um deles foi feito com o Hospital 9 de Julho, de São Paulo. Foi um projeto-piloto, com bons resultados, de monitoramento de pacientes internados com o uso de câmeras para evitar quedas do leito. Há muitos pacientes que acham que estão bem, tentam sair da cama e se machucam. Com base em inteligência artificial e visão computacional em tempo real, o nosso sistema avisa a enfermagem, por meio de mensagens, que o paciente do quarto tal está se mexendo e parece querer sair da cama. Com isso, o enfermeiro vai até lá antes que ele se machuque. Temos também bom relacionamento com as universidades estaduais paulistas, como Unicamp [Universidade Estadual de Campinas], USP [Universidade de São Paulo], as federais do Rio de Janeiro, de Minas Gerais [UFRJ, UFMG], entre outras. Há alguns anos criamos um programa conjunto com a FAPESP, o Instituto Microsoft Research FAPESP de Pesquisas em Tecnologia da Informação. Investimos em projetos de pesquisa no Brasil, principalmente na área ambiental, sem restrição. Cada parceiro entrou com metade do financiamento (ver Pesquisa FAPESP no 135).
Você tem mais de 120 patentes depositadas nos Estados Unidos, individualmente ou em coautoria. Qual delas resultou em mais benefício para os usuários?
Difícil dizer. Fiz muita coisa para o Windows Media [aplicativo de vídeo, áudio e imagem da Microsoft], algumas para o Windows e para o Office. O meu time criou em 2007 um produto chamado Microsoft Round Table, um sistema inovador de videoconferência de 360 graus. Mas, do ponto de vista de impacto do usuário, as patentes que eu fiz relacionadas ao padrão de compressão de vídeo H264 foram provavelmente as mais importantes. O formato H264 é o que nós estamos usando nesse momento para nos vermos nesta videoconferência. Durante uma videoconferência, não é possível pegar todos os pixels que estão na imagem e transmitir; é necessário comprimi-los antes. E o H264 faz isso. Ele é responsável por mais de 75% de todo o tráfego de áudio, imagem e vídeo da internet. Os aplicativos Teams e Zoom, o YouTube e a Netflix usam esse padrão, que foi uma tecnologia de alto impacto.
Você já afirmou que 90% das pesquisas feitas na Microsoft não vão dar em nada, mas 10% delas terão resultados assombrosos. O índice de sucesso não é baixo?
Não, acho que essa é uma taxa boa. Se a sua eficiência de resultados positivos for muito maior que 10%, você provavelmente não está correndo muitos riscos. E, se for muito menor, de 1%, é porque você não está fazendo um trabalho muito bom. Então, entre 5% e 10% de eficiência é um bom resultado. Temos alguns projetos de risco que vão levar muitos anos para dar resultado. Um deles é na área de computação quântica. Embora ainda não existam modelos comerciais do computador quântico, fizemos avanços importantes na parte de software. Pode-se perguntar: “Se o hardware ainda não existe, por que estamos desenvolvendo os softwares?”. A resposta é simples: porque no dia em que o computador ficar pronto ele vai exigir algoritmos diferentes. Por enquanto, posso emular o computador quântico na nuvem através de softwares e testar esses algoritmos. Quando o computador quântico estiver operacional, eu os transfiro para ele. Quem está à frente desse projeto é uma mulher, a pesquisadora Krysta Svore, também uma distinguished engineer da Microsoft. Valorizamos muito a diversidade na empresa.
É um investimento cujos resultados ainda vão demorar para chegar à sociedade?
Sim, mas já há um retorno indireto perceptível. Nossos clientes veem que estamos investindo em inovação. Nossos produtos e serviços utilizam cada vez mais recursos de inteligência artificial e têm elevada capacidade computacional. Podemos resolver problemas computacionais na nuvem da Microsoft que nenhuma instituição acadêmica ou órgão governamental consegue. A capacidade computacional de nossa nuvem equivale à de vários supercomputadores. Esse investimento afeta nosso negócio de uma forma positiva, e os clientes entendem o que podemos fazer.
Como é hoje sua vida em Seattle?
Meu cotidiano é muito legal. Minha mulher e eu demos sorte: nossos dois filhos moram perto, o que não é muito comum nos Estados Unidos. Minha filha mora a 10 minutos da nossa casa e meu filho a 20 minutos. No ano passado, nasceram gêmeos, do meu fiho. Com isso, parte do nosso cotidiano é curtir os netos. Além disso, Seattle é uma cidade excelente para quem aprecia esportes outdoor e de natureza. Minha esposa gosta muito de hiking [caminhadas na natureza] e costumamos fazer trilhas. Tem também uma lojinha brasileira aqui perto, a Kitanda, onde posso comprar pão de queijo, goiabada e um monte de produtos brasileiros. Sentimos falta do Brasil, mas vamos de férias para lá todos os anos. Eu me sinto muito sortudo.