Cientistas da computação desenvolveram um sistema de inteligência artificial que é um avanço em relação a técnicas atuais para burlar CAPTCHAs, os avisos super irritantes que avaliam se você é humano ou um robô. Para especialistas em segurança, isso significa que sistemas baseados em CAPTCHAs atuais podem em breve se tornar obsoletos — se é que já não são.

Desenvolvedores de inteligência artificial (IA) tentam há anos derrotar o CAPTCHA, mas estes sistemas precisam de muita potência para suceder. Testes de resposta que são apresentados com caracteres misturados e distorcidos em várias fontes e configurações são muito difíceis de identificar para uma máquina, mas não tanto para humanos. Nós não temos problemas em reconhecer letras, deduzindo caracteres deformados, ou identificar duas letras sobrepostas. Nossos cérebros altamente adaptáveis nos permitem fazer isso e IAs, na maior parte, são sistemas limitados que não pensam muito bem além do que são programados.

É por isso que Dileep George, cofundador da Vicarious, incorporou conhecimentos da neurociência para “treinar” um computador para generalizar além do que ele é primariamente ensinado. Este novo sistema, chamado de Recursive Cortical Network (RCN), é aparentemente capaz de analisar testes CAPTCHA mais efetivamente que modelos anteriores, e com menos treinamento. Isso significa que o sistema de respostas pode ser burlado com maior eficiência, tornando sites vulneráveis a robôs. A nova pesquisa foi publicada esta semana na Science.

Muitos dos sistemas que burlam o CAPTCHA são treinados em milhões de exemplos pré definidos, ou eles são equipados com regras específicas de como discernir cada tipo de imagem. Mas, assim como o cérebro humano, o novo sistema pode aparentemente aprender e generalizar usando poucos exemplos. George diz que o RCN é 300 vezes mais eficiência em relação aos dados do que técnicas anteriores, e ele funciona presumindo sobre o mundo visual. Conforme o cientista explica para o NPR:

Durante a fase de testes, ele construiu modelos internos de letras a qual foi exposto. Então, se você o expõe para As e BS e caracteres diferentes, ele constrói seu próprio modelo interno do que estes caracteres devem se parecer. Então ele diria, estes são os contornos de uma letra, este é o interior de uma letra, etc.. E assim, quando uma nova imagem aparece… ele tenta explicá-la, tentando determinar todos os pixels dessa nova imagem nos termos dos novos caracteres que já viu antes. E então irá dizer, essa porção do A está faltando porque está atrás desse B.

Sistemas CAPTCHA variam muito pela internet, mas o RCN provou ser altamente adaptável, solucionando reCAPTCHAs e BotDetect em cerca de dois terços das vezes, e os CAPTCHAs do Yahoo e PayPal cerca de 57% das tentativas. Não é perfeito, mas é um avanço na direção certa. E por direção certa os cientistas se referem aos sistemas que podem raciocinar visualmente como os humanos. Por fim, os pesquisadores trabalham em IAs generalizadas que funcionem de maneira semelhante ao cérebro humano.

“Isso demorou um bom tempo”, disse Marc Goodman, autor de Future Crimes: Everything Is Connected, Everyone Is Vulnerable and What We Can Do About It, ao Gizmodo. “CAPTCHAs dependem da visão humana ser melhor que a visão do computador. Infelizmente isso está mudando rapidamente e a visão do computador está ficando boa — e em breve será potencialmente melhor — que a visão humana. Quando isso acontecer, todos os sistemas de autenticação relacionados a imagens ficarão sob ameaça, já que sistemas de inteligência artificial baseadas na visão do computador poderão solucionar os mesmos enigmas que as pessoas”.

Para alguns sites, isso significa que segurança baseada em sistemas de CAPTCHA vão se tornar obsoletas. Uma solução é tornar os CAPTCHAs visualmente mais difíceis, mas isso também os tornará mais difíceis para os humanos, que começarão a se frustrar, e gradualmente se encontrarão impedidos de resolver a maioria dos CAPTCHAs. Outra opção é desenvolver um novo sistema inteiro de autenticação. E, inclusive, o Google já matou o CAPTCHA.

“Em última instância, sistemas de autenticação serão mais baseados em biométricas, e, em particular, métricas comportamentais, que rastreiam e medem coisas sobre você e seus comportamentos para te autenticar”, diz Goodman. “Por exemplo, o acelerômetro dentro do seu telefone é usado atualmente por muitos aplicativos financeiros para identificar a forma única que você segura o seu telefone quando digita uma senha. Todos nós fazemos isso de forma única, e esse é um tipo de impressão digital que pode ajudar a autenticar sites e aplicativos. Veremos muito mais disso no futuro”.

Uma coisa é certa, atualmente humanos têm cada vez mais dificuldade de provar que não são robôs. É assustador imaginar, mas pode chegar o dia que será praticamente impossível para um humano provar sua humanidade pela internet.

[Science]

Imagem de topo: uma representação da letra A (Vicarious AI)