Quando o grupo hacker Impact Team despejou os dados do site Ashley Madison na rede, eles garantiram que “milhares” de perfis femininos na rede eram falsos. Mais tarde, este número surgiu em notícias que afirmavam que “90 a 95%” dos perfis femininos eram falsos, apesar de ninguém apresentar evidências. Então, eu baixei e analisei os dados para descobrir quantas mulheres de verdade usavam o Ashley Madison e quem elas eram.

O que eu descobri é que o mundo do site de traições é muito mais distópico do que poderíamos imaginar. O Ashley Madison não é uma terra das maravilhas onde homens traem suas mulheres. Não é nem mesmo um cenário formado por 31 milhões de homens competindo para atrair as 5,5 milhões de pretensas mulheres presentes na rede. Em vez disso, é um futuro fictício onde todas as mulheres do mundo estão mortas, e algum engenheiro espertinho as substituiu por robôs mal planejados.

>>> Assine a newsletter semanal do Gizmodo

Estes milhões de homens pagaram ao Ashley Madison para se encontrar com mulheres que criavam perfis e desapareciam em um piscar de olhos. Elas foram feitas por bots e administradores entediados, ou não passavam de restos de usuárias? Qualquer que seja a resposta, quanto mais eu examinava estes 5,5 milhões de perfis femininos, mais óbvio ficava que nenhuma delas se comunicou com homens no site; na realidade, parece que elas nem mesmo chegaram a usar o site depois de terem criado um perfil. Na verdade, esqueça isso. Conforme explicarei abaixo, existe uma grande chance que cerca de 12.000 perfis dentro dos milhões tenham, sim, pertencido a mulheres reais e que usaram o site de forma ativa.

Ao ver essas evidências, será difícil acreditar que a grandiosa maioria de homens usando o Ashley Madison estava tendo um caso. Eles apenas pagavam por uma fantasia.

Evidências

Ninguém duvidou da dramática divergência de gênero na base de dados do Ashley Madison, incluindo a própria companhia. Apenas 5,5 milhões de perfis se identificaram como “feminino” na base de dados de mais de 37 milhões de usuários.

1403242054515326382

É também um fato público que algum porcentagem destes perfis não era real. Há alguns anos, uma ex-funcionária do Ashley Madison processou a companhia canadense por conta das terríveis condições de trabalho. Ela alegava danos causados às mãos por estresse depois que a empresa a contratou para criar mais de 1.000 perfis femininos falsos em três meses, escritos em português para atrair a audiência brasileira. O caso foi resolvido no tribunal, e a Ashley Madison afirmou que a mulher nunca fez nenhum perfil falso.

Ainda assim, existe uma cláusula nos Termos de Serviço do Ashley Madison que diz que “algumas” pessoas usam o site apenas “para entretenimento” e que eles “não estão buscando encontros pessoais com alguém que conheceram no Serviço, mas consideraram suas comunicações com outros convidados e membros pura diversão”. O site nega que estes sejam perfis falsos, mas admite que muitos perfis existem apenas “para entretenimento”.

Com essa evidência como base, temos algumas claras indicações de que muitos dos perfis são falsos. Porém, para descobrir quantos, precisamos cair de cabeça nas informações impublicáveis da empresa, presentes nos vazamentos.

A questão é: como encontrar perfis falsos em um mar de dados? Responder essa pergunta fica ainda mais difícil quando você leva em consideração que até os usuários reais do Ashley Madison provavelmente também deram informações falsas, pelo menos em algum momento. Mas até essas informações ainda deixam rastros no perfil. Eu conversei com uma cientista de dados que estuda populações, que me disse para comparar os perfis masculinos e femininos em conjunto e procurar por padrões anômalos.

A minha análise precisava se basear inteiramente nos perfis, e não em dados de cartão de crédito. Não existem contas pagantes, ou premium, para mulheres porque as mulheres não precisam pagar por nada no Ashley Madison. Como resultado, eu não poderia usar “conta pagante” como uma “conta real”, como foi feito com perfis masculinos. Além disso, dados de cartões de crédito não listam gênero — então seria impossível garantir proporções de gênero com os dados de cartão de crédito.

Na base de dados dos perfis, cada membro do Ashley Madison tem um número de campos de dados, incluindo itens óbvios, como apelido, gênero, data de nascimento, e o que os excita; mas o perfil de usuário também contém dados usados puramente em razões administrativas, como endereço de email usado para criar a conta e a última vez que o usuário abriu a caixa de mensagens do Ashley Madison.

Comecei minha pesquisa no lugar óbvio. Existem padrões no email listado para se cadastrar no site? Percebi que se eu fosse um administrador criando perfil falso no Ashley Madison, eu simplesmente usaria um email ashleymadison.com porque isso seria mais fácil e óbvio. Nenhum usuário do site teria um email da companhia. Então, eu pesquisei por qualquer endereço de email que terminasse com ashleymadison.com e bingo! Muitos pareciam terem sido criados por robôs, como as dúzias de endereços listados como 100@ashleymadison.com, 200@ashleymadison.com, 300@ashleymadison, e por aí vai.

Uma comparação rápida entre os endereços de email de homens e mulheres revelou que mais de 9.000 destes emails “ashleymadison.com” eram de perfis femininos, enquanto cerca de 1.000 pertenciam a homens ou a pessoas de gênero não era especificado.

Este padrão mostrava, mas não condenava. Sugeria que a maioria dos perfis obviamente falsos — criados provavelmente por administrados entediados usando o próprio email da companhia ou talvez mulheres usando informações falsas — eram marcados como um perfil feminino. Estes perfis falsos atingiam números na casa dos milhares, que é exatamente o que sugeriu o Impact Team.

A seguir, procurei por padrões nos endereços de IP, que podem revelar a localização dos computadores usados para acessar a conta. O endereço de IP mais popular entre homens e mulheres pertence a uma companhia chamada OnX, que hospeda os backups do Ashley Madison. Mas isso pode significar diversas coisas. Pode significar que houve uma migração em massa de dados em dado momento e o IP de todo mundo foi modificado para o IP da empresa que hospeda o Ashley Madison. Entretanto, não existem anomalias de gênero nestes dados — cerca de 82% dos IPs da OnX pertenciam a homens, o que é uma porcentagem bem próxima do número total de perfis masculinos no site.

Mas o segundo IP mais popular encontrado no site, pertencente a 80.805 perfis, já conta uma outra história. Este endereço de IP, 127.0.0.1, é bastante conhecido por qualquer um que trabalhe com sistemas de computadores com interface de loopback. Para o restante de nós ele é conhecido como nosso computador local. Qualquer conta criada com esse endereço de IP foi provavelmente criada em um computador em “casa”, no caso, nos escritórios da Ashley Madison. Dos perfis criados neste IP, 68.709 eram femininos, e os 12.000 restantes eram ou masculinos ou não tinham preenchido o campo de gênero.

1403242054596930478

Essa é uma diferença enorme. Em uma base de dados onde 85% dos perfis pertencem a homens, é de se esperar que qualquer endereço de IP pertença 85% a homens. Então é extraordinário descobrir que 82% dos perfis criados em um endereço de IP de “casa” são femininos. Isso deixou ainda mais forte o padrão que vimos anteriormente — o dos emails “ashleymadison.com”. Fica óbvio que a grande maioria dos perfis femininos eram falsos, atingindo números nas dezenas dos milhares.

Outro detalhe estranho que encontrei foi que o sobrenome feminino mais comum na base de dados era bem incomum, mas que coincide com o nome de uma mulher que trabalhou na empresa há dez anos. Este nome estranho tinha mais de 350 entradas na base de dados, como se ela ou alguém estivesse criando um monte de contas para testes. O nome masculino mais popular, por outros lado, é Smith, seguido de Jones. Nomes muito comuns para a população norte americana.

Dito isso, também encontrei milhares de endereços de IP únicos nos emails de perfis femininos, assim como nos masculinos. Mas isso é exatamente o que esperar de dados aleatórios de mais de 37 milhões de pessoas. Eu também vi dados de homens e mulheres no campo “data de aniversário” que pareciam perfeitamente normais por uma razão bem diferente: ambos os gêneros tinha datas de aniversário falsas. Dois terços dos homens e mulheres afirmavam fazer aniversário em janeiro. Isso é um sinal claro de pessoas escolhendo o primeiro mês que aparece no menu. Obviamente, a população geral faz aniversário de forma bem uniforme durante todos os meses. Mas a população online, preenchendo dados em um site de sexo? Os aniversários deles acaba ficando no primeiro mês que aparece no formulário, e este tipo de falsidade é na verdade um sinal de humanidade.

Mas de novo, os perfis femininos mostravam padrões que sugeriam que uma parcela desproporcional deles não passava de contas falsas ou contas de teste. Mas ainda assim, os números ainda estavam as nas dezenas de milhares. E grande parte do restante dos dados parecia bem normal.

Onde as mulheres não estão

E então, três campos de dados mudaram tudo. O primeiro campo, chamado “mail_last_time”, continha a data e a hora da última vez que o usuário checou a caixa de mensagens do Ashley Madison. Se uma pessoa nunca checou a própria caixa, este campo fica em branco. Mas mesmo que eles tenham checado apenas uma única vez, o campo continha uma data e uma hora. Cerca de dois terços dos homens, ou 20,2 milhões, tinha checado a caixa de mensagens pelo menos uma vez. Em contrapartida, apenas 1.492 mulheres tinham visto suas mensagens. Uma anomalia das grandes.

1403242054690450350

Este padrão refletiu em um outro campo de dados. Este chamado “chat_last_time”, que contém a data e a hora para a última vez que o usuário conversou com alguém usando o sistema de chat do Ashley Madison. Cerca de 11 milhões de homens usaram o chat. As mulheres? Apenas 2.400.

1403242054754518190

E mais um campo de dados mostrou uma disparidade semelhante. O “reply_mail_last”, que mostrava a data e a hora que o usuário respondeu a última mensagem para outro usuário no Ashley Madison. 5,9 milhões de homens tinham esse campo, contra apenas 9.700 mulheres.

O que estes três campos têm em comum é que eles medem a atividade dos usuários. Eles mostram o que acontece depois que um perfil é criado e como uma pessoa real o usou para checar emails, conversar e responder mensagens. Eles medem o que pode ser chamado de assinaturas de comportamento humano. Um número bem insignificante de perfis femininos parecia humano.

Mas e quanto à enorme diferença do número de mulheres checando as mensagens (1.492) e respondendo mensagens (9.700)? Até isso pode ser respondido pelo uso humano do Ashley Madison.

Quando você loga na sua conta do Ashley Madison, um alerta é mostrado, permitindo que você responda mensagens antes mesmo de acessar a caixa de entrada. Uma caixa de diálogo aparece, sugerindo que você responda a todas de uma vez com respostas prontas, como “Apenas respondo a mensagens completas”, ou “Por favor me envie uma mensagem e uma foto”. Em outras palavras, você responder vários emails de uma só vez sem nem mesmo precisar checar ou abrir a caixa de entrada. Então é fácil imaginar que talvez alguns milhares de mulheres tinham contas, e respondiam a cerca de 10 mil mensagens depois do alerta. Mas apenas 1.500 delas clicavam no botão para abrir a caixa de entrada.

1403242054810385070

Tanto o Impact Team como usuários descontentes do Ashley Madison chamaram o site de fraudulento, principalmente porque a empresa cobrava de usuários homens para deletar suas contas — e ainda mantinha os dados deles depois das contas serem excluídas. Eu encontrei amplas evidências deste tipo de fraude na base dados. Um total de 173.838 perfis masculinos continham a informação “<paid_delete>” no campo de email, e 12.108 perfis femininos apresentavam o mesmo. Todos os outros dados destas contas eram mantidos.

Vale notar que estes 12.108 perfis femininos talvez representem o número de mulheres reais que usam o site. Afinal, pagar para deletar a conta é claramente um sinal de atividade, mas, obviamente, é um sinal de separação do site, em vez do convite à luxúria que o Ashley Madison prometeu.

Como um todo, não são bons sinais para o site. Das 5,5 milhões de contas femininas, 0% apresentou algum tipo de atividade depois de ter criado a conta.

As contas masculinas mostram um compromisso vivo com o site, com mais de 20 milhões de homens olhando com esperança para suas caixas de entrada e mais de 10 milhões deles iniciando chats. Já as atividades das contas femininas mostram tão pouco movimento que é como se elas nem estivessem presentes lá.

É claro, algumas destas contas inativas foram provavelmente criadas por mulheres vivas e reais (ou homens fingindo ser mulheres) que estavam curiosas para conhecer o site. Algumas talvez quisessem encontrar seus maridos traidores. Outras talvez não passassem de jornalistas curiosas como eu. Mas elas não deixam de fazer parte de uma parcela esmagadoramente inativa. Elas não foram criadas por mulheres querendo sair com homens casados. Elas não passavam de perfis estáticos recheados de dados mortos, cujo único propósito era fazer homens acreditarem que milhares de mulheres estavam ativas no Ashley Madison.

Os funcionários do Ashley Madison fizeram um ótimo trabalho fazendo milhões de perfis femininos parecerem reais. Eles deixaram dados nestas contas inativas visíveis aos homens, mostrando apelidos, fotos, comentários sensuais. Mas quando avaliamos os dados visíveis apenas aos administradores do site, tudo fica meio bagunçado. Os emails e endereços de IPs usados por estas “mulheres” mostram sinais de fraude. E quanto a atividade das mulheres no site, o sinal fundamental da vida humana? Os empregados do Ashley Madison nem se deram ao trabalho de fazer isso parecer real.

Certamente existem outras explicações para estas discrepâncias nos dados. Pode ser que os dados dos perfis femininos estivessem corrompidos, mesmo o dos homens não estando. Ou talvez a maioria destas contas não fossem deliberadamente falsas, mas apenas uma representação das mulheres que entraram no site uma única vez e nunca mais voltaram.

De qualquer forma, ficamos com a impressão que o Ashley Madison é um site com dezenas de milhões de homens que escrevem emails, conversam no chat e gastam dinheiro com mulheres que não estão lá.

ATUALIZAÇÃO (28/08 às 13h27) – O escândalo do vazamento das informações do serviço custou a cabeça (não literalmente) de Noel Biderman, o CEO da Avid Life Media, empresa responsável pelo Ashley Madison. Segundo um rápido comunicado no site oficial do serviço, uma equipe já existente dentro da empresa comandará tudo até que um novo CEO seja escolhido.