Seu livro vai ser um best-seller? Pergunte para este algoritmo
É difícil prever quanto um livro vai vender até que ele seja publicado — em última análise, é quase um jogo de azar. Mas agora, um novo algoritmo pode dizer se uma obra será ou não um sucesso comercial bem antes de ele chegar às estantes das livrarias — com uma precisão de impressionantes 84%.
Uma equipe de pesquisadores da Universidade Stony Brook, de Nova Iorque, desenvolveu um sistema chamado estilômetro estatístico, para examinar matematicamente palavras e gramática em textos. Este método fornece uma previsão sobre as vendas bem melhor que a de humanos.
O grupo trabalhou com um corpus bem grande –todos os livros clássicos que estão no arquivo do Projeto Gutenberg– e analisou todos os textos, desenvolvendo um algoritmo que pode prever o sucesso a partir do léxico e da estrutura. Então, eles compararam as previsões com os dados históricos sobre as vendas de todos os livros. Os prognósticos de sucesso do algoritmo coincidiram com os dados reais de vendas em 84% dos casos.
Então, o que faz uma obra ser um best-seller? Há algumas descobertas importantes, de acordo com os pesquisadores:
- Livros bem sucedidos fazem uso pesado de conjunções –como “e” e “mas”–, assim como um grande número de substantivos e adjetivos.
- Livros que não fazem sucesso incluem mais verbos e advérbios, explicitamente descrevendo ações e emoções — como “quis”, “pegou” e “prometeu”.
- Verbos nos livros que fazem sucesso geralmente descrevem processos de pensamento — como “reconheceu” ou “lembrou”.
Por curiosidade, os pesquisadores procuraram na Amazon por livros com avaliação baixa para testar o algoritmo com textos mal escritos e que não fizeram sucesso. Os resultados também endossaram as descobertas. A pesquisa foi publicada pela Associação de Linguística Computacional.
Agora que podemos prever que livros e que filmes serão sucessos, será que vamos ler e ver apenas os bons? Sendo realista, é bem provável que não. [Association of Computational Linguistics via Telegraph]
Imagem: slightly everything sob licença Creative Commons