O estudo, feito por Johan Bollen, Huina Mao e Xiao-Jun Zeng, usou quase 10 milhões de tweets de março a dezembro de 2008 e os analisou para classificar o sentimento que cada tweet expressava. Mas por que analisar o sentimento? Os pesquisadores explicam:

A economia comportamental nos ensina que as emoções podem afetar profundamente o comportamento individual e a tomada de decisões… Será que as sociedades podem passar por estados de espírito que afetem sua tomada de decisão coletiva? Por extensão, o humor do público está correlacionado, ou até mesmo pode prever indicadores econômicos?

Para medir o sentimento, eles usaram duas ferramentas: uma para medir humor positivo vs. negativo, e outra para classificar o sentimento em seis dimensões – calmo, alerta, confiante, enérgico, simpático e feliz. Os tweets são classificados de forma automática, de acordo com as palavras encontradas em cada um deles. Essa classificação foi testada vendo se a emoção predominante condizia com o que se esperava antes de dois eventos – a alegria de um feriado e a tensão antes das eleições presidenciais – e deu certo.

Daí restava testar se alguma das emoções antecipava mudanças no mercado de ações – mais precisamente, no índice Dow Jones. E uma delas conseguiu ótimos resultados: o sentimento de calma. (Os outros sentimentos não têm correlação relevante com o Dow Jones.) Depois de verificar a correlação, eles testaram se o sentimento pode ser usado para prever as flutuações de mercado – a parte que realmente interessa – e viram que, se o fator "calma" fosse incluído, a capacidade de previsão ficava em 87%. (Os outros sentimentos, por sua vez, pioravam a capacidade de previsão.)

Então será que dá pra usar o Twitter para fazer previsões no mercado de ações e ganhar dinheiro? Bem, o estudo tem várias ressalvas. Primeiro, o modelo usou tweets do mundo inteiro – não apenas dos EUA, país diretamente relacionado com o índice Dow Jones. Se eles considerassem apenas tweets dos EUA, os dados usados no modelo mudariam, e o resultado poderia ser bem diferente. Segundo, o estudo ainda não foi publicado em um periódico – ou seja, talvez ele ainda precise ser analisado por outros pesquisadores e precise ser revisado.

E o mais importante, como explicar que o sentimento de calma cause variações num índice da Bolsa? Correlações entre indicadores e o desempenho da Bolsa existem aos montes – por exemplo, o índice Super Bowl, que "prevê" o desempenho da bolsa baseado em quem ganha o Campeonato de Futebol Americano. Esses índices podem até se encaixar nos dados históricos, mas não serem confiáveis para prever o comportamento futuro.

Bem, o estudo serve pelo menos para mostrar um coisa: o Twitter nos dá uma base de dados enorme de informações, e podemos usá-la de graça pra qualquer coisa – quem sabe até pra ganhar uma graninha. [arXiv via Ars Technica e Economix; imagem via]