Por que devemos nos empolgar com a invenção de robôs-jornalistas

Uma empresa americana está empregando algoritmos para produzir reportagens jornalísticas. Como ela consegue fazer isso? Quais as limitações do modelo e como que os robôs podem ajudar o jornalismo.

Algumas das maiores publicações dos Estados Unidos fizeram reportagens nas últimas semanas sobre uma empresa que criou “robôs que poderiam substituir jornalistas”. As histórias foram compartilhadas frequentemente pelos meus coleguinhas de profissão, acompanhadas de comentários semi-raivosos com um “Absurdo” ou desdém, tipo “Quando eles estiverem bons eu já terei me aposentado mesmo”. Mas a questão leventada é importante. Será que algoritmos que criam sentido de estatísticas e tuitadas seriam bons em nos dar informações? Provavelmente não em todos os assuntos, mas daqui a 5 anos certamente. O importante, mesmo que custe alguns empregos, é que esta talvez seja a melhor coisa a acontecer para o jornalismo.

A empresa que está causando todo o rebuliço chama Narrative Science, e foi fundada por professores da Northwestern University de Nova York depois de um encontro entre jornalistas e engenheiros de computação em 2009. Em relativamente pouco tempo, repórteres e programadores criaram um algoritmo capaz de usar dados e estatísticas e criar pequenas sentenças narrativas, usando um “dicionário de expressões” desenvolvido por um jornalista. A Narrative Science se formou em 2010 em Chicago, já tem 30 clientes e ganhou investimentos de US$ 6 milhões no início do ano. Eles acreditam que em 5 anos terão programas espertos o suficiente para ganhar um Pullitzer.

Entendendo a mágica

Por enquanto, os robôs da Narrative Science produzem reportagens em dois campos: esportes e balanços financeiros de empresas. A escolha é claramente ditada pela quantidade de dados estatísticos disponível nas duas áreas. Digamos, por exemplo, que você é um robô jornalista desses e um T–1000 bravo, seu chefe, pediu uma reportagem sobre a semifinal da Champions entre Chelsea e Barcelona, que tem de estar no ar poucos segundos do fim da partida. Como você é robô, não tem conhecimento do esporte e tem de se alimentar das regras, histórico e jargão antes – pense em Neo aprendendo a lutar kung Fu. Na hora da partida, você caça estatísticas em tempo real, porque a história de qualquer jogo é razoavelmente bem descrita pelos números. Você baixa o app StatsZone, da FourFourTwo para dentro de você, por exemplo e, com as informações indo direto para o seu processador, vê a partida assim:

Barca chelsea passes
Messi final3rd takeons

E aí, com essa quantidade absurda de números e gráficos, você, robô, consegue produzir textos rigorosamente iguais a quase todos que apareceram na internet. Olhando os desenhos, você consegue escrever algo como “apesar do amplo domínio de bola, o Barcelona não conseguiu converter suas chances em gol” e “Lionel Messi não estava em noite inspirada, não conseguindo furar o bloqueio da zaga do Chelsea. O argentino teve apenas duas oportunidades claras de gol.” O vernáculo do futebol é cheio de clichês, de apelidos de times a expressões como “confusão na área” (caracterizada pelo número de toques dentro da caixa de cal até a bola entrar) ou “gol de bola parada, jogada forte do time X” (notada pelas estatísticas recentes). Basta criar um algoritmo que polvilhe um pouco deles no texto que a humanidade é fingida de maneira razoavelmente convincente. Às vezes até melhor que profissionais mal pagos com a pressão da deadline.

É para os jornalistas ficarem assustados, com medo de perder o emprego agora? Mais ou menos. Steven Levy, escrevendo para a Wired, conversou com Kristian Hammond, fundador da empresa, e assegurou que os jornalistas não tem de se preocupar.

A tsunami de robonotícias, ele insiste, não vai varrer os repórteres humanos que aindam têm o seu salário. Ao invés disso, o universo de notícias vai se expandir dramaticamente, enquanto computadores minam vastos repositórios de dados para produzir a narração de eventos ultrabarata e totalmente legível, em assuntos que nenhum jornalista está cobrindo no momento.

Os robôs da Narrative Science são largamente empregados em esportes normalmente não cobertos por jornalistas. As Little Leagues de beisebol, uma instituição americana, onde centenas de milhares de crianças competem, obviamente não tem a atenção de repórteres. Então os pais dos atletinhas colocam todas as informações estatísticas em um app para anotação, que é aproveitado pelos jornalistas artificiais. Se você assistiu Moneyball sabe o quanto que o jogo tem de informação facilmente mensurável – de uma maneira menos frenética que o futebol. O negócio tem dado certo: a Narrative Science estima que 1,5 milhão de partidas este ano terão a cobertura artificial, que custa menos de 10 dólares para uma reportagem de 500 palavras (até agora, neste post, foram mais ou menos 700). Ter um jornalzinho ou site descrevendo partidas, com fotos de celular e tudo, deve ser sensacional para um menino de 10 anos.

As vantagens e o potencial

Teoricamente a roborreportagem é mais objetiva e menos parcial e aparentemente isso é bom. Algumas pessoas reclamam quando colocamos algumas análises, opiniões e comparações no texto de apresentação de um novo aparelho, pedindo “apenas as especificações”. Pessoas que não conhecem o Giz demandam informação pura, e robôs conseguiriam fazer algo assim. Então, teoricamente, o emprego de todo mundo aqui está a salvo – será que um algoritmo olharia as notícias da Páscoa e produziria um texto assim? Creio que não.

Note que não acho o tal hard news necessariamente ruim. É fundamental passar a informação certa, mesmo que para introduzir a análise. Nesse sentido, os robôs seriam ótimos ajudantes de jornalistas. Na correria de um lançamento como o do Galaxy S III da semana passada, por exemplo, o robô poderia ficar de olho nas questões técnicas e produzindo os posts iniciais (que saem antes do fim da coletiva) enquanto a equipe de carne-e-osso se concentrava na apresentação e discutia a coisa. Não à toa, os melhores textos sobre o novo smartphone da Samsung (como o post do Leo, aqui) saíram um tempinho depois: é preciso um certo distanciamento para analisar a coisa toda direito: e daí que saem opiniões bem embasadas, com projeções e tudo – que você pode concordar ou não, mas isso faz parte da coisa.

A levemente perturbadora publicidade da Narrative Science

Também é ingenuidade achar que o jornalismo artificial será totalmente imparcial. Como o algoritmo é feito por humanos, ele pode ser calibrado de acordo com o desejo do veículo em questão. No caso das partidas de beisebol das Little Leagues, os pais ficavam chateados com expressões do tipo “massacrou” ou “atropelou”, e a Narrative Science agora só cria reportagens de jogos infantis destacando o esforço de todo mundo e não o time vencedor particularmente. É mais ou menos como o Lédio Carmona comentando jogo do Vasco.

É possível entender o motivo do filtro dos robôs no caso dos jogos infantis, e ele parece ingênuo, mas é bastante ilustrativo sobre como que o público demanda cada vez mais uma certa parcialidade, apesar de não assumir. Nos EUA, a emissora que mais cresceu em audiência nos últimos anos foi a conservadoríssima Fox News. Aqui no Brasil, Paulo Henrique Amorim ou Reinaldo Azevedo viraram celebridade por defender não apenas opiniões diferentes, mas versões da realidade diferentes. É este o ambiente que os robôs estão aparecendo, como diz Farhad Manjoo em seu livro True Enough: Learning to Live in a Post-Fact Society [Verdadeiro o suficiente: aprendendo a viver em uma sociedade pós-fato, sem tradução para o português]:

No negócio da reportagem, objetividade é um valor bem defendido. Está na teologia do jornalismo providenciar uma visão do objeto que se aproxima do que poderia ser considerada a “realidade”. O problema, pelo que vemos em vários estudos, é que “realidade” dificilmente vem sem aspas.

Para as pessoas que tem opiniões fortes e firmes sobre um assunto – sejam fanáticos da Apple, partidários do aborto ou pessoas que acham que sabem a verdade sobre o aquecimento global ou o que acontece no Oriente Médio – a realidade parece distinta e bem iluminada, e a “objetividade” jornalística inevitavelmente produz uma foto mais embaçada. As pessoas dizem que querem objetividade, mas elas não querem dizer isso da mesma forma que os repórteres; é um realismo ingênuo, elas acreditam que o próprio ponto de vista delas é objetivo, então qualquer “objetividade” tem de parecer com a realidade na cabeça delas. Quando ela não se parece – mesmo quando isso não é possível – a platéia assume o pior. O repórter deve estar lambendo as bolas de alguém.

O (ótimo) livro de Manjoo pinta um cenário preocupante que se vê em qualquer segmento do jornalismo. Para o autor, é uma questão econômica: quem não tomar partido perderá audiência. E nesse sentido, parece não ser muito complicado criar robôs que ignoram ativamente informações que contradizem o que o público acredita, ou que busque fontes de notícias que rotineiramente concordamos. No caso de tecnologia, basta um algoritmo que pesquise releases, RSSs de sites gringos, traduzam, junte com tuites “influentes” e eliminem a parte embaçada. Na prática, parece ser mais fácil criar um robô radical do que um com uma análise razoavelmente equilibrada. Trolls que repetem argumentos batidos e muitas vezes errados parecem um bocado com robôs, olhando em retrospectiva. Mas divago.

Então, com a tecnologia de hoje ou de um futuro próximo, computadores seriam bons em fazer matérias radicalmente opinativas ou absolutamente informativas. Em outras palavras, jornalismo nível fácil. O advento da Narrative Science está gerando um certo pânico, mas deveria ser visto como um lembrete de que é importante repensar o jornalismo, tanto do ponto de vista dos profissionais que escrevem as notícias do dia a dia (jornalistas ou não) quanto dos leitores: o que exatamente queremos ao abrir um site no navegador, seja um portal ou um blog? Sermos informados? Entretidos? Ter as opiniões confirmadas? É uma discussão interessante que, acho, robojornalistas não pensariam em fazer. Ainda.

fique por dentro
das novidades giz Inscreva-se agora para receber em primeira mão todas as notícias sobre tecnologia, ciência e cultura, reviews e comparativos exclusivos de produtos, além de descontos imperdíveis em ofertas exclusivas