No domingo, uma das agências de saúde pública do Reino Unido anunciou que 15.841 casos de covid-19 não foram relatados devido a um “problema técnico” que ocorreu durante “o processo de carregamento de dados”. Enquanto os cidadãos exigem respostas, parece cada vez mais provável que um simples erro no Microsoft Excel seja o responsável pela falha nos dados.

A Public Health England (PHE) é responsável por comparar os resultados dos testes de covid-19 que são fornecidos por laboratórios públicos e privados em todo o Reino Unido. Os dados devem ser publicados diariamente, e o banco de dados é usado para identificar indivíduos para medidas de rastreamento de contatos. A PHE disse que o problema técnico fez com que as autoridades perdessem temporariamente os dados inseridos entre 25 de setembro e 2 de outubro. A maior parte das perdas de dados ocorreu entre 30 de setembro e 2 de outubro, informou a agência em um comunicado.

A PHE afirma que todos os pacientes que receberam um diagnóstico positivo para o coronavírus foram informados e que agora tudo foi adicionado ao sistema adequado de rastreamento de contato do NHS Test and Trace. Mas um tempo precioso foi perdido devido ao erro. O Guardian estima que 50.000 contatos foram perdidos enquanto o erro passou despercebido.

Mas qual foi o erro? A suspeita crescente é que a planilha do Microsoft Excel usada para coletar dados de testes de covid-19 pela PHE acabou ficando sem espaço e ninguém percebeu até que fosse tarde demais.

Sites como o Guardian e o Daily Mail afirmam que, quando um arquivo CSV de um laboratório independente foi recebido e adicionado à lista principal, a planilha do Excel atingiu seu limite de dados. O programa de planilhas suporta no máximo 1.048.576 linhas e 16.384 colunas. A PHE não retornou o pedido do Gizmodo para comentar o assunto, mas o secretário de saúde Matt Hancock supostamente irá entrar em contato com a Câmara dos Comuns sobre o assunto ainda nesta segunda-feira (5).

O escândalo ocorre em um momento em que o primeiro-ministro do Reino Unido, Boris Johnson, vem alertando os cidadãos sobre tempos difíceis pela frente, à medida que surtos de covid-19 se aceleram e bloqueios mais rígidos são implementados. Seja ou não um erro do Excel o culpado pelo erro nos dados, a PHE tem sido um desastre tão grande durante a pandemia do coronavírus que está definido que ela será abolida e substituída por uma nova agência em um futuro próximo.

Max Rosser, pesquisador de Oxford e fundador do projeto Our World In Data, aproveitou a oportunidade para destacar a necessidade de um maior foco na integridade dos dados da planilha. Rosser tuitou que “teve dificuldades no passado para explicar aos financiadores que o aprendizado de máquina e a IA não são as próximas etapas mais urgentes. Arquivos csv limpos e precisos são as fronteiras”.

Conforme o Guardian aponta, vimos alguns pequenos erros de inserção de dados gerando resultados importantes nos últimos anos. Em 2013, o banco JPMorgan atribuiu uma perda de US$ 6 bilhões, em parte, a um erro em uma planilha Excel usada para modelagem financeira. E em agosto, pesquisadores anunciaram que mudaram os nomes de 27 genes no último ano porque o Excel estava continuamente reconhecendo os nomes antigos como datas. Era simplesmente mais fácil mudar os nomes do que abandonar o Excel.