Duas coisas me chamam atenção nas centenas de reportagens que vemos todos os dias na mídia nos últimos 2 ou 3 meses em relação à COVID019. Uma, mais forte, se refere aos dramas humanos, às histórias de vida, toda a lamentação pelas vidas perdidas e familias destroçadas (e, no Brasil e nos EUA, a associação desse excesso de mortes por causa da falta de políticas adequadas principalmente na esfera Federal e todas as implicações políticas e econômicas envolvidas...). A outra são as muitas estatísticas, números, probabilidades, taxas e curvas de crescimento, uma profusão de números, números e mais números.
Vamos pensar inicialmente nesse segundo aspecto pois ele revela uma série de aspectos interessantes sobre ciência e divulgação científica que temos discutido muito aqui no “Ciência, Universidade e Outras Ideias”. Pensando positivamente, esse ponto ilustra bem uma das expressões atribuídas Galileu, de que "...o Universo é escrito na linguagem da matemática". Entendo que essa tendência da mídia é uma expressão da forte associação da ciência com a matemática e está baseada na credibilidade que essa abordagem quantitativa confere à avaliação da evidência (não que seja a única possível, claro). Embora algumas formas de pseudociências até usem de forma desonesta dados, fórmulas e gráficos tentando almejar credibilidade, essa tentativa não resiste a uma análise minimamente aprofundada.
Entretanto, há alguns problemas na utilização de uma abordagem quantitativa e matemática para divulgar a ciência pois, de fato, apenas isso não significa “boa ciência”, do mesmo modo que a ausência de uma abordagem quantitativa não significa “ciência ruim” (nosso exemplo sempre muito citado são as diferentes abordagens originais de Newton e Darwin). No final, não adianta usar métodos matemáticos e estatísticos sofisticados sem ideias claras, hipóteses bem formuladas e, acima de tudo, uma atitude correta diante da evidência, como já discutimos. Por outro lado, uma argumentação discursiva é realmente testável com o mesmo grau de confiabilidade e repetibilidade? Longa discussão que pode ficar para outro momento...
De qualquer forma, há outro problema importante nesse aspecto que está associado à uma dificuldade de comunicação. Em um primeiro momento, podemos pensar que usar números, gráficos e curvas torna tudo “objetivo” (o que é verdade apenas em parte). Mas todos temos as nossas dificuldades em matemática e talvez até por isso a utilização de números e estatísticas possa passar uma falsa impressão de que as informações estão corretas e são confiáveis, como mencionei acima. Pior, em geral esquecemos que boa parte da população pode ter grandes dificuldades em entender números e gráficos, mesmo coisas mais simples. Com base na minha experiência como professor na UFG há muitos anos sempre me pergunto até que ponto muitas pessoas entendem realmente o que está sendo dito e mostrado, o que pode deixá-las vulneráveis a algumas declarações.
Como exemplo e voltando ao contexto da COVID-19, vamos pensar nas declarações repetidas do Presidente Bolsonaro de que 70% da população vai ser infectada pelo vírus. Segundo ele, "Devemos falar ao povo: calma, tranquilidade. 70% será contaminado" (em 20/04); “É uma neurose, 70% vai pegar o vírus. Não tem como! Loucura" (em 09/05) e “É pior pô. O vírus vai atingir 70%. Vocês sempre batem em mim, que falo da questão da saúde" (em 11/05).
Bolsonaro aparentemente pegou esse número de uma declaração do importante epidemiologista da Universidade de Harvard, o professor Marc Lipsitch. Ele de fato colocou em seu twitter (e depois em uma entrevista no “Washington Post”) em 14 de fevereiro que
“Why do I think 40-70% infected? Simple math models with oversimple assumptions would predict far more than that given the R0 estimates in the 2-3 range (80-90%). Making more realistic assumptions about mixing, perhaps a little help from seasonality, brings the numbers down”
Alguns dias depois, ele revisou esses números para valores menores, entre 20% e 60%, considerando a variação nas medidas de distanciamento social implementadas em diferentes momentos em cada um desses países e regiões (vejam aqui a sequência de discussões sobre o assunto).
Mas de onde Lipsitch tirou esses números? Ele chegou a esses valores a partir de uma estimativa de um dos números mais importantes em epidemiologia e que tem ganhado destaque em toda a mídia, o que chamamos de número reprodutivo básico, ou R0. Esse número, para quem não leu ainda as postagens anteriores, é o número médio de novas pessoas que cada pessoa infectada é capaz de contaminar, em condições "ideais" de transmissão (não sei quantas vezes ainda vou repetir essa frase até o final da pandemia...). Veja que se o R0 é maior do que 1,0, a infecção cresce, pois cada pessoa infectada potencialmente contamina pelo menos mais uma, enquanto valores menores do que 1,0 fazem com que a epidemia desapareça rapidamente (mas calma). Há excelentes revisões sobre o R0 e a sua importância em epidemiologia, vejam por exemplo no CEBM e a postagem fantástica de Marcel Salathé & Nick Case, com várias animações e exemplos super-didáticos. Para uma revisão um pouco mais técnica, sugiro o excelente artigo de Ridenhour e colaboradores, de 2014.
Vejam que Lipsitch fala que uma epidemia com um R0 entre 2 e 3 deveria infectar entre 80-90% da população, mas que como há outros fatores que estão jogando esse número para baixo e como é difícil e incerto juntar diferentes populações (países, municípios etc), ele revisou isso para 20% - 60%. Então isso significa que existe uma relação entre o “tamanho” da epidemia (ou seja, o número final de pessoas infectadas) e o R0? Sim, é como se um R0 mais baixo não tivesse “força” para atingir muitas pessoas, e logo isso vai fazer mais sentido para vocês...Realmente, existem muitas relações interessantes que emergem a partir da dinâmica dessas transmissões ao longo do tempo. Essa relação não-linear entre o R0 e a proporção final de pessoas infectadas na população, às vezes chamada de attack rate, está na figura abaixo.
Então, se pegamos realmente diversos valores ao acaso de R0 mais ou menos entre 2 e 3 (com média 2,5 e uma distribuição normal com desvio-padrão de 0,5, o pequeno histograma vermelho no canto superior à esquerda do histograma) e calculamos essa proporção de pessoas infectadas, ficamos com uma mediana de 89%, como pode ser visualizado na Figura abaixo.
Algumas pessoas podem achar essa relação estranha, podendo argumentar o seguinte: mesmo com um R0 baixo, se ele for maior do que 1 a infecção sempre irá crescer, indo até que todos os suscetíveis estejam contaminados. É só uma questão de tempo, certo? Em princípio parece correto intuitivamente, mas está errado...
Nós já discutimos o modelo SIR (Suscetíveis, Infectados e Recuperados) e pela sua lógica simples à medida que os suscetíveis são infectados e depois se recuperam (ou morrem), o número de suscetíveis se reduz e gradualmente, de modo que à medida que o número de infectados aumenta mais depois começa a diminuir (pois há cada vez menos novas pessoas para ficarem infectadas). Ao mesmo tempo, o número de pacientes que se recuperam da doença aumenta, como mostrado na Figura abaixo (que não é de fato um SIR simples, é uma apresentação diferente do nosso modelo de simulação para Goiás, que discuti anteriormente). Mas vejam que, voltando ao raciocínio anterior, isso não aconteceria dessa forma se o mesmo número de pessoas continuasse a ser infectado, em média, durante todo o tempo. A curva cresceria exponecialmente até um ponto de máxima e estabilizaria de forma abrupta (quando não existissem mais individuos suscetiveis).
O que está faltando entendermos é que, à medida que a epidemia progride e o número de pessoas susceptíveis começa a diminuir, a chance de alguém se contaminar a partir de alguém já contaminado começa também a diminuir. Em outras palavras, fica cada vez mais difícil para alguém ter a possibilidade de infectar alguém ainda não tenha sido infectado, pois alguma pessoas em volta dela já estão imunizadas (se for o caso e felizmente parece ser, por enquanto, o que acontece com a COVID-19). Então, isso significa que, na prática, o R0 vai ficando menor, reduzindo na proporção do número de suscetíveis S em relação ao tamanho da população (S/N). Vejam na ilustração abaixo: se temos um R0 de 3, cada pessoa infectada vai infectar algumas pessoas próximas (linhas vermelhas cheias abaixo; contem as linhas vermelhas cheias e dividam pelo número de infectados). Mas imaginem que, em um momento posterior, metade da população já foi infectada (e está imunizada, ou morreu). Nesse caso, nem todas as transmissões vão se efetivar (linhas tracejadas) e, portanto, o número reprodutivo EFETIVO naquele momento, que chamamos RE ou Rt, vai ser igual a 3 * 0.5 = 1,5! Basta contar o número de linhas vermelhas cheias nas figuras abaixo e dividir pelo número de individuos infectados e vocês vão chegar nesses números de RE. Gradualmente esse número se reduz e é por isso que aparece a curva epidêmica, que chega a um pico de pessoas infectadas e depois começa a decair. Estamos vendo isso já em alguns países (mas ainda não no Brasil, em nenhuma das grandes cidades, infelizmente...).
Então, há sempre uma confusão entre o R0, que é um parâmetro teórico inicial, quase “Platônico” (em um sentido estatístico) e o RE. Isso mostra também que esse valor de R0 não é algo fixo, ou intrínseco, à doença. Ele é o valor médio no número de transmissões em uma dada situação "ideal", por exemplo, no começo da epidemia (quando todos os indivíduos são suscetíveis), mas ele depende, por exemplo, da própria densidade populacional. Por isso Lipstich revisou suas estimativas, os cálculos do R0 (RE de fato) eram bem menores do que os assumidos inicialmente e conseguem rapidamente ser reduzido por várias estratégias de isolamento e distanciamento social (apesar do que os idiotas como Osmar Terra, Alexandre Garcia e outros dizem). Vejam que o raciocínio da figura acima, mostrando a diferença entre R0 e RE, é o mesmo em relação ao isolamento social. Se uma parte da população está isolada e/ou tomando todos os cuidados para não se infectar, isso reduz o RE e, consequentemente, achata a curva e reduz o número final de pessoas infectadas. É uma questão absolutamente simples e obvia se vocês olham e entendem a figura acima.
Outra questão interessante que aparece aqui em relação ao R0 e RE é a chamada “imunidade de rebanho”, que é um conceito importante, por exemplo, para definir estratégias de vacinação. Vejam, se na prática o R0 é reduzido linearmente à medida que a infecção avança na razão S/N, então se o R0 de uma doença for igual a 3 e 70% da população já se infectou, isso significa que assim que o vírus chegar, o R0 inicial de 3 se transforma instantaneamente em um RE de 3 * 0.3, ou seja, fica igual 0,9. Assim, a infecção não vai avançar e já começa na fase de declínio, o que se chama de limiar da “imunidade de rebanho” (ou herd immunity threshold). Vejam que isso é diferente do attack rate, se deixarmos uma infecção progredir desde o início com um R0 de 3 sem fazer nada para diminuí-la ela não vai parar próxima ao 70%, ela vai avançar até alcançar algo como 90% da população, como vimos acima. Esse conceito de "imunidade de rebanho" é importante se a infecção já começa com uma população parcialmente imunizada (no caso de outra doença que não a COVID-19).
Mas vejam que, de qualquer modo, a ideia também poderia ser aplicada à atual pandemia. Ou seja, se conseguimos manter uma boa parte da população isolada (uma pequena cidade, por exemplo) e os suscetíveis estiverem distribuídos ao acaso nessa população, olhando a Figura acima vamos perceber que o RE rapidamente decairia para um valor menor do que 1, de modo que a epidemia desapareceria rapidamente. Na prática isso é bem difícil, mas é o que se tenta em estratégias mais radicais de isolamento, como um lockdown, que já está sendo aplicado em várias cidades no Brasil.
Voltando ao SIR e ao Lipstich, o que muitas pessoas fazem é aplicar versões mais sofisticadas do modelo SIR e tentar estimar, por exemplo, o R0 e qual o attack rate, o número total de pessoas infectadas, o que pode ser difícil em fases mais iniciais da epidemia. Além disso, pode-se pensar que esse número vai ser, por exemplo, igual a 10% da população (e isso pode ser feito assumindo que 90% da população está isolada e tomando todos os cuidados). Esses outros parâmetros do SIR às vezes são estimados a partir do próprio dado, mas os 10% em muitos casos termina sendo um pressuposto. Claro que é difícil chegar nesse valor de 10% pois ele já envolve precisamente a capacidade do Governo ou da própria população se isolar da infecção e diminuir assim o número médio de transmissões. Além disso, isso leva a uma outra concepção errônea e que vocês podem ouvir às vezes, dizendo algo como “o número de pessoas que vai morrer ou ser infectada é o mesmo”, é “só uma questão de achatar a curva e prolongar o pico para que o sistema de saúde aguente, mas no final dá na mesma...”. Mais tecnicamente, alguns podem dizer que a “área sob a curva” é a mesma. Realmente, isso é uma propriedade matemática a partir de algumas implementações dos modelos SIR mais simples (que simplesmente modelam percentagens a partir da população suscetível - como coloquei na figura do SIR acima), mas não é bem assim. Além da relação entre o R0 e a proporção final de pessoas infectadas que mostrei acima, não podemos esquecer que a dinâmica do RE ao longo do tempo não é tão simples quanto uma relação direta com S/N, pois a cada instante o comportamento das pessoas muda, esses valores oscilam e podem se reduzir uma vez que o Governo interfere no comportamento ou mobilidade das pessoas para impedir o avanço da epidemia.
No modelo que desenvolvemos para tentar entender a expansão da pandemia em Goiás, por exemplo, adotamos uma estratégia um pouco diferente para implementar um modelo do tipo SIR, associando diretamente o RE ao nível de isolamento social medido por telefonia celular. Essa associação vem de uma relação derivada empiricamente, e vamos avançando na curva epidêmica a partir do número “observado” (na simulação) de transmissões em cada tempo, gerando os vários eventos no futuro. Ou seja, se o isolamento social está em torno de 50%, alguns trabalhos sugerem que o RE cairia para algo em torno de 1,1 ou 1,2, a partir de um R0 teórico inicial em torno de 2,7 (essa é só a ideia, a relação é mais complexa; para aqueles mais interessados no modelo e no método vejam as notas técnicas na nossa webpage e o relatório recente do Imperial College sobre o Brasil). Na nossa simulação, vemos que os valores de RE gerados pelas simulações tendem a cair a partir do decreto das medidas de isolamento social em Goiás em meados de março, mas depois começam a subir lentamente. Essa subida no RE ocorre porque o índice de isolamento social, depois de um aumento importante, vem diminuindo gradualmente desde então. Vejam que estamos assumindo fortemente que o efeito de medidas individuais comportamentais de higiene, como lavar as mãos e usar máscaras, ou tem um efeito muito pequeno na prática ou está bem correlacionado com o isolamento (ou seja, pessoas que estão ficando mais isoladas tendem também a ser aquelas mais “conscientes” do problema da COVID-19). Sabemos que há uma correlação entre isolamento (por telefonia celular) e redução nas transmissões, mas ainda não conseguimos avaliar bem o potencial efeito adicional das medidas comportamentais no nível da população. Assim, se esse pressuposto do nosso modelo de que as transmissões refletem apenas isolamento social em nível populacional continuar válido, vamos ter problemas com um aumento da pandemia em breve.
Além disso, é possível também calcular esse RE a partir de dados do crescimento no número de casos, de diversas formas, e os circulos vermelhos na curva acima referem-se exatamente a algumas dessas estimativas iniciais, com diferentes conjuntos de dados em Goiás. Mas o problema é que, pela progressão muito lenta da COVID-19, em termos de tempos de incubação e desenvolvimento dos sintomas, além da demora de notificação e confirmação dos casos, só é possível, de fato, estimar esse RE com um atraso (vejam que, na figura, só conseguimos chegar com alguma confiança até final de abril/início de maio). Embora nesse caso os valores estejam razoavelmente ainda próximos a 1,2, é bem possível que hoje, mais de 20 dias depois dessas estimativas...É bem possível que esses valores já estejam maiores, pois temos visto uma diminuição progressiva e consistente do isolamento social, em parte como consequência de medidas de flexibilização da quarentena pelo Governo (e em parte por causa da incrível campanha publicitária e nas mídias sociais dos Bolsominions contra a quarentena...). Vamos discutir essa questão da quarentena em outro momento, mas precisamos acompanhar de perto pois as perspectivas não são boas se o pressuposto do modelo continuar válido...
Mas imagino que, à essa altura, mesmo aqueles que conseguiram chegar até esse ponto já devem estar cansados dos números. Cai na mesma armadilha que coloquei no começo do texto e estou tentando usar argumentos numéricos para explicar o avanço da pandemia e mostrar porque o isolamento social é importante para seu controle. Em minha defesa, posso tentar dizer que me esforcei para explicar em uma linguagem mais simples e com forte componente visual. Deu certo?
Números, números e números...Agora que entendemos mais ou menos de onde Bolsonaro tirou esses 70% (equivocadamente, exceto se ele estiver assumindo que o R0 da COVID-19 no Brasil for igual a 1,72; mas pelo menos sabemos de onde veio o número e permite ilustrar bem o problema que temos!), vamos voltar à sua declaração e ver o outro lado da questão, o drama humano. Quando ele fala de 70% da população brasileira se infectando com a COVID-19 ele esquece do drama humano envolvido nisso tudo. Isso pode ser simplesmente uma visão real do modo como controlar a pandemia que, de fato, outros governantes da Europa já deixaram sugeriram, inclusive o primeiro-ministro Britânico (que mudou de ideia depois de passar alguns dias na UTI infectado). Por outro lado, pode ser uma limitação intelectual associada a outro problema de percepção em relação aos grandes números. De qualquer modo, mostra a visão mesquinha e limitada de Bolsonaro.
Vamos supor hipoteticamente que, em uma sociedade com uma visão diferente da nossa, haja uma infecção por um vírus como a COVID-19 com um R0 em torno de 3. Pela ideia do attack rate que discutimos acima, isso significa que 94% da população, o que equivale no Brasil a 188 milhões de pessoas (arredondando que temos 20000000 de habitantes) da população vai se infectar no devido tempo. É difícil estimar a taxa de mortalidade "real" da COVID-19, mas apenas como referência vamos usar 0,5%, um valor um pouco menor do que o estimado pelo grupo do Imperial College (algumas pessoas falam de valores menores, em torno de 0,1%, mas não muda muito o raciocínio a seguir). Então, estamos falando nesse caso de algo em torno de 940000 mortes (novecentas e quarenta mil mortes, ok?). Vejam que essa estimativa vem da mortalidade por infectado, bem mais difícil de estimar por causa dos assintomáticos, e não a taxa por “caso”, que são pessoas que realmente ficaram doentes, em geral em estado mais grave (e que no Brasil está por volta de 5%-7%). Estamos então falando de quase 1 milhão de mortes e essa foi de fato a estimativa polêmica do Imperial College no final de março. Podemos não gostar e já saber hoje que ela não é realista justamente por causa das medidas para implementar um forte isolamento social. Mas sob um ponto de vista teórico ela está absolutamente correta e explicita, considerando o pressuposto de que o R0 não iria ser mitigado, sendo derivada de tudo que mostrei acima. E vejam que não estamos nem falando aqui que, com essa quantidade de infectados, a demanda por serviços hospitalares seria absurdamente alta: consequentemente, teríamos de fato um número ainda maior de pessoas iria morrer não só pela COVID19 como por qualquer outra demanda hospitalar que, se não atendida, levaria à morte ou sequelas graves. Enfim, um caos total no sistema hospitalar e um número absurdo de mortes por muitas e muitas razões.
Vocês conseguem imaginar o impacto de 1 milhão de mortes no Brasil? O impacto em termos de desestruturação de famílias e de efeitos psicológicos? Desculpa, eu acho que eu mesmo não consigo dimensionar todo o impacto desses números, provavelmente estou sendo vítima do mesmo problema de dificuldade de percepção dos grandes números. Acho que está fora da minha escala de percepção e, além disso, estou tentando racionalizar sobre os números, outra falha...Mas pelo menos estou tentando entender e interiorizar o seu significado, estou trabalhando CONTRA esses números...
Então, quando Bolsonaro fala normalmente que é inevitável que 70% da população se infecte e insiste que o isolamento social não funciona ou não funcionou (o que obviamente é ridículo diante de tudo que você leu acima...), isso é aceitável? Estou falando do ponto de vista humanitário mesmo, ou seja, é aceitável que um presidente de uma nação fale isso? Refazendo as contas acima com os 70%, ele está falando em lidar com pelo menos 700 mil mortes iniciais, com o mesmo colapso do sistema de saúde e todos os efeitos sociais, psicológicos e econômicos decorrentes disso. Como disse antes, talvez ele simplesmente não entenda bem o que está falando, esteja falando de forma inconsequente (não que seja um assunto para se brincar ou para ser inconsequente...). Mas se estiver sendo bem assessorado e realmente entendendo todas as consequências do que ele fala, temos sem dúvida um problema de atitude genocida! Como disse antes, se for esse o caso, que o Deus dele, seja lá qual for, tenha piedade dele - pois tenho certeza de que a História não vai ter...
Capa: arte de Mariana Telles!
Excelente artigo! Além dos esclarecimentos sobre os modelos epidemiológicos, apresenta sólidos argumentos para que continuemos com as campanhas de isolamento social, o quanto for possível pela população, especialmente em Goiânia e região metropolitana.