1. Introdução
Desde o surto da síndrome respiratória aguda grave (SARS) há quase duas décadas, um grande número de coronavírus relacionados à SARS (SARS-CoVs) potencialmente infectantes aos humanos foi descoberto. O SARS-CoV-2, causador de uma epidemia de síndrome respiratória aguda, foi estudado a partir de sequências de genoma que foram obtidas de cinco pacientes em um estágio inicial da doença, as quais se caracterizaram por serem 96% idênticas no nível do genoma inteiro a um coronavírus detectado em morcegos (Peng et al., 2020).
Segundo Quammen (2020), o surto em Wuhan (China) não é um infortúnio, mas faz parte de uma sequência de contingências como parte de um padrão de escolhas humanas, dentre elas apropriar-se de recursos naturais e gerar distúrbios ecológicos que aumentam as trocas virais pelo aumento da frequência de interações entre humanos e outras espécies. Ainda, segundo Quammen (2020), destruímos os ecossistemas e liberamos os vírus de seus hospedeiros naturais e, quando isso acontece, eles precisam de um novo hospedeiro. Muitas vezes, somos nós humanos.
A obsessiva necessidade da humanidade de estar onipresente pode fazê-la conviver com esse transbordamento viral entre espécies de forma recorrente. Estando o homem contaminado, estará o vírus apto a usufruir das várias redes de transporte dos seus hospedeiros viajantes, inclusive das rotas que eficientemente interligam vários países. A criatura nanométrica poderá chegar a destinos longínquos em questão de horas. Se obtiver sucesso em sua empreitada, esse vírus pode gerar uma pandemia como a ora em curso, durante a qual terá mais chances de sofrer mutações e tornar-se até mais letal ou mais transmissível.
O peregrino SARS-CoV-2 tem executado esse script darwiniano eficientemente, visto que suas variantes têm maior avidez pelo receptor celular humano e podem levar a uma menor eficácia da vacina dependendo do tipo de imunizante. Algumas linhagens também escapam ao tratamento com anticorpos monoclonais (Brandão, 2021).
O SARS-CoV-2 não foi o primeiro e não será o último parasita intracelular a expandir seus espaços territoriais de contaminação se valendo do deslocamento humano. Vírus diversos executaram - e continuarão a cumprir - o roteiro: usufruir da tecnologia de transporte que o homem construiu ao longo da sua história. É possível, inclusive, que essa realidade se torne rotineira.
Considerando a possibilidade de a problemática exposta configurar-se recorrente, o deslocamento do homem no espaço territorial é uma questão de estudo relevante, pois é o portador do vírus que eventualmente ampliará a área territorial infectada, fazendo surgir novos casos inaugurais em locais outrora livres da doença. Em particular, um objeto de estudo poderia ser a existência de uma correlação formalmente descritível entre o surgimento do primeiro caso de SARS-CoV-2 em unidades territoriais (países, estados, cidades) e as quantidades de viajantes que a esses locais se destinaram.
No trabalho ora proposto, os estados (frequentemente designados como Unidades Federativas doBrasil , ou simplesmente pelo acrônimo UFs) foram convencionados como a unidade territorial padrão de destino dos viajantes. A hipótese aventada pressupõe que quanto mais passageiros viajarem à uma UF ainda livre do vírus, maiores as chances de que um deles esteja infectado pelo SARS-CoV-2. A consequência seria o aumento da probabilidade de antecipar a ocorrência da primeira infecção no destino. Assim, se a quantidade de passageiros é previamente conhecida, então talvez seja possível a predição da ordem de contaminação das UFs antes mesmo que uma futura - e indesejável - pandemia ocorra. A pesquisa também almejou analisar se o local de onde o passageiro advém pode influenciar a data do primeiro caso de SARS-CoV-2 no destino, pois locais de origem que recebem mais passageiros também teriam maiores chances de exportarem infecções aos destinos finais de outros viajantes.
2. Fundamentação teórica
2.1 Breve caracterização do transporte interestadual de passageiros no Brasil
Paiva e Müller (2014) afirmam que, no Brasil, os principais meios de transporte públicos utilizados em viagens são o avião e o ônibus, já que os transportes ferroviário e hidroviário, residuais, pouco atendem as rotas do país.
Segundo Amora e Matais (2011), o número de passageiros de avião superou, em 2010, o número de viajantes de ônibus interestaduais pela primeira vez noBrasil. A informação da reportagem é coerente com o exposto pela página Dados e Estatísticas da Agência Nacional de Transporte Terrestres (ANAC, 2019), que divulgou o gráfico de evolução das quantidades percentuais e anuais de passageiros que utilizam os modais aéreo e rodoviário em viagens interestaduais, conforme a Figura 1.
A partir do fato de que esses são os principais meios de transporte noBrasil, é possível afirmar que o SARS-CoV-2 se serviu com avidez ímpar das rotas dos viajantes infectados: em um país de dimensões continentais, trafegando em seus hospedeiros pelas principais rotas interestaduais, o SARS-CoV-2 registrou casos em todas as vinte e sete UFs em apenas vinte e seis dias1 após sua chegada ao país, conforme demonstra o a Figura 2.
Assim, para entender a ordem de ocorrência dos primeiros casos em cada UF doBrasil, uma alternativa seria estudar os deslocamentos daqueles que carregam o vírus país afora: os viajantes nas modalidades aéreos e rodoviários (aviões e ônibus interestaduais, em ambos os casos em rotas comerciais regulares).
Existem outras modalidades de deslocamento de viajantes não utilizadas na pesquisa, como as dos condutores e passageiros de transportes de carga rodoviária (caminhões), os que viajam por meios próprios (aviões, carros e motos particulares), os passageiros e condutores da malha hidroviária e ferroviária, e outros meios que certamente o estudo deveria considerar.
Entretanto, diferentemente dos transportes aéreos e por ônibus interestaduais, não há dados abertos governamentais dessas outras modalidades. Esse vácuo não inviabiliza a pesquisa, visto que estão disponíveis, em sites de dados abertos do governo federal, os fluxos de passageiros dos dois principais tipos de transporte interestaduais2 alhures descritos. Além disso, o trabalho ora desenvolvido não busca, como insumo de pesquisa, um retrato exato - e até mesmo impossível - de todos os fluxos de passageiros por inúmeras vias.
O que a pesquisa procurou foi uma aproximação razoável construída com dados disponíveis e que retratam os casos mais comuns dos fluxos interestaduais de pessoas. Assim, a ausência dos fluxos de viajantes excepcionais foi tratada como ruído e os dados de passageiros usados no trabalho foram aqueles permitidos pela realidade concreta.
Considerando serem estes passageiros candidatos a hospedeiros virais, as rotas por eles viajadas podem ser, em um percentual razoável, o principal meio pelo qual o vírus ocasionou os primeiros casos de SARS-CoV-2 em algumas UFs do Brasil.
O vírus acompanhou seu hospedeiro e percorreu, portanto, uma rede formada por Estados e as suas interligações que pode ser representada por um grafo de uma rede social no qual essas UFs são os vértices. Uma única aresta direcionada (ligação) representaria todas as rotas aéreas e rodoviárias entre uma UF de origem e outra de destino. Cada uma dessas ligações teriam um peso diferenciado, pois elas seriam ponderadas pelo total de passageiros que percorrem mensalmente essa rota em ambos os modais (aéreo e rodoviário). Nesse cenário, o grafo descrito pode ser analisado por suas métricas oriundas dos estudos de análise de redes sociais.
Segundo Gündüz-Ögüdücü e Etaner-Uyar (2014), a análise de redes sociais envolve a medição de métricas estruturais particulares, a fim de compreender os conceitos fundamentais dos grafos sociais. As métricas são usadas para caracterizar e analisar conexões dentro de uma determinada rede social. Algumas dessas métricas representam as características de vértices individuais, enquanto outras inferem um padrão que pertence à rede como um todo.
2.2 Métrica Pagerank3
Os motores de busca da web visam destilar os resultados por sua relevância e autoridade, e alguns deles consideram que uma boa autoridade é uma página que é apontada por muitos bons hubs, enquanto um bom hub é uma página que aponta para muitas boas autoridades (Elmasri & Navathe, 2011). Usando esse princípio, a empresa Google criou o algoritmo denominado PageRank para classificar páginas web por sua relevância e autoridade. O algoritmo dessa métrica calcula uma classificação dos vértices no grafo G com base na estrutura dos links de entrada. Ele foi originalmente projetado para determinar a posição relativa de uma página em relação a outra, classificando-as numa ordem de importância.
A métrica de rede Pagerank é descrita como:
A literatura de citações acadêmicas foi aplicada à web, em grande parte contando citações ou backlinks para uma determinada página. Isso dá uma estimativa da importância ou qualidade de uma página. O PageRank estende essa ideia por não contar os links de todas as páginas de forma igualitária, e por normalizar pelo número de links em uma página (Brin & Page, 1998, p. 4).
Segundo Elmasri e Navathe (2011), supondo P(X) o PageRank de qualquer página X,C(X) o número de links de saída da página X e sendo d um fator de amortecimento no intervalo 0 <d <1 (normalmente d é definido a 0,85); então, o PageRank para uma página A pode ser calculado como:
Na expressão, T1, T2, ..., Tn são as páginas que apontam para a página A. O PageRank forma uma distribuição de probabilidade nas páginas da web, de modo que a soma dos Pageranks de todas as páginas web é 1 (um) (Brin & Page, 1998). Para ilustrar o algoritmo, considere uma pequena web que consiste em três páginas A, B e C e, entre elas, algumas ligações (links), conforme ilustra a Figura 3.
O fator de amortecimento d geralmente é definido como 0,85, mas para simplificar o cálculo, foi adotado o valor 0,5. Abaixo estão montadas as equações para o cálculo do PageRank (Sobek, 2002):
A solução das equações anterior nos dá como resultados: PR(A) = 1,07692308; PR(B) = 0,76923077 e PR(C) = 1,15384615. A soma dos três PageRanks obtidos corresponde a 3 (três), ou seja, 100% das páginas. Calculadas as métricas, as páginas agora podem ser classificadas.
O PageRank pode ser adaptado para redes ponderadas como uma extensão do algoritmo convencional baseado no mesmo conceito, mas realizando a multiplicação pelos pesos (Kulshreshtha, 2020).
2.3 Escalonamento de valores numéricos via norma lização
A normalização é uma técnica de escalonamento de valores numéricos utilizada em uma etapa de pré-processamento dos dados. Sua ideia central consiste em realocar variáveis de ordens de grandeza diferentes em intervalos iguais.
Segundo Patro e Sahu (2015), a técnica que fornece transformação linear incidente sobre a faixa original de dados é chamada de Normalização Min-Max, a qual pode ajustar as variáveis dentro de um limite pré-definido e pode ser obtida pela aplicação da seguinte expressão:
Onde:
2.4 Correlação entre variáveis
Segundo Devore (2005):
Dados os n pares de observações (x1, y1), (x2, y2), ..., (xn, yn), é natural que se fale de x e y como tendo uma relação positiva, se xs grandes estiverem pareados com ys grandes e xs pequenos com ys pequenos. De modo semelhante, se xs grandes estiverem pareados com ys pequenos e xs pequenos com ys grandes, então está implícita uma relação negativa entre as variáveis. (p. 468)
As relações (negativa e positiva) acima descritas podem ser expressas pelo coeficiente de correlação, cujo cálculo é obtido pela seguinte expressão:
Devore (2005) ilustra com os seguintes gráficos (Figura 4) algumas possiblidades visuais para um gráfico gerado entre duas variáveis e a caracterização do coeficiente de correlação r entre ambas:
2.5 Erro Médio Absoluto
Considere algumas observações estatísticas, cada uma delas nomeadas como (Oi; i=1,2,3...n) e considere algumas predições (Pi; i=1,2,3,4...n) da mesma variável. O erro ei entre o que foi observado e o que foi predito e o erro médio absoluto (Mean Absolute Error ou MAE) podem ser calculados (Willmott & Matsuura, 2005), como:
3. Metodologia
3.1 Obtenção dos dados
Os dados da pesquisa foram obtidos em diversas fontes de dados abertos, todas listadas na Tabela 1 abaixo:
tipo de informação | fonte | local de download |
dados dos estados (ufs) | ibge | http://geoftp.ibge.gov.br/ |
dados estatísticos do transporte aéreo | anac | https://www.anac.gov.br/acesso-a-informacao/dados-abertos/areas-de-atuacao/voos-e-operacoes-aereas/dados-estatisticos-do-transporte-aereo |
dados de bilhete de passagem coletados pelo sistema de monitoramento do transporte rodoviário interestadual e internacional coletivo de passageiros (monitriip). | antt | https://dados.antt.gov.br/dataset/monitriip-bilhetes-de-passagem |
dados do sistema de controle dos serviços de transporte rodoviário de passageiros sisdap | antt | https://portal.antt.gov.br/estatisticas-e-estudos-de-servicos-de-transporte-de-passageiros |
dados dos casos de covid brasil | site brasil.io4 * | https://brasil.io/dataset/covid19/files/ |
Fuente: elaborados pelos autores.
* O site Brasil.IO tem facilita o acesso a dados públicos brasileiros. O projeto é colaborativo e todo o código está disponível como software livre, cujos custos são pagos através de uma campanha de financiamento coletivo.
3.2 Estruturação de uma analogia entre a web e a rede de passageiro interestaduais
É possível fazer uma analogia entre páginas web e o fluxo de passageiros em um país. Sob esse aspecto, enquanto as ligações entre páginas web são hiperlinks de entrada e de saída, nas Unidades Federativas de um país elas são os fluxos de partida e chegada de passageiros entre dois Estados distintos.
Na web, as páginas podem ser classificadas quanto ao prestígio pela métrica PageRank. Uma página com alto PageRank não é só aquela com muito links de entrada, mas aquela que é bem apontada por páginas também prestigiadas. Por isso, o PageRank de um vértice não depende apenas dos links nele incidentes, mas também da qualidade dos vértices donde as ligações se originam.
No contexto semanticamente adaptado para a pesquisa, o Pagerank de uma rede de passageiros não seria apenas a quantidade de pessoas que desembarcam em um local de destino da viagem; para além disso, a métrica também depende do prestígio dos locais de origem donde esses passageiros partiram.
3.3 Cálculo do PageRank das Ufs
De posse da data do primeiro caso de SARS-CoV-2 em cada UF, mas considerando que datas são menos manipuláveis em termos quantitativos, foi realizada uma conversão dessa variável para números ordinais, da seguinte forma: a data do primeiro caso ocorrido no país, no Estado de São Paulo, em 25/02/2020, foi convencionada como dSP = 1. O Rio de Janeiro, por sua vez, teve seu primeiro registro de infecção em dia 05/03/2020, logo dRJ = 10 (décimo dia desde que o primeiro caso foi registrado).
Para cada Unidade Federativa do Brasil, a pesquisa também realizou o cálculo do respectivo Pagerank PR.
A Tabela 2 relaciona as UF´s brasileiras, seus PageRanks ponderados e a data ordinal da ocorrência do 1º caso registrado. Apresenta também essas variáveis normalizadas pelo método Min-Max para um intervalo entre [0,1].
UF | Nome da UF | Data do 1º caso | Variáveis | Variáveis normalizadas pelo método Min-Max para o intervalo [0,1] | ||
---|---|---|---|---|---|---|
Dia ordinal | Pagerank | Dia Normalizado | Pagerank Normalizado | |||
SP | São Paulo | 25/02/2020 | Normalizado | Pagerank | intervalo [0,1] | 1 |
RJ | Rio de Janeiro | 05/03/2020 | Normalizado | 0,068760292 | 0,36 | 0,250921804 |
BA | Bahia | 06/03/2020 | 11 | 0,05829879 | 0,4 | 0,2106896 |
DF | Distrito Federal | 07/03/2020 | 12 | 0,140583265 | 0,44 | 0,527134201 |
AL | Alagoas | 08/03/2020 | 13 | 0,008433079 | 0,48 | 0,018919096 |
MG | Minas Gerais | 08/03/2020 | 13 | 0,075893451 | 0,48 | 0,278354068 |
RS | Rio Grande do Sul | 10/03/2020 | 15 | 0,026717254 | 0,56 | 0,089235259 |
GO | Goiás | 12/03/2020 | 17 | 0,110807948 | 0,64 | 0,412626107 |
PE | Pernambuco | 12/03/2020 | 17 | 0,02799265 | 0,64 | 0,0941401 |
PR | Paraná | 12/03/2020 | 17 | 0,036400133 | 0,64 | 0,126473084 |
RN | Rio Grande do Norte | 12/03/2020 | 17 | 0,008456317 | 0,64 | 0,019008463 |
SC | Santa Catarina | 12/03/2020 | 17 | 0,032421007 | 0,64 | 0,111170401 |
AM | Amazonas | 13/03/2020 | 18 | 0,011288054 | 0,68 | 0,029898585 |
MS | Mato Grosso do Sul | 14/03/2020 | 19 | 0,009948375 | 0,72 | 0,024746531 |
SE | Sergipe | 14/03/2020 | 19 | 0,006806576 | 0,72 | 0,012663989 |
CE | Ceará | 16/03/2020 | 21 | 0,022496306 | 0,8 | 0,073002596 |
AC | Acre | 17/03/2020 | 22 | 0,003630093 | 0,84 | 0,000448067 |
TO | Tocantins | 18/03/2020 | 23 | 0,005511989 | 0,88 | 0,007685349 |
PA | Pará | 18/03/2020 | 23 | 0,014256179 | 0,88 | 0,041313217 |
PB | Paraíba | 18/03/2020 | 23 | 0,008066788 | 0,88 | 0,017510437 |
ES | Espírito Santo | 19/03/2020 | 24 | 0,015829626 | 0,92 | 0,047364286 |
PI | Piauí | 19/03/2020 | 24 | 0,008295436 | 0,92 | 0,018389758 |
AP | Amapá | 20/03/2020 | 25 | 0,003513583 | 0,96 | 0 |
MA | Maranhão | 20/03/2020 | 25 | 0,008768114 | 0,96 | 0,020207555 |
MT | Mato Grosso | 20/03/2020 | 25 | 0,012341023 | 0,96 | 0,03394803 |
RO | Rondônia | 20/03/2020 | 25 | 0,005512056 | 0,96 | 0,007685604 |
RR | Roraima | 21/03/2020 | 26 | 0,003644261 | 1 | 0,000502553 |
Fuente: elaborados pelos autores.
3.4 Análise exploratória da rede de fluxos de viajantes interestaduais
A partir do cálculo do PageRank e de posse do dia ordinal do primeiro caso registrado de SARS-CoV-2 em cada UF do Brasil, foi possível realizar uma análise exploratória preliminar e visual da respectiva rede. Para tanto, um grafo representativo foi gerado para verificar alguma característica que gere intuições acerca de uma eventual relação entre a métrica PageRank e o dia de primeiro caso em cada UF, conforme ilustrado na Figura 5.
Na Figura 5, cada vértice representa uma UF. Presente em algumas delas, o ícone de um avião presente indica as UFs que receberam voos internacionais durante o período de vinte seis dias transcorridos até que todas registraram seus primeiros casos e, a ausência desse ícone representa que apenas voos domésticos (nacionais) incidiram naquele período. Cada ligação (ou aresta) entre um par de UFs representa a totalidade de passageiros que trafegaram tanto no modal rodoviário quanto no modal aéreo. Por sua vez, uma ligação entre o vértice nominado como “exterior” e uma UF representa o fluxo aéreo entre qualquer país estrangeiro e uma UF brasileira apenas na modalidade aéreo. O eixo temporal da abscissa se inicia na ocorrência do caso inaugural, em 25/02/2020, em São Paulo. A análise exploratória permite perceber que os vértices das UFs com maiores PageRanks se situaram, em sua maioria, no início da linha do tempo, ou seja, nos primeiros dias da pandemia. Esse posicionamento de vértices é evidenciado pela presença predominante daqueles investidos em tons em vermelho e laranja situados ao que parece, não por acaso à esquerda do grafo, enquanto os tons mais verdes se acomodaram à direita, espaço reservado aos dias posteriores. Há, também, uma tendência da acomodação das UFs que receberam passageiros de voos internacionais nos primeiros dias da linha do tempo, o que é coerente, visto que a pandemia não teve origem em território nacional, mas sim em países estrangeiros. Adiante, na discussão dos resultados, a pesquisa relatará ser esse um aspecto negativo aos números obtidos no estudo de caso, mas não ao método.
Em apenas 26 (vinte e seis) dias todos os Estados do Brasil já haviam registrado casos de contaminação por SARS-CoV-2. As percepções do grafo apresentado indicam que pode haver uma correlação entre a métrica PageRank e o registro do 1º caso de SARS-CoV-2 em boa parte das UFs do Brasil.
3.5 Correlação entre variáveis da pesquisa
Para confirmar a existência de uma relação entre o dia do primeiro caso de SARS-CoV-2 e a métrica PageRank, é necessário calcular o coeficiente de correlação. O valor obtido do coeficiente de correlação foi -0,79. Há, portanto, uma tendência de que as UFs com maiores PageRanks sejam infectadas antes daquelas que apresentam valores menores para essa métrica. Segundo Mukaka (2012), uma correlação no intervalo entre -70 a -90 é considerada negativa forte. O gráfico da Figura 6 permite mostrar a tendência por meio de uma reta de regressão linear.
4. Resultados e discussão
4.1 Previsibilidade da ordem de UFs a serem infectadas
Visto que a regressão linear foi determinada, podemos obter a reta que a descreve. A reta da equação é: y = -82,77 * x + 21,65.
Assim, de posse da equação, podemos calcular qual seria o y previsto para cada uma da UFs (Tabela 3).
Como resultado, o erro médio absoluto (MAE) calculado com base na tabela acima foi de 3,19 dias.
UF | PageRank | Dia ocorrido | Dia previsto |
---|---|---|---|
0,26354164 | 1 | 1 | |
RJ | 0,06876029 | 10 | 16 |
BA | 0,05829879 | 11 | 17 |
DF | 0,14058326 | 12 | 10 |
AL | 0,00843308 | 13 | 22 |
MG | 0,07589345 | 13 | 16 |
RS | 0,02671725 | 15 | 20 |
Go | 0,11080795 | 17 | 13 |
PE | 0,02799265 | 17 | 20 |
PR | 0,03640013 | 17 | 19 |
RN | 0,00845632 | 17 | 22 |
SC | 0,03242101 | 17 | 19 |
AM | 0,01128805 | 18 | 21 |
MS | 0,00994838 | 19 | 21 |
SE | 0,00680658 | 19 | 22 |
CE | 0,02249631 | 21 | 20 |
AC | 0,00363009 | 22 | 22 |
TO | 0,00551199 | 23 | 22 |
PA | 0,01425618 | 23 | 21 |
PB | 0,00806679 | 23 | 22 |
ES | 0,01582963 | 24 | 21 |
PI | 0,00829544 | 24 | 22 |
AP | 0,00351358 | 25 | 22 |
MA | 0,00876811 | 25 | 22 |
MT | 0,01234102 | 25 | 21 |
RO | 0,00551206 | 25 | 22 |
RR | 0,00364426 | 26 | 22 |
Fuente: elaborados pelos autores.
4.2 Discussão dos resultados
Seria desejável que o erro médio absoluto (3,19 dias) estivesse em uma faixa menor, considerando que o vírus infectou todas as UFs dentro de apenas 26 dias, o que faz com que 3,19 dias sejam um erro de magnitude razoável nesse intervalo de tempo. Os valores previstos, entretanto, perdem importância diante do método apresentado o qual, essencialmente, propõe a utilização do PageRank por paralelismo semântico com os deslocamentos humanos geradores do aumento da área infectada.
priori, o estudo seria mais útil em unidades administrativas menores, como as cidades. No Brasil, 15 dos 27 Estados (ou 55,56% deles) receberam passageiros internacionais durante os 26 dias em que o vírus levou para marcar presença em todas as unidades federativas. Esse fato pode alterar a ordem dos primeiros casos da doença, tendo em vista que os primeiros contaminados advêm do estrangeiro para o interior do país, fato que independe dos fluxos internos de passageiros. Caso a pesquisa tivesse as cidades como unidade territorial, cada resultado seria menos influenciado pelos voos internacionais, a quantidade de previsões seria maior e o intervalo de tempo muito além dos 26 dias que o vírus levou para atingir todas as UFs. Isso possibilitaria uma melhor avaliação dos valores preditos, desta feita menos influenciados pelos voos internacionais e mais dependente do fluxo interno, pois apenas 27 das 5570 cidades receberam passageiros internacionais, ou 0,48% delas, o que revela uma característica excepcional. Isso certamente implica que os voos internacionais, como é de se pressupor, são responsáveis pela introdução dos casos no país e, os fluxos entre cidades pela interiorização no cenário de transmissão comunitária,4 que ocorre quando as transmissões virais se tornam irrastreáveis entre os habitantes. Esse estágio foi oficialmente decretado no Ministério da Saúde do Brasil (Brasil, 2020) em 20/03/2020 em todo o território nacional, menos de um mês após o registro do primeiro caso de Covid-19 no Brasil.
Assim, seria mais adequado usar as cidades como a unidade administrativa padrão. Entretanto, isso apenas seria possível se houvesse disponibilidade de dados abertos dos passageiros intermunicipais. Entretanto, a gestão dos dados dos transportes intermunicipais não cabe ao Governo Federal,5 mas sim aos estados, cujas disponibilidades de dados abertos ainda estão muito aquém do mínimo necessário ao estudo.
Nesse caso a metodologia seria a mesma, o que permite concluir não serem os valores preditos na pesquisa, mas a metodologia, o principal resultado apresentado.
5. Conclusão
A pesquisa sabe da provável existência de diversas variáveis ocultas e indeterminadas que concorrem para o registro do caso inaugural do vírus em cada Unidade da Federação. É sabido também que seria impossível medir todas as causas desconhecidas e não quantificáveis que concorrem para antecipar a data do primeiro caso registrado.
Em contrapartida, para atingir o objetivo pretendido, o modelo da pesquisa incluiu as principais e mais comuns causas do efeito, não todas elas: as duas maiores formas de deslocamento dos viajantes interestaduais, inclusive dos porventura infectados, bem como os viajantes que do exterior chegam por via aérea.
O aumento dos fluxos de passageiros cujas quantidades são conhecidas não é um fator determinante, mas sim um amplificador das chances de antecipação da data do primeiro caso de SARS-CoV-2 nos Estados. Por outra forma, quanto maior a quantidade de passageiros que numa UF chegam, é razoável considerar maior ser a possibilidade que o registro de infecção ocorra mais cedo naquele Estado, pois os viajantes são os hospedeiros do vírus que irá gerar o primeiro caso da doença no lugar de destino.
A proposta adotou o PageRank porque se trata de uma métrica que classifica páginas da internet considerando as ligações incidentes, bem como as origens e os pesos desses links, as quais são características que, respectivamente, são símeis às rotas, às quantidades de pessoas e às origens. Esse fato paraleliza semanticamente a web aos fluxos de passageiros entre unidades territoriais. A relevância da pesquisa se deve ao fato de que, ao saber da ordem de espalhamento da pandemia pelas unidades territoriais pode oportunizar ações preliminares e profiláticas, tais como o aumento de leitos, compra de equipamentos, criação de hospitais de campanha e a alocação de equipes médicos.
A pesquisa também alerta sobre a carência de dados abertos, visto que o nível mínimo de granularidade obtido foi aquele correspondente às UFs por indisponibilidade de microdados em uma temática tão relevante em tempos de pandemia.