Dados, dados, muitos dados. De telefones celulares, de aparelhos de eletrocardiogramas, das redes sociais, de bancos de dados. São tantos números, ligações, imagens, pontos geolocalizados, vídeos e outros tipos que informação produzidos na era digital que 90% dos dados hoje existentes foram criados nos últimos dois anos e, em separado, representam cerca de 10% do conhecimento produzido pela humanidade. Essa avalanche chama-se Big Data e traz oportunidades e soluções em Saúde que já estão sendo implementadas, e junto com elas, dilemas e questionamentos. Esse admirável mundo novo foi tema da conferência de encerramento do segundo dia do 9º Congresso Brasileiro de Epidemiologia.
Com o título O Uso do Big Data em Epidemiologia, a conferência foi proferida por Laura Rodrigues, professora e ex-diretora da L ondon School of Hygiene and Tropical Medicine, da London University e teve coordenação de José Cássio de Moraes, professor da Faculdade de Ciências Médicas da Santa Casa de São Paulo. Antes da sessão, Moraes fez uma homenagem ao epidemiologista Ciro de Quadros, falecido em maio deste ano. Quadros esteve a frente da coordenação dos programas de imunização da Organização Pan-Americana de Saúde (OPAS)e foi determinante nas campanhas de erradicação da varíola, da poliomielite e do sarampo, contribuindo decisivamente para o desenvolvimento da saúde no continente americano.
Brasileira radicada na Inglaterra há mais de 20 anos e que acaba de chegar a marca de 300 trabalhos publicados em revistas científicas internacionais, a professora Laura apresentou o conceito, que começa a ser discutido e utilizado pela ciência brasileira – “quero a normalização dessa ideia, e em cinco anos veremos como rotina fazermos pesquisas com um milhão de indivíduos”.
Foram as próprias empresas de tecnologia que descobriram o potencial do quanta de informação armazenados em seus servidores. Gigantes como a Google, a livraria Amazon e o Facebook constantemente apresentam às pessoas a utilização desses dados não-estruturados, ou seja, que não são frutos de banco de dados ou de ações direcionadas, mas sim produzidos cotidianamente e que, quando cruzados, definem nossas redes de contato, nossas preferências literárias, nossa forma de relacionamento.
“A grande pergunta para nós epidemiologistas é saber se as pesquisas usando dados eletrônicos podem melhorar a saúde da população. Sim, podem e seu uso já começou, seja em novas formas de fazer pesquisa, que não poderiam ser feitas sem Big Data, seja nos estudos regulares que, com o uso desses metadados, nos oferecem melhores respostas, com maior rapidez e mais baratas”, respondeu Laura, frisando ainda que a utilização dos dados não serve apenas para estudos observacionais, mas também para ensaios clínicos e randomizados.
O monitoramento de doenças é a primeira forma de aplicação do Big Data, já realizado de maneira experimental e acessória pela SVS da prefeitura de Belo Horizonte, capital mineira, que acompanha pela rede de microblogging Twitter a incidência de termos como gripe, dengue e mosquito para o acompanhamento da dengue na capital mineira, antecipando cenários antes da notificação oficial vinda dos serviços de saúde.
Outro exemplo é o Google Flu Trends, pesquisa dedicada da gigante do Vale do Silício americano que desde 2008 cruza metadados sobre gripe nos Estados Unidos. No início do projeto, seus engenheiros utilizaram cerca 50 milhões de termos processados por 400 milhões de algorítmos matemáticos, localizando 45 termos centrais e apresentando mapas de registros sobre a incidência da doença muito similares aos notificados pelo Centro de Controle de Doenças dos Estados Unidos (US CDC). No entanto, Laura registrou que as pesquisas de 2013 não foram tão precisas, mostrando variação de quatro pontos percentuais entre as notificações e os dados da Google. O argumento de defesa da empresa foi mudanças no padrão de buscas, e comprometeram-se a ajustar as equações.
Novos desafios e dilemas: Para Laura, a utilização desses dados exigirá novas qualificações e olhares dos epidemiologistas. “Os campos são inúmeros, podendo atuar em pesquisas sobre causalidade, eventos adversos de medicamentos, avaliação de intervenções e de impactos e políticas públicas, além de estudo de doenças raras e cargas da doenças. O que vemos é a incorporação dessas questões no cotidiano médico, com cruzamentos a partir dos prontuários e outros dados cadastrais estruturados”, explicou ela, dando como exemplos um estudo realizado com um milhão de mulheres na Inglaterra, relacionando câncer de mama com o uso de repositores hormonais e a pesquisa que relacionou a qualidade nutricional dos atendidos pelo programa Bolsa Família a partir do banco de dados do Ministério de Desenvolvimento Social brasileiro.
O desafio está na tecnologia de capacitação e na definição metodológica , que exigem profissionais qualificados para trabalhar com um grande volume de dados e controlar fatores de confusão dos mesmos e servidores possantes para armazenamento, manipulação e cruzamento dos dados. Abre também possibilidade para metodologias nem sempre bem recebidas, mas mais indicadas para bancos de dados grande com variáveis individuais, como a conhecida fishing expedition – a localização de dados e padrões sem hipóteses previamente definidas. “Isso foi útil em um estudo que relacionou o índice de massa corporal (IMC) com o câncer, também na Inglaterra, utilizando dados da Atenção Básica, registro de 21 tipos de cânceres e dados de internação de 512 milhões de pessoas. Ao cruzar os dados em buscas de padrões, ficou claro que que não há associação do IMC em casos de câncer de bexiga, mas sim nos casos de câncer de rim”, destacou a professora.
Como tudo que envolve tecnologia e seres humanos, diversas questões éticas envolvendo a confidencialidade das pessoas e a privacidade das mesmas são levantadas no uso desses dados. Uma saída é a concessão da produção desses bancos de dados somente para empresas conveniadas e comprometidas a gerar relatórios e bancos anonimizados, preservando identidades e condições de saúde. “O público precisa acreditar, para isso devem existir centros de trabalho para o estruturação desses dados”, destacou ela, como o UK Biobank. São necessárias também ações dos governos, como o inglês, que já iniciou um debate público nomeado Better information means better care. “Essa discussão está acontecendo e tende a ter uma limitação com a disseminação da importância desse conhecimento, que no entanto, devem sempre trabalhar com a possibilidade de ter a autorização de uso negadas pelos pacientes”.