El Big Data como herramienta para tomar decisiones basadas en evidencia científica

El Gobierno buscó comprometer a los científicos en la búsqueda de soluciones y éstos respondieron al instante. Un equipo de investigadores creará una plataforma y realizará experimentos masivos para brindar información fiable sobre covid-19 en tiempo real.

“Big data y experimentos masivos para la síntesis de información en tiempo real sobre el impacto de covid-19 y las medidas para su contención en la población” es el título de uno de los 64 proyectos que financiará la Agencia Nacional de Promoción de la Investigación, el Desarrollo Tecnológico y la Innovación (Agencia I+D+i). A partir de la convocatoria, el objetivo de la agencia es “mejorar la capacidad nacional de respuesta a la pandemia, ya sea a través del diagnóstico, el control, la prevención, el tratamiento, el monitoreo y/u otros aspectos relacionados con covid-19”. De aquí que el plan de trabajo presentado por Enzo Tagliazucchi –doctor en Física e investigador del Conicet– haya sido uno de los seleccionados. Junto a expertos del Instituto de Física de Buenos Aires, el Instituto de Ciencias de la Computación (FCEN-UBA), la Universidad Torcuato Di Tella y el colectivo de divulgación El Gato y la Caja, diseñará una plataforma con información confiable a varios niveles. A través de experimentos masivos a partir de redes sociales, analizarán datos sobre la salud mental de la población, sus desplazamientos en cuarentena y el consumo de noticias en medios masivos. A continuación, narra los detalles al respecto.

–¿De qué va la propuesta que presentaron en relación a Big Data y a la realización de experimentos masivos?

–A partir de las herramientas de Big Data, intentaremos recabar información de lo que ocurre, al menos, con el 10% de la población argentina. Nos servirá para medir la temperatura respecto de lo que va pasando en tiempos de excepción como los que vivimos. Luego, sabemos bien que siempre habrá excepciones que no estaremos en condiciones de cubrir; el país engloba demasiadas heterogeneidades como para pretender incorporarlas a todas. Cuando comenzó la pandemia nos comunicamos de manera virtual con los chicos de El Gato y la Caja, Mariano Sigman, Facundo Carrillo y varias personas más de las áreas de computación y de física de la UBA y Di Tella. Advertíamos que había un montón de virólogos, epidemiólogos y médicos que realizaban su contribución con mucha calidad pero faltaba algo.

–¿Qué faltaba?

–Somos gente que, habitualmente, trabaja con datos y nos interesa saber, en principio, qué ocurría en términos de salud mental y cuáles eran los comportamientos cognitivos de la ciudadanía a partir del coronavirus y las restricciones de aislamiento impuestas. Se nos ocurrió que era una buena oportunidad para iniciar experimentos masivos con el propósito de recopilar datos útiles y ubicarlos en un sitio de información centralizada para que estén al alcance de todo el mundo. De modo que, además de los experimentos que estamos en condiciones de hacer, también cruzaremos nuestros resultados con otros datos ya disponibles. Me refiero, por ejemplo, al número de infectados y de muertes, a la tasa de reproducción de la epidemia en función del tiempo. Información que anda desperdigada por la red y que es abordada de manera individual por los diferentes especialistas. Existen esfuerzos muy buenos, como el de Jorge Aliaga y el de Rodrigo Quiroga, pero están aislados. Lo que una sola persona pueda hacer siempre queda corto en relación a la tarea que puede emprender todo un equipo de desarrolladores. En muchos países del mundo ya existen plataformas donde el usuario accede a datos confiables y presentados de manera prolija con una visualización clara.

–¿La idea sería armar un repositorio de información sobre covid-19?

–Es más que eso. Sería un espacio en el que la gente pueda acceder a información que esté representada de una manera que sea amable, comprensible. Apuntamos a manejar distintas capas de datos: una más básica acerca de aquello que ya está disponible al público (las curvas de infectados, la tasa de reproducción), sumada a otras más complejas que dependerán de los experimentos masivos que nosotros hagamos. Sería óptimo tener un mapa del país y que cualquier usuario que haga clic en alguna región determinada pueda conocer el número de casos pero también otras variables: el modo en que el encierro afecta a la salud mental, o bien, cómo las noticias influyen en los usuarios de la gente de la zona. Queremos medir cuántas notas se consumen, qué referentes son los más citados, qué características tiene la agenda mediática a medida que avanza el tiempo. En nuestro equipo contamos con expertos que abordan muy bien el relevamiento de datos a partir de Twitter por ejemplo.

 

Ver nota completa

Fuente: Página 12

Escribí y presioná enter

Shopping Cart