El Doctor Timo Hannay, de Digital Science –una empresa especializada en software científico– explicó en la revista Wired hace algunas semanas lo que considera son algunos de los retos y cambios que está suponiendo el concepto de Big Data en el desarrollo de la ciencia actualmente y lo que supondrá en el futuro.
Su análisis, titulado Science’s Big Data Problem creo que debe leerse más con el espíritu de oportunidad que como amenaza y cubre tres áreas: la capacidad creciente de generar nuevos datos e interrelacionarlos, el papel de la ciencia experimental frente a la teórica y finalmente la necesidad de herramientas adecuadas para estas labores. Esto se podría resumir en tres frases: (1) La información es poder, (2) las teorías sin datos son mera especulación y (3) la ciencia es tan importante para el progreso de la humanidad que merece las mejores herramientas a su disposición.
Pongamos un ejemplo de instalación científica absolutamente dependiente del Big Data que hace bueno eso de que la «información es poder»: el Gran Colisionador de Hadrones del CERN en el que se investigan las partículas subatómicas, una maravilla de la ingeniería y por extensión de la informática y la ciencia en general. En esa instalación hay que capturar información acerca de 600 millones de colisiones por segundo de partículas subatómicas que viajan al 99,9999991 por ciento de la velocidad de la luz. Filtrar los datos en bruto requiere más de 1,5 millones de tareas diarias; esos datos han de transferirse a una enorme red informática desplegada por todo el planeta en forma de «centros colaboradores» que aportan computación al ritmo de 10 gigabits por segundo. En total se capturan y almacenan más de 25 petabytes de datos al año. Gracias a esta maravilla de concepto e implementación se descubrió el elusivo Bosón de Higgs y todavía restan experimentos más que interesantes para el futuro.
Dejando aparte el segundo punto del análisis –que entra de lleno en el campo de la filosofía de la ciencia– sobre el último resultan sorprendentes algunos de los datos: se calcula, por ejemplo, que en total hay unos 7 millones de científicos investigadores en todo el planeta: menos del 0,1 por ciento de la población. Sin embargo la importancia de cada uno de sus descubrimientos es algo fundamental para el 99,9% restante de nosotros: tanto que alarga nuestras vidas descubriendo la cura de las enfermedades, puede salvar el planeta de un colapso medioambiental o nos ayuda a cuidar de las cosechas con que nos alimentamos.
Suena por tanto algo injusto e inconveniente, como deja caer en una sutil «queja» el Dr. Hannay, que «la mayor parte de ellos tengan mejor software para gestionar su librería de canciones y fotos en casa que para manejar los datos de sus laboratorios». Algo en lo que, sin duda, el retorno de la inversión en software capaz de gestionar toda esa poderosa información devuelve con creces a sus autores y creadores, ya sea directa o indirectamente.
{Foto: Through the Wormhole / GSFC (CC) NASA}
Deja tu comentario sobre "Big Data y su papel en el desarrollo científico"