Tags:

H1N1 Influenza Virus Particles –coloreado por ordenador– (CC) NIAID @ Flickr

¿Para qué puede usarse el gigantesco volumen de datos de millones de internautas que acceden a la Wikipedia? Entre otras cuestiones prácticas para detectar e incluso «predecir» los brotes de enfermedades como la gripe. Esta es la conclusión a la que han llegado los investigadores David J. McIver y John S. Brownstein tal y como publica la revista del área de biología computacional de la Public Library Of Science estadounidense. (Ver: Wikipedia Usage Estimates Prevalence of Influenza-Like Illness in the United States in Near Real-Time.)

Este trabajo se ha llevado a cabo con un volumen ingente de datos recopilado durante seis años (2007 a 2013) procedentes de Wikipedia, la enciclopedia libre de Internet. El trabajo consistió principalmente en comparar las búsquedas realizadas sobre cierto tipo de artículos con las temporadas de gripe y enfermedades similares que surgen periódicamente. El planteamiento era encontrar cierta correlación entre el comportamiento de los internautas que accedían a la Wikipedia para consultar sobre cuestiones y síntomas típicos de esa enfermedad y las zonas y fechas en que el CDC (Centro de Control y Prevención de Enfermedades) catalogó los brotes de dichas enfermedades.

Entre los términos de búsqueda examinados se utilizaron (en inglés) palabras como «gripe aviar», «centro de control de enfermedades», «resfriado común», «epidemia», «fiebre», «gripe humana», «vacuna para la gripe» y otros similares – un conjunto de las que la gente corriente suele buscar cuando tiene una enfermedad de ese tipo, ya sea gripe o un resfriado.

Según han calculado, el modelo matemático de estos investigadores mejoró un 17 por ciento las estimaciones realizadas por Google en su servicio Google Flu Trends, que está basado en una idea similar pero sobre términos utilizados en su buscador y en las noticias. Otras ideas parecidas son las que llevan a cabo investigadores como los de Influenzanet (GripeNet.es en España) realizando encuestas voluntarias a ciudadanos anónimos a través de Internet.

La principal diferencia entre ideas como GripeNet es que el nuevo modelo que utiliza los datos masivos de la Wikipedia puede utilizarse en tiempo real, a pesar de su gran volumen, e incluso es capaz de anticipar en unas dos semanas los datos oficiales que ofrecen los centros de control de enfermedades. Aunque el método no es perfecto pues puede verse afectado –como ya apuntan los autores– por «alarmas sociales» generadas por los medios de comunicación, es desde luego un avance interesante en este tipo de aplicaciones. Modelos similares se aplican también a negocios y otros proyectos para anticipar ventas de productos, necesidades logísticas y similares.

Foto | H1N1 Influenza Virus Particles –coloreado por ordenador– (CC) NIAID @ Flickr

Más información sobre soluciones Biga Data en la Web de T-Systems

Deja tu comentario sobre "Cómo millones de consultas a la Wikipedia pueden predecir los brotes de gripe"

Nos encantará conocer tu opinión, pero primero tenemos que indicarte que los comentarios están moderados, y no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos a los autores, a cualquier otro comentarista o la empresa propietaria de esta página. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades o suplantando a otros comentaristas. También, procura que tus opiniones estén relacionadas con lo que se comenta en esta entrada. Los comentarios off-topic, promocionales, o que incumplan todas estas normas básicas serán eliminados.


Presto mi consentimiento para que, de acuerdo a la normativa europea de protección de datos, T-Systems ITC Iberia S.A.U trate mis datos personales con la finalidad de identificar al autor del comentario previo. Estos datos se pueden ceder a las empresas del grupo Deutsche Telekom AG. No está prevista la realización de transferencias a terceros. Puede ejercer sus derechos de acceso, rectificación, supresión, limitación, oposición y portabilidad de datos solicitándolo por escrito a: T-Systems ITC Iberia SAU, Carrer Pere IV, 313. 08020 Barcelona, o a través de correo electrónico a FMB.TS-IB-PROTEC-DATOS-PERSONALES@t-systems.com. A su vez, puede dirigir cualquier consulta al Delegado de Protección de Datos a la dirección indicada anteriormente con la finalidad de identificar el autor del comentario previo y gestionar su consulta si fuera el caso.