En MIT TechnologyReview.es, Twitter ‘se chiva’ de que los domingos duermes tres horas más es un curioso e interesante artículo sobre el análisis de datos de tuits geolocalizados —tuits en los que consta información sobre dónde estaba físicamente el autor en el momento de publicarlo.
- [El estudio revela que] el ciclo de actividad entre semana es especialmente claro, reflejando periodos en los que la gente tiene más tiempo para tuitear. A primera hora de la mañana la gente tiende a tuitear desde sus casas en zonas periféricas de la ciudad. Esta actividad pasa a Manhattan (el centro de la ciudad) después de los desplazamientos al trabajo y alcanza su pico a la hora de la comida. La actividad en zonas periféricas vuelve a crecer por las tardes hasta las 10 de la noche y empieza a decaer según se va acostando la gente. La actividad en Manhattan continúa a lo largo de toda la noche mientras el resto de la ciudad duerme.
Curiosamente, el ciclo de sueño de los fines de semana tiene un desfase respecto al ciclo entre semana (…) el pico de actividad matutina sucede entorno a las 10 de la mañana, unas tres horas después de lo habitual.
El estudio certifica una vez más que Nueva York hace honor al título de “la ciudad que nunca duerme” y ese desplazamiento de tres horas los fines de semana “tiene sentido” y suena lógico porque muchos se reconocen en ese comportamiento; pero no por eso la afirmación es necesariamente válida para aplicarla al total de la sociedad o tomar decisiones urbanísticas en base en ella.
De hecho el método de análisis de las mareas de tuits es aplicable a cualquier otra localización y el acceso a este tipo de información se considera que puede ser útil en la organización y planificación de las ciudades, por ejemplo en lo referente a la regulación del tráfico y el transporte público o en medidas que reduzcan la concentración de emisiones contaminantes en los centros urbanos.
Incluso otros análisis similares han recurrido a este tipo de análisis de grandes volúmenes de datos para, por ejemplo, anticipar epidemias de gripe o monitorizar la salud de los ciudadanos a partir del análisis del contenido de los tuits; por ejemplo cuando alguien publica que está enfermo, resfriado o que va al médico.
Sin embargo puede que no sea tan sencillo. Investigadores de la Universidad Carnegie Mellon avisan de que este tipo de análisis de grandes cantidades de datos “no son necesariamente la mina de información que muchos les atribuyen (…) ya que ofrecen una visión limitada de la sociedad al representar únicamente a una parte muy concreta de la población», escriben los investigadores en la publicación Science, según se recoge en The Telegraph.
El motivo más evidente es el sesgo que se produce entre quienes hacen uso de las redes sociales, o un uso más o menos intenso de ellas, y quienes no. Para estrechar más la muestra social las redes sociales tienen sus particulares representaciones sociológicas demográficas. Por ejemplo, Twitter apenas lo utilizan los mayores de 65 años y sus usuarios son en mayor proporción hombres que mujeres. Justo al contrario de como sucede en Pinterest, claramente dominado por mujeres adultas jóvenes e incluso en Facebook. Instagram resulta más atractivo para los jóvenes que viven en ciudades y LinkedIn representa sobre todo a licenciados con ingresos altos. «Estos sesgos raramente se corrigen si acaso se llegan a reconocer”.
Estos y otros motivos similares son los restan validez a este tipo de estudios, según los investigadores. Aunque puedan dar pistas, considerar que los comportamientos detectados en las redes sociales representan a la sociedad resulta anticipado: «no todo lo que se puede etiquetar como ‘big data’ es automáticamente válido».
Deja tu comentario sobre "El ‘Big Data’ procedente de las redes sociales no representa a la sociedad"