Todos nos creemos un poco «especiales». Pensamos que nuestros gustos y decisiones son libres, voluntarias y diferentes de las de la «masa». Pero cada vez más estudios muestran que la tecnología es capaz de predecir con amplia precisión el tipo de opciones que tomarán ciertos individuos a partir de unos pocos datos, como si estuviéramos compelidos a ello. O más bien habría que decir que esos rastros que vamos dejando por ahí resultan ser pistas clave acerca de las decisiones que vamos a tomar.
Hace poco la prestigiosa revista Technology Review del MIT publicó un artículo acerca de un trabajo donde se analiza precisamente uno de estos fenómenos. Su título es The Call of the Crowd: Event Participation in Location-based Social Services (La llamada de las multitudes: la participación en eventos en servicios sociales basados en la ubicación) escrito por tres informáticos de la Universidad de Cambridge en el Reino Unido. Y en poco más de una decena de páginas examina lo que sucede cuando se analiza con una potente minería de datos la información procedente de una red social donde los eventos y la ubicación son importantes.
Para el análisis se utilizaron datos de Foursquare, una app móvil medio juego, medio red social, en la que la gente va marcando los lugares que visita (restaurantes, cines, conciertos) y los comparte con los amigos – todo ello con información de geolocalización procedente del GPS o de marcas en un mapa. En total se analizaron los comportamientos de 190.000 personas –convenientemente anonimizadas– en Londres, Chicago y Nueva York, durante un periodo de dos años.
Como suele hacerse en estos casos, los expertos emplearon el 90 por ciento de los datos en entrenar al sistema predictivo que crearon y el diez por ciento restante para comprobar su funcionamiento y las hipótesis planteadas. Entre los datos considerados importantes estaban los amigos de la red social y su cercanía, los horarios típicos de actividad de cada persona y la distancia hasta los lugares de las actividades.
El caso es que tras plantear varias de esas hipótesis una de las conclusiones más llamativas fue que el factor de mayor influencia de cara a que alguien participe en una actividad o evento es la presencia de sus amigos y conocidos: en otras palabras, si se observa que ciertas personas están o van estar en ciertos lugares, es altamente probable que el individuo en cuestión también aparezca por allí. El segundo factor es la popularidad del evento (cuanta gente en total acude).
La comprobación de los modelos y patrones analizados puede utilizarse para crear sistemas predictivos o de aprendizaje. En las pruebas para comprobar si el modelo creado era válido se comprobaban personas al azar a las que se presentaban diversas sugerencias de todas las que había en las ciudades en ese momento; el sistema era capaz de acertar en la diana entre 1 de cada 3 veces (en Londres) y 1 de cada 5 (en Nueva York). En otras palabras: se sabía lo que iban a hacer esas personas antes de que lo hicieran, demostrando una vez más que somos más predecibles de lo que creemos.
De los conceptos que se suelen asociar con el Big Data, este estudio trabaja especialmente con el volumen y la variedad de los datos, más que con la velocidad. En la predicción de patrones de comportamiento haciendo minería de los datos esto es lo más básico. Pero no hay que olvidar que si la información fuera a usarse en tiempo real –por ejemplo, lanzando recomendaciones predictivas mientras un usuario visita una página web, o alertas a su dispositivo móvil cuando se detecta que pasa físicamente cerca un lugar– la velocidad también sería un factor importante.
Por Alvy (Microsiervos)
Deja tu comentario sobre "Nuestro comportamiento social es más predecible de lo que creemos"