Cómo seguir a una comunidad de miles de usuarios en Twitter
Como indiqué en Visio 2011, Umap ha sido concebido como un sistema de extracción de datos desde micromensajes, que obtiene como producto información nueva generada a partir de datos agregados. El sistema de extracción, en una primera fase, se basa en el Streaming API de Twitter, y en un factor catalizador de la información: el idioma. Las tres versiones actuales de Umap siguen a la comunidad de Twitter de los hablantes de galés, euskera y catalán. En la presentación en Bilbao mostré ejemplos más cercanos, es decir, de la versión en euskera.
No obstante, el modulo de detección de usuarios y mensajes puede basarse en premisas distintas del idioma. Una comunidad de usuarios puede definirse a partir de otros criterios, geográficos, sociológicos o de intereses concretos. Como reto posible o aplicación futura de Umap indiqué en la conferencia que podría seguirse, digamos, al conjunto de voces femeninas en Twitter de un país dado, por ejemplo, España. ¿Es posible configurar un sistema que agregue información de todas las mujeres tuiteras de España? No, pero afirmo, con un poquito de descaro y optimismo, que seguir, digamos, a un porcentaje importante de las 10.000 o 20.000 mujeres tuiteras más relevantes de España, mediante un proceso automatizado, es posible y factible.
De todos modos, una cosa es agregar, y otra extraer inteligencia, y en CodeSyntax, como desarrolladores, estamos dispuestos y abiertos a crear herramientas, agregar información y extraer datos, de modo que terceras partes puedan trabajar sobre ellos.
El paper o artículo formal que presentamos para Visio 2011 está ya en la red, así como la presentación que usé, que copio aquí abajo.