entrar registro

Pelando la naranja

13795 visitas
|
votos: 12 · 1
|
karma: 57
|

Esto ha sido un pequeño experimento, queridos todos. Hemos pensado que, como buenos cerebritos cercanos al asperger, hay ciertas tendencias y patrones que merecen ser revisados, porque una cosa es la intuición, pero otra cosa diferente es trabajar con datos en bruto y hacer un análisis de la información que tenemos disponibles. Como bien decía Paumal en una de las notas (2871461 para ser exacto), los noteantes están reduciendo sospechosamente la variedad temática. Nosotros, que somos cuatro gatos, pero que tenemos la desgracia de tener bastante potencia de cálculo, inicialmente lo asociamos al pensamiento grupal, al efecto Dunning-Kruger, y a la "autoregulacion". Pero la realidad es mucho más perversa y, por qué no, divertida.

Caso de uso:
Setup de cloudera
1) Nodo con flume para las operaciones de data ingestion
2) Nodo con hadoop, yarn y resto de utilidades de cloudera para análisis. HDFS montado en raw, con 100 GB de almacenamiento bruto
3) Nodo de presentacion (Oozie, Api REST, data navigator)

Fuente: la web de Meneame, que hemos analizado haciendo llamadas a las API del portal y parseando el html directamente, accediendo únicamente a datos públicos para no incurrir en problemas con la LOPD.
Hipótesis: Menéame avanza hacia una secta.

NB: voy a omitir deliberadamente cifras concretas, el que quiera el ejercicio de BI para el portal, por una buena morterada le doy los datos, así que daré aproximaciones, aunque no en campos de fútbol ni en cristianos ronaldos.

Bien, amigüitos, los resultados, tras machacar un poco al nodo 2 del cluster, es demoledor. Según lo detectado, Meneame dispone de mas de 490000 usuarios registrados. La actividad del portal se centra en horario semanal de 8 a 10 AM (CEST/CET), 14-16H, 21-23H, siguiendo un declive durante el fin de semana con picos puntuales en eventos como elecciones, catástrofes, etc. Dato significativo: la actividad de la Web ha visto activos entorno a los 6800 usuarios en el periodo 2010. Los votos anónimos a noticias no hemos podido cuantificarlos, siento este sesgo, pero explico a continuacion que la actividad se ha ido reduciendo desde un 1% a un 16% anual en el periodo 2010 - 2013, arrastrando una caída hasta los poco más de 1500 usuarios activos que se han detectado en 2017. La proyección de los datos muestra que menéame será un poco más activa que Barrapunto en Octubre de 2021.

El análisis de los datos demuestra que el grueso de los votos negativos a las noticias, comentarios y notas pertenecen al 31,6% de los usuarios que usan el nótame activamente. Este hecho nos ha llamado la atención, y por eso analizamos con detenimiento el nótame. Y obtuvimos unos datos curiosos: nos fijamos en unos tipos de usuario que tienen mucho karma y pocos comentarios y notas, porque esos son, digamoslo suavemente, sospechosos de ser clones. Así que buscamos y buscamos y obtuvimos que esos perfiles se activaban cuando otros más activos estaban comentando o noteando. Esa correlación muestra que el perfil del usuario que entra en ese 31,6% se reduce a un tipo de usuario que tiene karma 10 o superior, hace más de 6 comentarios al día o más de 6 notas al día. Los patrones de envio de notas y comentarios son aleatorios, por lo que podemos decir que están permanentemente conectados.

Y os preguntaréis ¿quienes son? ¿cuantos son?. Esas respuestas las tengo, obviamente. En total, contando los usuarios poco comentadores y con gran karma, 41. Lo de quienes son, bueh, pa qué. Si están ahí todo el día. Lo interesante de todo esto es el recuento de tacos de algunas usuarias, que permite deducir hasta el punto de ciclo menstrual, con picos regulares de 26-28 dias.

Conclusión: El análisis de las temáticas y textos enviados indica que no, meneame no se convertirá en secta. La predicción es que será el barrapunto anti forocoches, donde Flanders, planchabragas politicorrectistas y juanas de arco beligerantes de machete al machote hablaran de sus cosas.

suscripciones por RSS
ayuda
+mediatize
estadísticas
mediatize
mediatize