entrar registro

Pelando la naranja

13802 visitas
|
votos: 12 · 1
|
karma: 103
|

Esto ha sido un pequeño experimento, queridos todos. Hemos pensado que, como buenos cerebritos cercanos al asperger, hay ciertas tendencias y patrones que merecen ser revisados, porque una cosa es la intuición, pero otra cosa diferente es trabajar con datos en bruto y hacer un análisis de la información que tenemos disponibles. Como bien decía Paumal en una de las notas (2871461 para ser exacto), los noteantes están reduciendo sospechosamente la variedad temática. Nosotros, que somos cuatro gatos, pero que tenemos la desgracia de tener bastante potencia de cálculo, inicialmente lo asociamos al pensamiento grupal, al efecto Dunning-Kruger, y a la "autoregulacion". Pero la realidad es mucho más perversa y, por qué no, divertida.

Caso de uso:
Setup de cloudera
1) Nodo con flume para las operaciones de data ingestion
2) Nodo con hadoop, yarn y resto de utilidades de cloudera para análisis. HDFS montado en raw, con 100 GB de almacenamiento bruto
3) Nodo de presentacion (Oozie, Api REST, data navigator)

Fuente: la web de Meneame, que hemos analizado haciendo llamadas a las API del portal y parseando el html directamente, accediendo únicamente a datos públicos para no incurrir en problemas con la LOPD.
Hipótesis: Menéame avanza hacia una secta.

NB: voy a omitir deliberadamente cifras concretas, el que quiera el ejercicio de BI para el portal, por una buena morterada le doy los datos, así que daré aproximaciones, aunque no en campos de fútbol ni en cristianos ronaldos.

Bien, amigüitos, los resultados, tras machacar un poco al nodo 2 del cluster, es demoledor. Según lo detectado, Meneame dispone de mas de 490000 usuarios registrados. La actividad del portal se centra en horario semanal de 8 a 10 AM (CEST/CET), 14-16H, 21-23H, siguiendo un declive durante el fin de semana con picos puntuales en eventos como elecciones, catástrofes, etc. Dato significativo: la actividad de la Web ha visto activos entorno a los 6800 usuarios en el periodo 2010. Los votos anónimos a noticias no hemos podido cuantificarlos, siento este sesgo, pero explico a continuacion que la actividad se ha ido reduciendo desde un 1% a un 16% anual en el periodo 2010 - 2013, arrastrando una caída hasta los poco más de 1500 usuarios activos que se han detectado en 2017. La proyección de los datos muestra que menéame será un poco más activa que Barrapunto en Octubre de 2021.

El análisis de los datos demuestra que el grueso de los votos negativos a las noticias, comentarios y notas pertenecen al 31,6% de los usuarios que usan el nótame activamente. Este hecho nos ha llamado la atención, y por eso analizamos con detenimiento el nótame. Y obtuvimos unos datos curiosos: nos fijamos en unos tipos de usuario que tienen mucho karma y pocos comentarios y notas, porque esos son, digamoslo suavemente, sospechosos de ser clones. Así que buscamos y buscamos y obtuvimos que esos perfiles se activaban cuando otros más activos estaban comentando o noteando. Esa correlación muestra que el perfil del usuario que entra en ese 31,6% se reduce a un tipo de usuario que tiene karma 10 o superior, hace más de 6 comentarios al día o más de 6 notas al día. Los patrones de envio de notas y comentarios son aleatorios, por lo que podemos decir que están permanentemente conectados.

Y os preguntaréis ¿quienes son? ¿cuantos son?. Esas respuestas las tengo, obviamente. En total, contando los usuarios poco comentadores y con gran karma, 41. Lo de quienes son, bueh, pa qué. Si están ahí todo el día. Lo interesante de todo esto es el recuento de tacos de algunas usuarias, que permite deducir hasta el punto de ciclo menstrual, con picos regulares de 26-28 dias.

Conclusión: El análisis de las temáticas y textos enviados indica que no, meneame no se convertirá en secta. La predicción es que será el barrapunto anti forocoches, donde Flanders, planchabragas politicorrectistas y juanas de arco beligerantes de machete al machote hablaran de sus cosas.

comentarios (35)
Comentarios destacados:                 
#14 A lo primero, no lo voy a publicar, pero te puedo dar es esta información:

Entre los usuarios activos tenemos una mediana de 1,751 notas por día y 1,333 usuarios por día, la media es de 3,067 notas y 2,471 comentarios para este grupo, lo que te da una desviacion estándar de 3,358 para las notas y 3,67 para los comentarios. Eso te dice que el grupo que controla el cotarro y sus clones destaca sobre el resto con >6,7 notas o bien 6 comentarios al día.

Un ejemplo: jorso: 7,85 comentarios al dia (casi todos para decir duplicado, spam, etc) y 0,22 notas. Carme, por poner un ejemplo de administrador, tiene 1,972 notas diarias y 2,78 comentarios, por lo que vemos que uno es "la parca editorial", y la administradora no destaca apenas en el nótame y apenas entre los comentarios, como ejemplo de lo que debe hacer un administrador: interviene cuando "se la lian". Ejemplos de usuarios que viven en el Nótame: Jagüi (16,695 notas diarias de media) y apenas 1,09 comentarios al dia, y ejemplos de comentadores JavierB con 17,347 comentarios diarios pero 0,17 notas diarias.

A lo segundo: votando solo para tumbar noticias (cuando están a punto de caer), si al final cae de portada, consigues 0.2 de karma. 0.1 si no llegan a portada por descartadas, spam, etc. Los dueños, apenas intervienen, no destacan sobre el ruido.
  1. Abrazafarolas
    :-D :-D :-D :-D
    5    k 99
  2. macarty
    Creo que con esto puedo presentarme al IG-Nobel
    4    k 79
  3. --426--
    #0
    Bueno, sin entrar en las calificaciones de usuarios, los resultados asustan en cuanto a precisión.
    Los motivos esgrimidos por Stallman son reales, por si no era suficiente con el documental de Snowden.
    ¿Desde qué fecha tienes acceso a los datos de Menéame? ¿desde el principio de los tiempos?

    El voto negativo de los usuarios asiduos puede ser bastante contraproducente entonces. Una corrección que pueden aplicar es la de disminuir su efectividad de karma en función del tiempo que se pasan en línea y el número de clones que tengan, que según tú es posible que tengan clones.
    3    k 58
  4. macarty
    #3 He tomado desde 2010, despues del banday. Más no tiene sentido, es una muestra de 7 años, suficiente para correlación, y ver cómo han evolucionado tanto los temas, como las personas que andan por ahí. Unos van y vienen, ya sabes.

    A lo segundo: sí, es desde luego un voto organizado y por tanto orquestado. Hay tendencias, hilando fino se podría llegar a hacer una correlación entre un voto organizado y el "instigador" buscando el momento del submit, pero me temo que ahí no he podido llegar sin acceder a la base de datos. Y no es una opinión: tienen clones y es terriblemente obvio, solo has de ver los recuentos de frecuencia :-D
    3    k 62
  5. Abrazafarolas
    El penúltimo párrafo es brutal. Alguien acaba de sufrir un aneurisma
    5    k 98
  6. --426--
    #4
    Lo de es posible lo digo porque sólo tienes una correlación. Pero la causalidad no la has establecido.
    0    k 20
  7. macarty
    #6 ahí le has dado, es solo correlacion y no implica causalidad, eso para el que quiera hacer un estudio serio, esto es solo un ejercicio :-)
    1    k 32
  8. macarty
    #5 lo dudo, ahora estan enzarzados entre juana la loca y lo prusés
    4    k 90
  9.  #9  » ver comentario
  10. macarty
    #9 :_) :_) :_) :hug: :hug: :hug:
    3    k 65
  11.  #11  » ver comentario
  12. macarty
    #11 a ver, si entre clones y chupis hay 41, haz cuentas. Y no te olvides, este grupo de personas y su comportamiento tiene un enorme impacto. Bueno, ya no tanto, como apunta @HANNIBAL_SMITH, ultimamente solo hablan ellos hasta en los comentarios, enzarzandose en las mismas discusiones, con los mismos argumentos, y la misma actitud. Antes solo iban en manada con los clones, reventaban la noticia (y al "troll/machirulo/<ponga aquí lo que esté de moda>" le daban matarile kármico o baneo) y volvían al nótame.
    4    k 83
  13. inconformistadesdeel67
    #0 Agradecerte enormemente tu esfuerzo en demostrar con datos que lo que hemos dicho tantas veces es muy cierto, un cortijo dirigido por déspotas. Milana bonita. :hug:
    3    k 72
  14. freshprince
    #2 Me he dado de alta aquí sólo para responder...
    Si pones la lista de los 41 usuarios (y si hay un desglose de clones y dueño pues ya la hostia) sí te merecerías el premio.
    De todas formas, ¿cómo pueden tener karma alto por mucho clon que sean sin comentar, enviar noticias, etc?
    2    k 39
  15. HANNIBAL_SMITH
    #14 "Me he dado de alta aquí sólo para responder..."
    ¡Huy!¡Huy!¡Huy! :troll:

    Tampoco te creas que hace falta una lista para deducir los clones, o al menos para saber que son clones, por ejemplo los de blackheart son Mr.Pink, Mr.Blonde, Mr.White (Reservoir dogs), oddball también tiene pinta de ser un clon de blacky o quizás de personaje. El problema de este último es que no comenta y a simple vista es más dificil saber quien utiliza este clon.
    Hay ciertos patrones de conducta, formas de escribir que te pueden dar pistas, en el caso de blacky son muy obvias y se le pilla nada más abrir la boca. :-D
    Por ejemplo, la forma de escribir de Poll se parece mucho a la de vuduista y la tuya a la de Aitor.


    Hay varias formas de mantener y hacer que suba el karma, como por ejemplo votando negativo a las noticias que están a punto de hundirse en portada, teníendo buen ojo meneando las noticias que están en pendientes y que estas acaben saliendo a portada, y también se puede subir o bajar manualmente el karma... :roll: :roll:

    Esto último se puede ver sin problemas cuando votáis, digo... votan, cuando votan negativo poniendo incluso más de 30 negativos en un solo día y no os pasa factura, digo..., les pasa, les pasa factura alguna, a ellos. :troll:
    5    k 87
  16. fermin
    #0

    Conclusión: El análisis de las temáticas y textos enviados indica que no, meneame no se convertirá en secta. La predicción es que será el barrapunto anti forocoches, donde Flanders, planchabragas politicorrectistas y juanas de arco beligerantes de machete al machote hablaran de sus cosas.

    media
    4    k 91
  17. macarty
    #14 A lo primero, no lo voy a publicar, pero te puedo dar es esta información:

    Entre los usuarios activos tenemos una mediana de 1,751 notas por día y 1,333 usuarios por día, la media es de 3,067 notas y 2,471 comentarios para este grupo, lo que te da una desviacion estándar de 3,358 para las notas y 3,67 para los comentarios. Eso te dice que el grupo que controla el cotarro y sus clones destaca sobre el resto con >6,7 notas o bien 6 comentarios al día.

    Un ejemplo: jorso: 7,85 comentarios al dia (casi todos para decir duplicado, spam, etc) y 0,22 notas. Carme, por poner un ejemplo de administrador, tiene 1,972 notas diarias y 2,78 comentarios, por lo que vemos que uno es "la parca editorial", y la administradora no destaca apenas en el nótame y apenas entre los comentarios, como ejemplo de lo que debe hacer un administrador: interviene cuando "se la lian". Ejemplos de usuarios que viven en el Nótame: Jagüi (16,695 notas diarias de media) y apenas 1,09 comentarios al dia, y ejemplos de comentadores JavierB con 17,347 comentarios diarios pero 0,17 notas diarias.

    A lo segundo: votando solo para tumbar noticias (cuando están a punto de caer), si al final cae de portada, consigues 0.2 de karma. 0.1 si no llegan a portada por descartadas, spam, etc. Los dueños, apenas intervienen, no destacan sobre el ruido.
    6    k 93
  18. macarty
    #13 Y lo bonito que es tener evidencia para justificar una afirmación... :-D
    1    k 33
  19. freshprince
    #15 En mi caso fallas :-) Tengo usuario en meneame (uno y ya estoy hasta el gorro...) pero no es Aitor. Por aquí empiezo a caer porque parece que no está la dictadura de los de AEDE. Pero fijo que también hay un equivalente a la chupipandi.

    Falta hace revisar el sistema de karma, desde luego. No sé si aquí es igual o se ha ajustado el algoritmo. Bien estaría limitar el número de negativos por día, y para evitar a los matoncillos, negativos por mes que se puede poner a otro usuario cualquiera tanto en envíos como en comentarios.
    1    k 25
  20. Mala_sombra
    #19 El hecho de que no exista el voto negativo y el sistema de karma sea irrelevante hacen que una chupipandi tenga el mismo peso que cualquier otro usuario. Cuando no puedes atacar el karma de alguien para evitar que comente o que publique postits, la chupipandi se queda en nada, puesto que pueden tener todo el derecho a venir a comentar (faltaría más), pero en el momento en que no tienen capacidad para modificar el sitio según si línea de pensamiento, no consideran el sitio como un buen lugar para ellos.

    Los fascismos es lo que tienen, si no pueden controlarlo todo, no funcionan.

    Gran trabajo @macarty se ve lo que hace tiempo se dice, la endogamia de menéame será la que ponga el último clavo de su ataud. Me da que Galli sabía bastante bien lo que hacía cuando vendió a pesar de lo que digan muchos.
    4    k 81
  21. macarty
    #21 macarty
     *
    #20 Galli vendió en el momento exacto. Ni antes ni después. Y gracias! :-)

    Por lo demás, y creo que es una idea de las que habita por aquí, no queremos ser un Menéame 2.0, el formato de agregador de noticias está muerto (AEDE/CEDRO, Google News ya te da un resumen diario, al igual que el briefing del Apple iOS), supongo que a lo que vamos o queremos ir es algo completamente diferente, en los contenidos de |ORANGETERAPY hay una pista, al igual que en el modelo de contribución.
    2    k 52
  22. macarty
    #19 bueno, aquí solo hay un administrador con god mode. La chupi, de haberla, somos los que montamos esto hace un año. Pero para ser chupi, somos raros, ni siquiera pensamos igual.
    3    k 71
  23. krzysiu
    #0 ¿Cuantos usuarios habituales hay en el notame? lo digo para comparar el porcentaje de esos usuarios que votan negativo habitualmente respecto al total.
    1    k 39
  24. macarty
    #23 te lo paso en un privado
    2    k 52
  25. --525--
    Voy a formar una chupipandi aquí,estáis todos invitados xD
    @macarty como siempre fenomenal :hug:
    5    k 111
  26. macarty
    #25 pasar demasiado tiempo en las redes sociales te desconecta de la vida y de la familia, yo estoy aqui porque en el curro me aburro, en casa prefiero estar con los mios xD
    4    k 82
  27. HANNIBAL_SMITH
    #19 Aquí no hay votos negativos, así que no hay ese problema de mafias tumbanoticias y tumbacomentarios.
    Esto es parecido a Reddit donde los negativos apenas tienen relevancia alguna.
    2    k 52
  28. Abrazafarolas
    #25 ¿Como hacemos lo de los negativos?¿contratamos la mafia o algo asi?
    3    k 67
  29. krzysiu
    #28 Para ser chupipandi basta con ser un grupo endogámico que se siente moralmente superior a todos los demás e insultar a cualquiera que no piense como ellos o que los critique, lo de los negativos no es realmente necesario, es más que nada masturbación virtual :troll:
    4    k 83
  30. Abrazafarolas
    #29 vaya. yo que ya me hacia ilusiones y habia comprado el equipamiento

    media
    2    k 41
  31. --525--
    #28 Contratamos a Vangaal :_) :hug:
    m.youtube.com/watch?v=Od5PQoRr7hU
    2    k 48
  32. fermin
    #32 fermin
     *
    Por cierto, fuera de España, el navegador Google Chrome ya "agrega" noticias cuando abres una pestaña nueva. Es decir, que te meten el Google News en la pestaña nueva directamente con noticias agregadas de enlaces de noticias que hayas visitado.
    2    k 54
  33. macarty
    #32 aquí en el viejo mundo les obligarán a quitarlo por aquello de que son unos comunistas que regalan las noticias y bla, bla bla
    2    k 54
  34. Mala_sombra
    #29 No te olvides lo mas importante: tienes que tener a los admin de tu parte, si no puedes hacer que piensen como tu, siempre podras eliminarlos :troll:
    1    k 30
  35. LaArdillaPajera
    muy interesante, y nada sorprendente :-)
    0    k 6
comentarios cerrados
suscripciones por RSS
ayuda
+mediatize
estadísticas
mediatize
mediatize