Es una idea que rondaba por mi cabeza desde hace un tiempo. Quería analizar la frecuencia de los enlaces internos entre bitácoras en Blogalia. Busqué algunos parser que pudieran ser de utilidad, pero no encontré ninguno. Bueno, mentira, uno encontre, pero con Blogalia no funciona, podéis pedir el ejecutable para Windows en http://cybermetrics.wlv.ac.uk/socscibot/.

Pero el caso es que no funcionaba, así que miré * todas * las bitácoras de Blogalia una por una, anotando los enlaces internos que encontraba y poniéndolos en un fichero de texto. Ya se sabe, no hay mejor parser que el cerebro humano. Eso sí, es lento, y he tardado hora y media. Una vez rellenada la lista, he notado ante todo dos cosas: muchas bitácoras están vacias. Excluí de la lista las pruebas de estilo y los "metros", y procesé el fichero en un "keyword analyzer" que está en Ranks.nl

El resultado es el siguiente:

Sobre 142 bitácoras:

Login n
rvr 26
javarm 21
daurmith 21
verbascum 18
paleofreak 13
ciencia15 13
gargantua 11
akin 10
fernand0 9
quotidianum 9
gnudista 9
chewie 8
atalaya 7
clio 7
canopus 6
rimero 6
peaton 6
jkaranka 6
yamato 6
eledhwen 5
escepticismo 5
fbenedetti 4
rivendel 4
copensar 4
morwen 4
mirada 4
prestige 3
escuchar 3
polinesia 3
enpelotas 3
oier 3
odisea 3
jomaweb 3
hronia 3
hazte 3
hispamed 2
yildelen 2
hadez 2
pepino 2
neutrina 2
neuronal 2
pawley 2
saliva 2
feo 2
exploraciones 2
dragon 2
cthulhunam 2
borja 2
angelina 2
munchi 2

Sólo 50 bitácoras están referenciadas en alguna otra parte. En este recuento hay que restar uno a cada n, puesto que la bitácora en sí se auto-referencia a sí misma. Nótese que no se sigue un criterio de reciprocidad en los enlaces internos. Las bitacoras más enlazadas, que son las de Rvr, Daurmith, Vendell, Webensis, ElPez, etcétera, no siempre recambian con un enlace a las bitácoras enlazadoras, con lo que la interconexión es imperfecta. Hay casos, como en la excelente y muy referenciada bitácora "Ciencia 15", en los que no hay enlace interno alguno.

¿Ideas? ¿Comentarios? ¿Sugerencias para análisis posteriores?

Nota: en http://intraweb.psi.uji.es/map.txt disponéis de la lista que he compilado

# - Escrito por Fabrizio el 2003-03-25 a las 23:03


Referencias (TrackBacks)

URL de trackback de esta historia http://fbenedetti.blogalia.com//trackbacks/6462

Comentarios

1
De: fernand0 Fecha: 2003-03-25 23:44

Sugerencia: comparar con: www.pisotrece.com/vecindario/
El programa que hace el vecindario está hecho en python (creo) así que debería ir en Windows (tal vez).



2
De: Algernon Fecha: 2003-03-26 00:05

Gracias fernand0, esos datos son muy interesantes también, aunque ahí se tienen también en cuenta las referencias causales hechas en posts y en comentarios, supongo. Yo por otro lado estaba interesado en la conducta voluntaria de "alianza" entre bitácoras. A propósito de Python, sí que va bajo windows, pero no encuentro el código fuente en esa página.



3
De: JJ Fecha: 2003-03-26 01:03

¿Sería posible añadir al blogómetro un API para que se puedan saber los enlaces entrantes y salientes en una bitácora?
Una pregunta, Algernon: usas sólo enlaces de historias o enlaces de las plantillas? ¿O los dos? Por lo que dices, parece que son los dos, ¿no?



4
De: fernand0 Fecha: 2003-03-26 03:08

JJ: estamos pensando en poner la base de datos abierta a ese tipo de consultas, en cuanto rvr y yo coincidamos durante tiempo suficiente desocupados y a la vez ;)



5
De: Ctugha Fecha: 2003-03-26 03:12

El Visual Neighbourhood que comento aquí hace cosas muy chulas en el sentido de analizar los enlaces. Ahí se vé el tipo de alianzas/nodos/etc entre bitácoras. Mu guay.



6
De: JJ Fecha: 2003-03-26 03:12

No necesito deciros que contéis conmigo para eso, ¿no?



7
De: Ctugha Fecha: 2003-03-26 03:18

JJ, te vamos a tener que dar algo pa currar; te veo impaciente.



8
De: fernand0 Fecha: 2003-03-26 03:23

El apaño es sencillo, JJ. Posiblemente en la máquina de blogalia hay sitio para poner la base de datos, pero no puede hacer el arañzo. La que hace el arañazo puede hacerlo sin problemas, pero no se puede poner a disposición general. Asi que sólo falta arbitrar un sistema sencillo para enviar cada día el arañazo a la base de datos ..



9
De: Algernon Fecha: 2003-03-26 04:32

JJ: uso sólo enlaces de plantilla, más que nada porque tienen un caracter más "permanente", como si establecieran una relación de "parentesco" de forma más explicita. Los enlaces de plantillas no llevan etiqueta XML, pero sería interesante crear algo aposta supongo. Sino, queda hacer un parse tradicional, como el del enlace de Ctugha (muy bueno por cierto, se me escapó!)



10
De: Ctugha Fecha: 2003-03-26 18:04

Algernon, ¿has doble-clickeado en los enlaces que tu página abre?



11
De: Algernon Fecha: 2003-03-26 20:35

Ein? Ctugha, explícate, no entiendo :D ¿Qué enlaces? ¿Doble-clickear?



Nombre
Correo-e
URL
Dirección IP: 54.198.116.180 (81748c81e2)
Comentario

Ver historias anteriores