Je suis actuellement en train de lire le livre : “Modelling and Data Mining the Blogosphere” de N.Agarwal et H.Liu.
Le livre est un condensé de maths appliquées au web, et spécialement au monde des blogs. Pour vous donner envie de lire le livre, voilà un petit extrait :
Past few years have observed a phenomenal growth in the blogosphere. Technorati
(http://technorati.com/blogging/state-of-the-blogosphere/) published a report on
the growth of the blogosphere. The report mentioned that the blogosphere is consistently doubling
every 5 months for the last 4 years and the size was estimated to be approximately 133 million blogs
by December 2008. Furthermore, 2 new blogs or roughly 18.6 new blog posts are added to the blogosphere
every second. Given the prominent and continued growth of the blogosphere, it is natural
to ask whether it is possible to model the growth of the blogosphere and derive some macro-level
statistics that characterizes the blog network. To study the complex network such as blogosphere,
researchers can develop blog models and generate data through these models while continuously
collecting blog data.
Je posterai peut être des mises à jour à ce billet qui est quasiment aussi rempli qu’un tweet.
Note :
En premier lieu, les auteurs distinguent deux graphes orientés : graphe des blogs, graphe des posts. Le premier constitue la forme basse résolution du deuxième graphe. En effet, dans le deuxième on considère chaque post unique comme un sommet du graphe, et les liens pointant vers d’autres posts sont les arêtes du graphe. Le premier graphe quand à lui rassemble tous les posts sous le blog initial.