Auto-organisation et visualisation des graphes

Page principale - S'identifier

Bienvenue

Attention Le site officiel du projet Autograph a déménagé : Le wiki officiel.

Ce qui suit est donc obsolète.

Bienvenue sur le Blog/Wiki d'Autograph. Vous pouvez vous inscrire dans la colonne de gauche.

Une fois inscrits, les membres du projet doivent demander le statut de rédacteur aux administrateurs (, ou Jean-Michel Cornu)

Tous les articles et textes sont modifiables par les utilisateurs qui ont le statut de rédacteur.
Vous êtes donc vivement encouragés à contribuer à l'enrichissement de ce site collaboratif.

Voir un petit pour le blog-wiki.

 

prochaine réunion mercredi 21 juin

au , salle 6A92,
mercredi 21 juin,
à 14h

Ordre du jour :

  • Semiophore (Elie)
  • Visualisation / anoptique ()
  • Intelligence collective (Jean-Michel)
  • Questions de gouvernance (Nicolas et al.)
  • Point sur les graphes alters (Dominique)

CR réunion du 16 mai 2006

Présents : Pascal Pons (LIAFA),

→ plus

Lire la suite...

Graphes autour des contributeurs au format GraphML

 

J'ai placé ici :

http://www.semiophore.net/autograph

ou ici :

http://62.147.174.219/autograph/


une archive de 330Mo : triture2_contributeurs.7z

Il s'agit de tables supplémentaires créées à partir de la base autograph et surtout de la table simplerevision (correspondant résumé des révisions généré par Benoît Habert)
L'archive contient également des fichiers au format GraphML :
- Graphe des catégories
- Graphe de type contrbuteur-article
- Graphe de type contributeur-catégorie

Pour ouvrir un archive 7z sous Windows comme sous Linux, utiliser 7zip, encore plus performant que bzip2 -9 : http://www.7-zip.org/fr

N'hésitez pas à m'appeler pour toute question.

Ci dessous, copié-collé du log des expériences et requêtages SQL pour construire les sorties GraphML.

→ plus

Lire la suite...

Données synthétiques sur les révisions de Wikipedia FR

Fichier de données

L'archive intégrale de WikipediaFR fournit les révisions et le texte d'icelles.

Un "résumé" de ces archives, élagué du texte des révisions, comprend les informations suivantes (en un fichier tabulé) :

<namespace><titre><page_id><n°révision><date révision><contributeur sur 2 colonnes><contribution mineure ou non : 0|1><commentaire><changements en caractères par rapport à la révision précédente><taille version courante><n° révision de cette page><dernière révision de la page ou non : 0|1>
Article Avignon 1               1       2002-07-26T08:25:43Z    Pog     -1      0       init    360     360     1        0
Article Avignon 1               2       2002-07-26T10:36:02Z    Mokona  -1      1       Orth.   -3      357     2        0
Article Avignon 1               9300    2002-10-31T10:11:31Z    script de conversion    -1      1       Conversion automatique   0       357     3       0
Article Avignon 1               45888   2002-10-31T12:31:45Z    Shaihulud       4       1       liens vers wiki anglais  22      379     4       0

Avec :
<contributeur sur 2 colonnes> := <contributeur à IP><contributeur à username>
<contributeur à IP> := <IP> -1
<contributeur à username> := <username><user_id>

NB : les informations sur les "contributeurs à IP" ne correspondent pas toujours à l'image qu'on se fait d'une IP.

Ce résumé permet déjà de :
  • construire un graphe bipartite articles vs contributeurs ;
  • disposer d'informations sur les contributeurs
    • volume en caractères
    • période(s) d'activité
    • ...
  • disposer d'informations sur les pages
    • évolution de la taille
    • classes de taille
    • évolution dans le temps
    • ...

Biologie, littérature, mathématiques et philosophie

Réseau des attirances (informations mutuelles) entre noms et adjectifs

Les graphes (au format GraphML et au format Pajek) pour des ensembles de pages de Wikipedia FR relevant de ces 4 thématiques.


Catégories et révisions

Organisation des catégories de WikipediaFR : ">survol

Outils de traitement des catégories de WikipediaFR

Accès aux révisions des articles

CR réunion du 21 mars

TAL et Wikipédia

→ plus

Lire la suite...

CR réunion du 7 mars

Extraction des données wikipedia

Présents : Jean-Daniel Fekete (INRIA), Benoît Habert (LIMSI), Martine Hurault-Plantet (LIMSI), Dominique Cardon (FTRD), Christophe Prieur (LIAFA), Nicolas Auray (ENST), Julien Levrel (FTRD), Michèle Jardino (LIMSI), Elie Naulleau (Semiosys)

→ plus

Lire la suite...