Upload
latelier-de-cartographie
View
1.414
Download
0
Embed Size (px)
DESCRIPTION
Plan du cours IC05 UTC Ghitalla 2012
Citation preview
Franck GHITALLA / 2012 1
Réseaux, Graphes, Cartographie
IC05 – Semestre Printemps 2012
Université de Technologie de Compiègne
INTRODUCTION a) Networks
L’émergence de la thématique des réseaux Le cas des Information networks : la diversité des sources de documents numériques L’importance actuelle des réseaux sociaux
b) Quels modèles explicatifs, quels dispositifs d’o bservation, quelles données ?
Mais : comment expliquer des architectures massivement distribuées et dynamiques? Retour des questions d’ingénierie (instruments) et des outils d’exploration du complexe L’avènement des NetWork Sciences Application(s) aux Information networks La recherche des clefs de la maîtrise des Grandes Masses de Données numériques, distribuées et dynamiques Des origines, des emprunts, des migrations Les années 96-99 et les Web Sciences
c) Une démarche globale d’ingénierie
Observer, comprendre, agir Les Networks Sciences vs « sciences du complexe » Un projet global d’infrastructure, de projets et d’acteurs (Linkfluence, GEPHI, Medialab…) Des terrains d’application… Les projets cartographiques
Franck GHITALLA / 2012 2
I) OBSERVER (Networks Analysis : Measures and Metrics )
I-1) Networks and their representation (M.E.J. Newman, Networks – An introduction)
• Graph theory (backgrounds and history) • Adjency Matrix • Weighted Networks • Directed networks • Bi and Tri-partite networks / Graph transformation • Acyclic directed networks • Data aggregation
FOCUS : Les Cartes des Sciences : mét hodes et enjeux
I-2) Degree, Paths and Distances (M.E.J. Newman, Networks – An introduction) • Density • Dense/sparse networks • Regular networks • IN-Degree, OUT-Degree • Distribution of links / degree distribution and power-law • Path length / shortest path length • Diameter
FOCUS : Ecological networks and Food Webs (M.Buchanan , “The Tangled Web”)
I-3) Components / Groups of nodes / Clustering (M.E.J. Newman, Networks – An introduction)
“The hard task” (cf. M.-J. Newman) / between tradition (sociology) and the new Computational Social Sciences (CSS)
Franck GHITALLA / 2012 3
I-3-a) Backgrounds • Connected/disconnected • Directed graph and weakly connected components / Giant component / Strongly connected
component • Sets, sub-sets, cut sets
I-3-b) Structural properties / Connectedness • Degree centrality • Eigenvector centrality • PageRank • Hubs and Authorities (HITS)
I-3-c) Structural properties / Distances • Closeness centrality • Betweenness centrality
FOCUS : Modèle topologique de l’agrégat dans un set de données (exemples de mesures avec GEPHI sur les données du WebDatarium )
I-3-d) Grouping nodes through linkage distribution • Groups, communities, cliques, clusters, k-plex • Triades and transitivity • Local clustering and redundancy • Reciprocity • Similarity, cosine similarity • Regular equivalence • Homophily and Assortative Mixing • Assortative mixing by enumerative characteristics
I-3-e) Dividing networks into clusters • Clustering coefficients • Social Data Mining and social engineering • Graph partitioning / from existing categories / from statistical properties (hard task) • Community detection / algorithms (modularity methods, dynamic methods, edges weights,
actors and e-cologic competition) • Hierarchical clustering
Franck GHITALLA / 2012 4
FOCUS : Linkfluence et les Computational Social Sciences
I-4) Dynamics, Evolution, Temporal Aspects (M.E.J. Newman, Networks – An introduction)
I-4-a) Backgrounds • Networks formation / Genèse des patterns • Information IN/ON the net • Removal/addition of nodes/edges • Propagation, diffusion, spreadings
I-4-b) Spreadings • Epidemics model(s) • The S.I.R.S. model
I-4-c) Evolution • Preferential attachement / time and fitness (Price, Albert-Barabasi) • Vertex copying model(s) (Kleinberg)
I-4-d) Structure • Phase transition • Percolation • Thresholds • Transition phase and “cascades” / Equilibrium
FOCUS : le « cascade model » de D.Watts (Chapitre 8 de Six Degrees "Thresholds, Cascades and Predictibility")
Franck GHITALLA / 2012 5
II) COMPRENDRE (Patterns and Canonical Models )
II-1) Small World Experiments
• “Six degrees of separation” (Barabasi, Linked) • M.Granovetter • S.Milgram (chapitre 5, Six Degrees, D. Watts)
II-2) Le « tunner analytique » (D. Watts, Six Degrees, chapitre 4, S.Strogatz, Synch., chap.9)
• Clusters, proximity and long distances • Randomness, universality and complex systems • Le paramètre p (Strogatz-Watts) et les modèles alpha et beta. / The « order-randomness-
spectrum » (D. Watts, S. Strogatz)
FOCUS : le « tunner analytique » et la typologie des réseaux
II-3) Corrélation contenu/structure et modèle en ag régats
II-3-a) Networks of content Data, Knowledge discovery, WWW and Hyperlinked worlds, Text as Data, Keywords and Citation networks, Topics Detection and Tracking (TDT), Focus-crawling
FOCUS : Des contenus, des liens et des acteurs : StarGIT et CpanExplorer
Franck GHITALLA / 2012 6
II-3-b) Principes du modèle en agrégats / Expansion / Attraction / Le modèle gravitationnel du web (Montgolfier et al.) / Couches (layers) et propriétés / Topical localities, agrégats (Kleinberg et HITS)
FOCUS : un modèle experimental : le “modèle en couches” ( network layers )
II-4) Other dimensions
• Beyond “power-law” : Scale-free Networks (Barabasi, Albert et al.) • Robustness and Aschile’ Heel / structural holes • Networks layers : la diversité des modèles topologiques mobilisés et l’imbrication des
niveaux d’analyse • Synchronized Chaos and Small Worlds Networks (S.Strogatz, Synch, the emerging science
of spontaneous order, chapitres 7, 8 et 9)
FOCUS : la Fabrique du vivant ( Biological Networks )
Franck GHITALLA / 2012 7
III) VISUALISER-CARTOGRAPHIER
III-1) Interfaces, graphes et cartographies de l’in formation
• Visualisation de graphes / Le point de vue sur les visualisations de S.Strogatz (Sync.) et D. Watts (Six Degrees)
• Mapping knowledge tools / Synthèse et exploration
FOCUS : Infovis, exploration, cognition
• Les Cartographies de l’information : comment les définir ? (graphes et cartographie, espaces de représentation d’un corpus de données, organisation sous-jacente et patterns, solutions graphiques et codes communs)
• Les cartographies de l’information : quels enjeux ? (Le dispositif sémiologique : écriture, espace de projection et vue sur les données, composition, Cartes des réseaux : Les localités thématiques, Hybridation des espaces d'action, La carte et le territoire, L'acte cartographique : "Où suis-je?", Le sceau du pouvoir, Cartes : collections et Atlas)
III-2) GEPHI : la pierre angulaire • Le format GEXF • Trois espaces de travail • Algorithmes d’analyse des réseaux • Algorithmes de spatialisation / La famille des force-directed (Ifan-Hu, Fruchterman
Rheingold, ForceAtlas 1, ForceAtlas2)
FOCUS : Anatomy of ForceAtlas2 algorithm
III-3) Recherche de l’ordre, construction des vues
• A différentes échelles (zoom, seuils statistiques…)
Franck GHITALLA / 2012 8
• Selon différentes dimensions (une ou plusieurs dimensions, principes de corrélation…)
Géographie de la « coopération » scientifique : le rés eau des co-publications en Chimie (2006-2010)
Production d’un graphe bi-partite97.559 auteurs
85.381 mots-clefs1.990.981 liens
Visualisation des principales communautés de co-publication en Chimie (au moins 30
chercheurs et plus de 10 co-publications)
Identification des communautés par les mots-clefs et identification des mots-clefs
spécialisés par les communautés(chercheurs spécialisés
et vocabulaire expert)
• Temporalité(s) / La question des interfaces pour quels modèles et systèmes de mesure du
temps dans les réseaux…
• Vues possibles intégrant à la fois variations d’échelles et de dimensions / la nécessaire
scénarisation d’un jeu de cartographies multiples
Franck GHITALLA / 2012 9
III-4) Le projet cartographique • Processing/Cycle de production / Les étapes préparatoires d’un projet cartographique
• Types de méthodes / Traitement, filtrage et enrichissement des données - REDUIRE LES MASSES ET LES DIMENSIONS
Produire des indicateurs de masses, de densité, de clustering, de voisinage et de centration Concevoir des filtres Décomposer les dimensions (topologie hypertexte, texte et contenu, indicateurs d’usage…) Modèle(s) de distribution des propriétés des corpus
- FAIRE EMERGER DES PATTERNS
Méthodes de projection spatiale, visualisation des données Identification de saillances logico-graphiques Capitaliser/archiver les phases de transformation des corpus Ingénierie de l’exploration des corpus par : Fusion des données de données hétérogènes Niveaux de navigation/zoom Réduction (algorithmes de hiérarchisation/clustering…) Projection (fonds géoréférencés, schémas fonctionnels, organigrammes…)
- CONSTRUIRE DES FIGURES
Principes d’agrégation Organisation, architecture et sous-ensembles Couches et profondeurs des corpus Temporalités et événements
• Classes (techniques) de cartographies de l’information FOCUS : Anatomie d’une Fondation de recherche
Franck GHITALLA / 2012 10
IV) AGIR (Network Services Design )
Computing for Networks
FOCUS : INmaps
Indicateurs et aide à la décision
Le projet cartographique et classes de cartographies de l’information Social and Geographical monitoring of complex and distributed organizations Indicateurs d’aide à la gouvernance, I.S.T. Bases de connaissances et analyse des savoirs et/ou de la production scientifique Veille territoriale FOCUS : Le RADAR d’un pôle de compétitivité
Veille, Valeur de l’information stratégique
Veille / IST / brevets / documentation Connaissances et opinions / le marché de l’influence, e-reputation and social management Stratégies et dispositifs d’observation des réseaux
Observer l’Agora numérique (courant politiques et éthiques, controverses, opinions et croyances…)
FOCUS : Opinions, diasporas, Controverses : un moteur web de recherche dédié à l’observation et à la cartographie des controverses sociétales est-il réalisable ?
Franck GHITALLA / 2012 11
Exploration, Science Data scientist, scientific applications, e-sciences, data and scientific networks
FOCUS : les Socio-economic networks (Boards, companies, markets, products)
Design, graphisme, esthétique
FOCUS : Data-Flights
Défense / Sécurité FOCUS : Thee March 11th Terrorist Network: In its weakne ss lies its strength ( José A. Rodríguez)
Franck GHITALLA / 2012 12
REFERENCES
BIBLIOGRAPHIE (top 10) BARABASI A.-L., linked, the new science of network, Perseus Publishing, 2003. BORNER K., Atlas of Science: Visualizing What We Know, MIT Press, 2010. BUCHANAN M., Nexus, Small Worlds and the groundbreaking Theory of Networks 2003. CHAKRABARTI S., mining the web, 2002. DAVISON B.-D., « Unifying Text and Link Analysis », IBM, Palo-Alto, 2003. KLEINBERG J., LAWRENCE S., « The Structure Of The Web », Science, vol.294, 30, november, 2001. KLEINBERG J., “Authoritative Sources in a Hyperlinked Environment“, Proceedings of the ACM-SIAM Symposium on Discret Algorithms, ACM Press,1998. NEWMAN M., The structure and dynamics of networks, Princeton University Press, 2003. STROGATZ S. Sync: the emerging science of spontaneous order, MIT-Press2004. WATTS D. Six Degrees. The Sciences of a Connected Age, Duncan Watts, Eds.W.W.Norton, New-York-London, 2004. Sites web sur les Network Sciences Santa Fe institute (http://www.santafe.edu/) CSCS (Center for the Study of Complex Systems) (http://cscs.umich.edu/) UCLA-HCS Human Complex Systems (http://hcs.ucla.edu/) New England Complex Systems Institute (http://necsi.edu/) Center for Computational Analysis of Social and Organizational Systems (CASOS) (http://www.casos.cs.cmu.edu/) CNets Center for Complex Networks and Systems Research (http://cnets.indiana.edu/) Argonne National Laboratory (http://www.anl.gov/) Center for Social Complexity (Georges Mason University) (http://socialcomplexity.gmu.edu/) Center for Social Dynamics and Complexity (Arizona State university) (http://csdc.asu.edu/) NICO (Northwestern Institute on Complex Systems) (http://www.northwestern.edu/nico/) Park Center for Complex Systems (M.I.T.) (http://web.mit.edu/pccs/) Sites web de référence L’Atelier de Cartographie, http://ateliercartographie.wordpress.com/ Linkfluence, http://fr.linkfluence.net/ Le projet TicMigrations, http://ticmigrations.fr/ GEPHI, http://gephi.org/ Medialab Sciences-Po, http://www.medialab.sciences-po.fr/ Les chercheurs Victor-Laszlo Barabasi, Northeastern University, Center for Complex Network Research, http://www.barabasilab.com/ Cyberinfrastructure for Network Science, http://cns.iu.edu/ Duncan Watts, YAHOO ! Research, http://research.yahoo.com/Duncan_Watts Jon Kleinberg, Department of Computer Science Cornell University http://www.cs.cornell.edu/home/kleinber/ Marc E.-J. Newman, Department of Physics and Center for the Study of Complex Systems, University of Michiganhttp://www-personal.umich.edu/~mejn/ Places and Spaces, Mapping Science, http://scimaps.org/ Steven Strogatz, Cornell University, Theorical and Applied Mechanics, http://tam.cornell.edu/faculty-bio.cfm?NetID=shs7