12
Franck GHITALLA / 2012 1 Réseaux, Graphes, Cartographie IC05 – Semestre Printemps 2012 Université de Technologie de Compiègne INTRODUCTION a) Networks L’émergence de la thématique des réseaux Le cas des Information networks : la diversité des sources de documents numériques L’importance actuelle des réseaux sociaux b) Quels modèles explicatifs, quels dispositifs d’observation, quelles données ? Mais : comment expliquer des architectures massivement distribuées et dynamiques? Retour des questions d’ingénierie (instruments) et des outils d’exploration du complexe L’avènement des NetWork Sciences Application(s) aux Information networks La recherche des clefs de la maîtrise des Grandes Masses de Données numériques, distribuées et dynamiques Des origines, des emprunts, des migrations Les années 96-99 et les Web Sciences c) Une démarche globale d’ingénierie Observer, comprendre, agir Les Networks Sciences vs « sciences du complexe » Un projet global d’infrastructure, de projets et d’acteurs (Linkfluence, GEPHI, Medialab…) Des terrains d’application… Les projets cartographiques

Ic05plan

Embed Size (px)

DESCRIPTION

Plan du cours IC05 UTC Ghitalla 2012

Citation preview

Page 1: Ic05plan

Franck GHITALLA / 2012 1

Réseaux, Graphes, Cartographie

IC05 – Semestre Printemps 2012

Université de Technologie de Compiègne

INTRODUCTION a) Networks

L’émergence de la thématique des réseaux Le cas des Information networks : la diversité des sources de documents numériques L’importance actuelle des réseaux sociaux

b) Quels modèles explicatifs, quels dispositifs d’o bservation, quelles données ?

Mais : comment expliquer des architectures massivement distribuées et dynamiques? Retour des questions d’ingénierie (instruments) et des outils d’exploration du complexe L’avènement des NetWork Sciences Application(s) aux Information networks La recherche des clefs de la maîtrise des Grandes Masses de Données numériques, distribuées et dynamiques Des origines, des emprunts, des migrations Les années 96-99 et les Web Sciences

c) Une démarche globale d’ingénierie

Observer, comprendre, agir Les Networks Sciences vs « sciences du complexe » Un projet global d’infrastructure, de projets et d’acteurs (Linkfluence, GEPHI, Medialab…) Des terrains d’application… Les projets cartographiques

Page 2: Ic05plan

Franck GHITALLA / 2012 2

I) OBSERVER (Networks Analysis : Measures and Metrics )

I-1) Networks and their representation (M.E.J. Newman, Networks – An introduction)

• Graph theory (backgrounds and history) • Adjency Matrix • Weighted Networks • Directed networks • Bi and Tri-partite networks / Graph transformation • Acyclic directed networks • Data aggregation

FOCUS : Les Cartes des Sciences : mét hodes et enjeux

I-2) Degree, Paths and Distances (M.E.J. Newman, Networks – An introduction) • Density • Dense/sparse networks • Regular networks • IN-Degree, OUT-Degree • Distribution of links / degree distribution and power-law • Path length / shortest path length • Diameter

FOCUS : Ecological networks and Food Webs (M.Buchanan , “The Tangled Web”)

I-3) Components / Groups of nodes / Clustering (M.E.J. Newman, Networks – An introduction)

“The hard task” (cf. M.-J. Newman) / between tradition (sociology) and the new Computational Social Sciences (CSS)

Page 3: Ic05plan

Franck GHITALLA / 2012 3

I-3-a) Backgrounds • Connected/disconnected • Directed graph and weakly connected components / Giant component / Strongly connected

component • Sets, sub-sets, cut sets

I-3-b) Structural properties / Connectedness • Degree centrality • Eigenvector centrality • PageRank • Hubs and Authorities (HITS)

I-3-c) Structural properties / Distances • Closeness centrality • Betweenness centrality

FOCUS : Modèle topologique de l’agrégat dans un set de données (exemples de mesures avec GEPHI sur les données du WebDatarium )

I-3-d) Grouping nodes through linkage distribution • Groups, communities, cliques, clusters, k-plex • Triades and transitivity • Local clustering and redundancy • Reciprocity • Similarity, cosine similarity • Regular equivalence • Homophily and Assortative Mixing • Assortative mixing by enumerative characteristics

I-3-e) Dividing networks into clusters • Clustering coefficients • Social Data Mining and social engineering • Graph partitioning / from existing categories / from statistical properties (hard task) • Community detection / algorithms (modularity methods, dynamic methods, edges weights,

actors and e-cologic competition) • Hierarchical clustering

Page 4: Ic05plan

Franck GHITALLA / 2012 4

FOCUS : Linkfluence et les Computational Social Sciences

I-4) Dynamics, Evolution, Temporal Aspects (M.E.J. Newman, Networks – An introduction)

I-4-a) Backgrounds • Networks formation / Genèse des patterns • Information IN/ON the net • Removal/addition of nodes/edges • Propagation, diffusion, spreadings

I-4-b) Spreadings • Epidemics model(s) • The S.I.R.S. model

I-4-c) Evolution • Preferential attachement / time and fitness (Price, Albert-Barabasi) • Vertex copying model(s) (Kleinberg)

I-4-d) Structure • Phase transition • Percolation • Thresholds • Transition phase and “cascades” / Equilibrium

FOCUS : le « cascade model » de D.Watts (Chapitre 8 de Six Degrees "Thresholds, Cascades and Predictibility")

Page 5: Ic05plan

Franck GHITALLA / 2012 5

II) COMPRENDRE (Patterns and Canonical Models )

II-1) Small World Experiments

• “Six degrees of separation” (Barabasi, Linked) • M.Granovetter • S.Milgram (chapitre 5, Six Degrees, D. Watts)

II-2) Le « tunner analytique » (D. Watts, Six Degrees, chapitre 4, S.Strogatz, Synch., chap.9)

• Clusters, proximity and long distances • Randomness, universality and complex systems • Le paramètre p (Strogatz-Watts) et les modèles alpha et beta. / The « order-randomness-

spectrum » (D. Watts, S. Strogatz)

FOCUS : le « tunner analytique » et la typologie des réseaux

II-3) Corrélation contenu/structure et modèle en ag régats

II-3-a) Networks of content Data, Knowledge discovery, WWW and Hyperlinked worlds, Text as Data, Keywords and Citation networks, Topics Detection and Tracking (TDT), Focus-crawling

FOCUS : Des contenus, des liens et des acteurs : StarGIT et CpanExplorer

Page 6: Ic05plan

Franck GHITALLA / 2012 6

II-3-b) Principes du modèle en agrégats / Expansion / Attraction / Le modèle gravitationnel du web (Montgolfier et al.) / Couches (layers) et propriétés / Topical localities, agrégats (Kleinberg et HITS)

FOCUS : un modèle experimental : le “modèle en couches” ( network layers )

II-4) Other dimensions

• Beyond “power-law” : Scale-free Networks (Barabasi, Albert et al.) • Robustness and Aschile’ Heel / structural holes • Networks layers : la diversité des modèles topologiques mobilisés et l’imbrication des

niveaux d’analyse • Synchronized Chaos and Small Worlds Networks (S.Strogatz, Synch, the emerging science

of spontaneous order, chapitres 7, 8 et 9)

FOCUS : la Fabrique du vivant ( Biological Networks )

Page 7: Ic05plan

Franck GHITALLA / 2012 7

III) VISUALISER-CARTOGRAPHIER

III-1) Interfaces, graphes et cartographies de l’in formation

• Visualisation de graphes / Le point de vue sur les visualisations de S.Strogatz (Sync.) et D. Watts (Six Degrees)

• Mapping knowledge tools / Synthèse et exploration

FOCUS : Infovis, exploration, cognition

• Les Cartographies de l’information : comment les définir ? (graphes et cartographie, espaces de représentation d’un corpus de données, organisation sous-jacente et patterns, solutions graphiques et codes communs)

• Les cartographies de l’information : quels enjeux ? (Le dispositif sémiologique : écriture, espace de projection et vue sur les données, composition, Cartes des réseaux : Les localités thématiques, Hybridation des espaces d'action, La carte et le territoire, L'acte cartographique : "Où suis-je?", Le sceau du pouvoir, Cartes : collections et Atlas)

III-2) GEPHI : la pierre angulaire • Le format GEXF • Trois espaces de travail • Algorithmes d’analyse des réseaux • Algorithmes de spatialisation / La famille des force-directed (Ifan-Hu, Fruchterman

Rheingold, ForceAtlas 1, ForceAtlas2)

FOCUS : Anatomy of ForceAtlas2 algorithm

III-3) Recherche de l’ordre, construction des vues

• A différentes échelles (zoom, seuils statistiques…)

Page 8: Ic05plan

Franck GHITALLA / 2012 8

• Selon différentes dimensions (une ou plusieurs dimensions, principes de corrélation…)

Géographie de la « coopération » scientifique : le rés eau des co-publications en Chimie (2006-2010)

Production d’un graphe bi-partite97.559 auteurs

85.381 mots-clefs1.990.981 liens

Visualisation des principales communautés de co-publication en Chimie (au moins 30

chercheurs et plus de 10 co-publications)

Identification des communautés par les mots-clefs et identification des mots-clefs

spécialisés par les communautés(chercheurs spécialisés

et vocabulaire expert)

• Temporalité(s) / La question des interfaces pour quels modèles et systèmes de mesure du

temps dans les réseaux…

• Vues possibles intégrant à la fois variations d’échelles et de dimensions / la nécessaire

scénarisation d’un jeu de cartographies multiples

Page 9: Ic05plan

Franck GHITALLA / 2012 9

III-4) Le projet cartographique • Processing/Cycle de production / Les étapes préparatoires d’un projet cartographique

• Types de méthodes / Traitement, filtrage et enrichissement des données - REDUIRE LES MASSES ET LES DIMENSIONS

Produire des indicateurs de masses, de densité, de clustering, de voisinage et de centration Concevoir des filtres Décomposer les dimensions (topologie hypertexte, texte et contenu, indicateurs d’usage…) Modèle(s) de distribution des propriétés des corpus

- FAIRE EMERGER DES PATTERNS

Méthodes de projection spatiale, visualisation des données Identification de saillances logico-graphiques Capitaliser/archiver les phases de transformation des corpus Ingénierie de l’exploration des corpus par : Fusion des données de données hétérogènes Niveaux de navigation/zoom Réduction (algorithmes de hiérarchisation/clustering…) Projection (fonds géoréférencés, schémas fonctionnels, organigrammes…)

- CONSTRUIRE DES FIGURES

Principes d’agrégation Organisation, architecture et sous-ensembles Couches et profondeurs des corpus Temporalités et événements

• Classes (techniques) de cartographies de l’information FOCUS : Anatomie d’une Fondation de recherche

Page 10: Ic05plan

Franck GHITALLA / 2012 10

IV) AGIR (Network Services Design )

Computing for Networks

FOCUS : INmaps

Indicateurs et aide à la décision

Le projet cartographique et classes de cartographies de l’information Social and Geographical monitoring of complex and distributed organizations Indicateurs d’aide à la gouvernance, I.S.T. Bases de connaissances et analyse des savoirs et/ou de la production scientifique Veille territoriale FOCUS : Le RADAR d’un pôle de compétitivité

Veille, Valeur de l’information stratégique

Veille / IST / brevets / documentation Connaissances et opinions / le marché de l’influence, e-reputation and social management Stratégies et dispositifs d’observation des réseaux

Observer l’Agora numérique (courant politiques et éthiques, controverses, opinions et croyances…)

FOCUS : Opinions, diasporas, Controverses : un moteur web de recherche dédié à l’observation et à la cartographie des controverses sociétales est-il réalisable ?

Page 11: Ic05plan

Franck GHITALLA / 2012 11

Exploration, Science Data scientist, scientific applications, e-sciences, data and scientific networks

FOCUS : les Socio-economic networks (Boards, companies, markets, products)

Design, graphisme, esthétique

FOCUS : Data-Flights

Défense / Sécurité FOCUS : Thee March 11th Terrorist Network: In its weakne ss lies its strength ( José A. Rodríguez)

Page 12: Ic05plan

Franck GHITALLA / 2012 12

REFERENCES

BIBLIOGRAPHIE (top 10) BARABASI A.-L., linked, the new science of network, Perseus Publishing, 2003. BORNER K., Atlas of Science: Visualizing What We Know, MIT Press, 2010. BUCHANAN M., Nexus, Small Worlds and the groundbreaking Theory of Networks 2003. CHAKRABARTI S., mining the web, 2002. DAVISON B.-D., « Unifying Text and Link Analysis », IBM, Palo-Alto, 2003. KLEINBERG J., LAWRENCE S., « The Structure Of The Web », Science, vol.294, 30, november, 2001. KLEINBERG J., “Authoritative Sources in a Hyperlinked Environment“, Proceedings of the ACM-SIAM Symposium on Discret Algorithms, ACM Press,1998. NEWMAN M., The structure and dynamics of networks, Princeton University Press, 2003. STROGATZ S. Sync: the emerging science of spontaneous order, MIT-Press2004. WATTS D. Six Degrees. The Sciences of a Connected Age, Duncan Watts, Eds.W.W.Norton, New-York-London, 2004. Sites web sur les Network Sciences Santa Fe institute (http://www.santafe.edu/) CSCS (Center for the Study of Complex Systems) (http://cscs.umich.edu/) UCLA-HCS Human Complex Systems (http://hcs.ucla.edu/) New England Complex Systems Institute (http://necsi.edu/) Center for Computational Analysis of Social and Organizational Systems (CASOS) (http://www.casos.cs.cmu.edu/) CNets Center for Complex Networks and Systems Research (http://cnets.indiana.edu/) Argonne National Laboratory (http://www.anl.gov/) Center for Social Complexity (Georges Mason University) (http://socialcomplexity.gmu.edu/) Center for Social Dynamics and Complexity (Arizona State university) (http://csdc.asu.edu/) NICO (Northwestern Institute on Complex Systems) (http://www.northwestern.edu/nico/) Park Center for Complex Systems (M.I.T.) (http://web.mit.edu/pccs/) Sites web de référence L’Atelier de Cartographie, http://ateliercartographie.wordpress.com/ Linkfluence, http://fr.linkfluence.net/ Le projet TicMigrations, http://ticmigrations.fr/ GEPHI, http://gephi.org/ Medialab Sciences-Po, http://www.medialab.sciences-po.fr/ Les chercheurs Victor-Laszlo Barabasi, Northeastern University, Center for Complex Network Research, http://www.barabasilab.com/ Cyberinfrastructure for Network Science, http://cns.iu.edu/ Duncan Watts, YAHOO ! Research, http://research.yahoo.com/Duncan_Watts Jon Kleinberg, Department of Computer Science Cornell University http://www.cs.cornell.edu/home/kleinber/ Marc E.-J. Newman, Department of Physics and Center for the Study of Complex Systems, University of Michiganhttp://www-personal.umich.edu/~mejn/ Places and Spaces, Mapping Science, http://scimaps.org/ Steven Strogatz, Cornell University, Theorical and Applied Mechanics, http://tam.cornell.edu/faculty-bio.cfm?NetID=shs7