47
Appréhender les ressources numériques en ligne Le biais de la navigation sociale Loïc Le Roux CDDP d’Indre et Loire avril 2009

Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Embed Size (px)

DESCRIPTION

Le biais de la navigation sociale comme moyen de trouver l'information autrement.

Citation preview

Page 1: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

Le biais de la navigation sociale

Loïc Le Roux

CDDP d’Indre et Loire

avril 2009

Page 2: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

2

Trouver des ressources sur Internet :

trois problématiques importantes Problématique « technique »

(Taille du Web, Web visible vs invisible, Typologie des outils …).

Problématique « socio-technique » (Usages des outils et du Web documentaire …).et aussi « techno-sociale » : outils développés pour répondre à un besoin communautaire (Twitter, Flickr …)

Problématique pédagogique(Didactisation de la recherche, méthodologie et culture de l’information…).

Page 3: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

3

1. Problématique « technique »

Définition de l’Internet et mise au point préalable :

Internet (1969) est différent du Web (1990)

La recherche sur le Web n’est donc pas uniquement réductible à la recherche sur Internet. Exemple : une « ressource » peut être une adresse mel ou une réponse sur un forum.

Internet = un réseauLe WWW = du contenu

Page 4: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

4

1.1 La taille de Web [visible]

Une étude de l’université de l’Iowa évalue en janvier 2005 la taille du Web indexable (ou Web de surface) à 11,5 milliards de pages (« seulement » 2,5 milliards en sept. 2001).

http://www.cs.uiowa.edu/~asignori/web-size/

Une autre étude plus récente de février 2007 parle de 29,7 milliards de pages.Ce qu’il faut retenir : Chiffres à prendre comme ordre de grandeur : la taille du Web s’accroît de manière exponentielle (« infobésité »).

Page 5: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

5

1.2 Web visible & Web invisible

Le Web dit visible est accessible aux outils de recherche alors que le Web invisible ou profond (deep Web) ne l’est pas.

Une étude de sept. 2001 réalisée par l'entreprise BrightPlanet estime que le Web profond pouvait contenir 500 fois plus de ressources que le Web indexé par les moteurs de recherche.

Page 6: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

6

1.3 Typologies et caractéristiques des outils de recherche

Trois types d’outils de recherche classiques :

Moteur (Google, Yahoo, Live, Exalead, AV …) Métamoteur (Dogpile, Vivisimo, Kartoo …) Annuaire (ODP…).

Nécessité de comprendre comment ces outils fonctionnent pour mieux s’en servir (cf. Bruillard, 2000 et la problématique pédagogique).

Page 7: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

7

Principe d’un moteur de recherche

Page 8: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

8

Principe d’un métamoteur

Page 9: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

9

Principe d’un annuaire

Page 10: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

10

1.4 Un taux de recouvrement faible des moteurs de recherche

« Les moteurs de recherche ne travaillent pas que sur le même segment du Web, et quand ils sont sur la même portion, leurs algorithmes classent les pages et les restituent souvent, de manière radicalement différente » (BNF).

Même base = résultats différents

Exemple sur : http://ranking.thumbshots.com/

Page 11: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

11

Google vs YahooÉquation = didactique des sciences « cycle3 » 

Page 12: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

12

Autre exemple de recouvrement

Les résultats de recherche – pour une grande majorité - sur Google, Yahoo, MSN et Ask Jeeves sont différents. Une étude récente montre que seulement 1.1% des résultats sur la première page de ces quatre principaux moteurs sont identiques (étude portant 485 460 premières pages).

Etude sur Dogpile (2005).

Page 13: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

13

Recouvrement des premières pages de résultats : Google, Yahoo, MSN, Ask

Page 14: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

14

Page 15: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

15

Moteurs et clusterisation :une approche « lexico-sémantique »

Clusterisation : structuration automatique des résultats d’un moteur en présentant d’autres pistes de recherche reliées plus ou moins sémantiquement en vue d'affiner une nouvelle requête. Altavista le faisait déjà en 1996 : fonction refine puis Live Topics.

La catégorisation dynamique représente un facteur positif pour les recherches documentaires chez les élèves (désambiguïsation ).

Page 16: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

16

Rappel : Altavista (fonction refine)

Pour une recherche sur Bill Clinton, nous avions (en 1997) :

71% Clinton, presidential, president, campaign, candidates40% Republican, republicans, dole, democrats, gop,

gingrich, democratic, newt, bob22% Reform, welfare, illegal, immigrants, families,

immigration, recipients, poverty, afdc18% Hillary, governor, clintons, whitewater, rodham,

arkansas, scandal, starr, mcdougal

Vous pouviez alors choisir de rechercher à nouveau, cette fois en additionnant ou en excluant un terme.

Page 17: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

17

Moteurs de catégorisation actuels

Exalead, Vivisimo, Clusty, Aol Recherche et … Google ?

Page 18: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

18

Page 19: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

19

2. Problématique « socio-technique»

La réalité sociale du web compte aujourd’hui près d’un milliard d’internautes (Nielsen 2005, cf. Affordance).

L’outil de recherche se situe au carrefour de plusieurs mondes avec des logiques différentes : celui des concepteurs et des développeurs (orientations technologique et commerciale), celui des contenus de données (orientations documentaire et commerciales) et celui des comportements, des représentations et des appropriations des usagers (orientations socio-technique et commerciale).Au cours d’une recherche documentaire, ces mondes s’interfèrent ce qui crée des usages hybrides entre appropriation technologique et pratique sociale dans les apprentissages.

Page 20: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

20

Le cadre socio-technique de toute recherche documentaire

« Intégrer dans une même analyse technique et société, sans choisir un terme au détriment de l’autre (…) Il ne s’agit pas d’articuler seulement deux pôles : technique et société, mais de voir comment interfèrent de nombreux mondes sociaux, ceux des ingénieurs et des usagers, des industriels, des exploitants de services, des réparateurs, des commerçants, etc.» .

Flichy (2003). L’innovation technique : récents développements en sciences sociales. Ed. de la Découverte.

Page 21: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

21

2.1 Caractéristiques socio-techniques de Google

« Le résultat sans doute le plus frappant est le degré de satisfaction très médiocre des utilisateurs. Pour les meilleurs moteurs (Yahoo, Google), la note moyenne sur le premier écran de 10 résultats atteint à peine 2,3 sur une échelle de 0 à 5. […] Enfin, on remarquera que rien dans cette étude ne permet d’expliquer la préférence massive des internautes pour le moteur Google, puisque, globalement Google et Yahoo ont des performances à peu près équivalentes, et se détachent de leurs concurrents. Il faut donc supposer que les raisons en sont autres que des critères de pure pertinence des résultats ». (Véronis, 2006)

Page 22: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

22

Google : un outil technologique et social à la fois (PageRank)

PageRank est l’indice de popularité d'une page Web, calculé selon un algorithme sophistiqué, élaboré par Google.

L'algorithme PageRank fait partie des critères utilisés pour déterminer le positionnement (ranking) des pages dans Google. Ainsi, pour deux pages aux contenus comparables, celle ayant le meilleur PageRank sera souvent classée devant, surtout pour les requêtes très concurrentielles.

Une explication en français :

http://www.webmaster-hub.com/publication/L-algorithme-du-PageRank-explique.html

Page 23: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

23

La « sagesse » de Google

"La sagesse des foules fonctionne étonnamment bien. Les systèmes qui marchent sur le web fonctionnent du bas vers le haut ('bottom-up'). (...) Par exemple Flickr ne dit pas à ses utilisateurs quel tag utiliser pour leurs photos. Loin de là. N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable. Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)… » Adam Bosworth (2004)

Page 24: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

24

De la « sagesse populaire » …… à la dépendance technologique

La sagesse populaire de Google est-elle possible pour la recherche de documents « académiques » ? Entre notoriété et autorité, la confusion existe (idem entre affluence et influence et entre publicité et légitimité).

L’omniprésence (omnipotence ?) de l’utilisation de cet outil génère-t-il une captation technologique et intellectuelle de tout acte de recherche ? Si oui … Le recoupement de l’information n’existe plus… La réflexion sur l’utilisation de l’outil le plus

adéquat non plus … Google devient la seule perception du Web …

Page 25: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

25

Page 26: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

26

Lecture des résultats sur Google

Une étude de l'enregistrement des mouvements de l'œil (oculométrie ou eye tracking) révèle la présence d'un « triangle d’or ». Ce triangle symbolise une zone spatiale parcourue par les internautes sur la première page des résultats. Il représente surtout la visibilité des sites sur le moteur (importance stratégique pour le Web marchand).

Le triangle est d'or parce qu'il se révèle être l'endroit où 100% des usagers regardent. Les zones rouges représentent les endroits ou l'œil s’arrête le plus souvent.

… Ce qui n'est pas dans Google n'existe pas …

Page 27: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

27

Page 28: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

28

Page 29: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

29

Enquiro Eye Tracking Report II :

Page 30: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

30

…Vers un monde selon Google ?

Page 31: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

31

2.1 Un cas classique de recherche (élève)… Un seul outil (Google pour + 90 %) : dépendance et captation Très peu de mots-clés (deux en moyenne) : champ lexical très

pauvre Une interface de recherche simple Pas de reformulation du sujet si mauvais résultats Une lecture très linéaire des résultats (cf. « triangle d’or ») Un découragement rapide + faible motivation Un attrait des TIC sans passer par la documentation classique

(i.e. support papier).

Cf. Perriault (2002). L’accès au savoir en ligne

Page 32: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

32

… pour un résultat incertain et non probant … Des pages prises dans le « triangle d’or » Un site jugé pertinent par son temps de réponse Un site jugé pertinent par son ergonomie Parfois une sur-utilisation peu efficace du Web par les

utilisateurs réguliers (Tricot) Une perte de temps et un coût cognitif trop élevé par rapport à

l’objectif initial (risque de surcharge mentale dû à une trop grande sollicitation de l’outil et/ou de l’interface).

Cf. André Tricot. Apprentissages et documents numériques. Belin, 2007.

Page 33: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

33

3. Problématique pédagogique : quelques pistes

D’abord définir qu’est-ce que nous entendons par le mot ressource ? Toujours expliciter(Polysémie du mot ; que voulons-nous ? Que cherchons-nous ? Profondeur de l’information…)

Méthode(s) de recherche (pédagogie procédurale)(Existe-t-il une méthode générale de questionnement et de recherche documentaire ?)

Répondre au mieux au besoin informationnel (Le besoin informationnel comme représentation informationnelle d’un problème décisionnel).

Page 34: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

34

3.1 Qu’est ce qu’une ressource ?

Polysémie : cf. TLFI

Page 35: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

35

Définition d’une ressource

Étymologie du latin : "resurgere" se relever, se rétablir, reprendre des forces ; puis issu du verbe "resourdre" rejaillir, se rétablir, rétablir.

La ressource est proprement une seconde ou dernière source, une chose qui relève, un moyen qui fait sortir d'embarras. (XML Littré)

Page 36: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

36

Définition de la ressource numérique

Définition : tout composant d'un système. En informatique et en multimédia, 3 types de ressources sont distinguées : les ressources humaines, matérielles et logicielles : ressources humaines : programmeur spécialisé, vidéaste,

ingénieur du son, graphiste, réalisateur, ressources matérielles : unité centrale (processeur, mémoire

centrale, cartes), unités périphériques (d'extension de mémoire, de communication),

ressources logicielles : système d'exploitation et système d'exploitation.

(Educnet)

Page 37: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

37

3.2 De la méthodologie … à une ‘méthode’

Il existe de nombreux sites sur la méthodologie documentaire (tous les SCD en disposent en général).

Par exemple :

http://www.uhb.fr/scd/Methodoc_accueil.html

http://castore.univ-nantes.fr/didacticiel/

Voir aussi : Cerise, Sapristi ou Repere …

Page 38: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

38

Trouver une méthode satisfaisante (malgré l’incomplétude) pour

Réduire le coût cognitif de toute recherche

(compréhension de la question, procédures de recherche, sélection, validation : « la charge cognitive imposée par de nombreuses stratégies de résolution des problèmes gêne l'apprentissage, tout en n’empêchant pas d’atteindre la solution du problème ». [Tricot, 1998])

Réduire le temps de cette recherche (démotivation). Augmenter le rapport qualité /temps /coût

Page 39: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

39

Exemples de recherche (problématique récurrente des ressources en adéquation avec le public)

Trouver un document sur la production d’électricité lisible en cycle 3 (= pour des élèves de cycle 3)

Le traitement de l’eau (pour des élèves de cycle 3)

Les peintures préhistoriques (pour des élèves de collège)

Chercher des albums de jeunesse pour cycle 1 où des notions de SVT sont implicitement présentes (évaporation, ombre, gravitation, biologie, etc.) = travail de sciences à partir de littérature jeunesse.

Page 40: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

40

Pistes 1/2 : survalorisation technique

Ce qui rend une recherche difficile est peut-être la manière dont l’outil est pensé : omnipotence du moteur (i.e. de la technologie) pour trouver une information.

Page 41: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

41

Pistes 2/2 : médiation sociale

L’outil est essentiel mais pas forcément indispensable pour trouver directement l’information (i.e. la ressource numérique) il peut servir à pointer (indirectement) où peut se trouver cette information par le biais d’un vecteur social (la communauté ici).

Page 42: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

42

Le cas de la Préhistoire

Je cherche un document sur la taille de la pierre et l’habitat néolithique en Asie mineure et en Europe.

Recherchons sur un site ressource sur le domaine en s’aidant par la même occasion d’un moteur . Voir ainsi dans celui-ci un outil permettant de trouver un repère d’autorité informationnelle sur le Web (musée, association, organisme…).

Page 43: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

43

La communauté éducative comme ressource pédagogique

Un constat : difficulté de contextualiser une demande sur un moteur + difficulté de trouver une document par niveau pour faire une séquence.

La communauté peut servir d’outil pour trouver l’information pertinente : c’est le principe de la navigation sociale (via une « communauté de pratique »). Par recommandation des pairs ou de personnes autorisées …

Page 44: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

44

Créer une « navigation sociale »

Se tenir au courant = pratiquer une veille informationnelle.

Connaître des gisements de ressources « humaine », papier et numérique.

Page 45: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

La navigation sociale : définition

La navigation sociale sur Internet est une manière de naviguer en prenant en compte l'avis des autres.

C'est une technique relationnelle qui juge d’une information en tenant compte de sa notoriété ou de la notoriété de l'auteur qui donne l'information. Cf. Wikipedia

Appréhender les ressources numériques en ligne

45

Page 46: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

46

Pratiquer une veillehttp://www.defidoc.com/publications/dossierspecial_veille.htm

Listes de discussion (ex. : listes du CRU) Lettres de diffusion (ex. : Café pédagogique) Alertes mel (ex. : Vigilibris) Twitter (ex. de Twitter docaucentre en Infodoc) Flux RSS (ex. : Netvibes cddp37) Portails & sites ressources Annuaires professionnels (ex. : La porte des Lettres) Partage de signets (ex. : del.icio.us ; diigo …) Sites de communautés d’usage (ex. : Etoody) Veille (classique) : périodiques …

Page 47: Apprehender les ressources numeriques en ligne. Le biais de la navigation sociale

Appréhender les ressources numériques en ligne

47

Pour conclure (trop rapidement …)

« La nouvelle fracture numérique n'est donc pas entre ceux qui peuvent s'offrir les machines et les services et ceux qui ne le peuvent pas, mais entre ceux qui savent les utiliser à leur avantage et ceux qui sont victimes de la sur-information. Ce n'est pas un problème entre ceux qui ‘possèdent’ et les autres, mais entre ceux qui "savent" et les autres ».

Howard Rheingold