Upload
gwenael-jarry
View
110
Download
1
Embed Size (px)
Citation preview
1
Google, un moteur de recherche comme les autres ?
Laurent CHERKIBrice DUTHEILGuillaume GERME
2
Introduction
Sergey Brin Larry Page
Fondateurs
3
Introduction
Google43%
Google Image
8%
MSN Search
21%
Yahoo!10%
AOL5%
Autres13%
Statistiques Google en Europe en 2004
4
Introduction
Google, un moteur comme les autres ?
5
I) Principes et idées fondatrices.I) Google, « googol »II) Google, « large-scale search engine »III) Google, efficace
II) Google, une recette originale.I) Google, architecture
I) Aspiration.II) Indexation
II) PageRankI) FonctionnementII) Limites
III) Infrastructure
III)Avenir et concurrence.I) Un marché disputéII) Les pistes de recherches
Plan
6
La mission :
Garantir à ses utilisateurs les solutions de recherche les plus confortables, les plus complètes et les plus précises
Google, « googol »
Google ?
Néologisme sur le mot googol googol = 10100
Principes et idées fondatrices
7
Google, « large-scale search engine »
• Pas d’intervention humaine• Recherche sur une base de donnée • Utilisation des algorithmes
Principes et idées fondatrices
8
Google, efficace
• Résultats de qualité.• Recherche rapide• on ne peut pas payer sa place
Principes et idées fondatrices
9
Aspiration
Web
Indexation
Barrel
L’ architecture de Google
Google, une recette originale
10
L’aspiration
But : télécharger le web
Composée de :• Crawler• « Repository »
Tache difficile et sensible
Limite : • Multiplication des pages• Le silence • Sites fantômes
Google, une recette originale
11
L’indexation
But : analyse et trie des documentsComposée de :• « Indexer »• « Sorter »• « Barrel »
Construction d’un double index« forward index »« inverted index »
Google, une recette originale
12
Le PageRank
• Qu’est ce que le PageRank ?
• le Concept, le principe de fonctionnement
• La formule.
Google, une recette originale
13
Le PageRank
Expression mathématiques
Avec comme variables :P : page P d : facteur d’absorptionPageRank(Ti) : PageRank de la page Ti C(Ti) : nombre de liens sortants de la page Ti
Google, une recette originale
14
Le PageRank
Limite : • Méthode qui devient trop connue • Ne tient pas compte de la vraie structure du web• Ne prend pas en compte d’information sémantique
Google, une recette originale
15
L’infrastructure
Cluster :
Composé de :plusieurs dizaines de milliers d’ordinateur bas de gamme
Principe : Répartition de la charge
Intérêt : Réduction des coûtsHaute tolérance de panne
Google, une recette originale
17
Moteurs spécialisés
Diversification des moyens d’accès
Recherche surl’ordinateur
Les pistes de recherche
12
31
Avenir et concurrence
18
Moteurs spécialisés
Diversification des moyens d’accès
Recherche surl’ordinateur
12
312
Avenir et concurrenceLes pistes de recherche
19
Moteurs spécialisés
Diversification des moyens d’accès
Recherche surl’ordinateur
12
3123
SMS
Avenir et concurrenceLes pistes de recherche
20
En conclusion nous pouvons maintenant répondre à la problématique posée :
Est il un moteur de recherche comme les autres ?
21
Conclusion
Laurent CHERKI - Brice DUTHEIL- Guillaume GERME