Upload
mondeca
View
1.712
Download
0
Embed Size (px)
DESCRIPTION
apports du semantic web pour le référencement, comment le semantic web peut aider au référencement et à la visibilité de vos contenus
Citation preview
11 SMX PARIS – 6 ET 7 JUIN 2013
Web Semantique et SEO
gilles Delaporte, Mondeca
22 SMX PARIS – 6 ET 7 JUIN 2013
PRÉSENTATION
• Gilles Delaporte: Directeur Marketing et Commercial
• Plus 15 ans expérience autour de la gestion de l’information et des connaissances
• A assister à la naissance et l’émergence du Web Sémantique• L’accompagne depuis 10 ans chez Mondeca• Organisation, structuration et enrichissement des contenus
33 SMX PARIS – 6 ET 7 JUIN 2013
QUELQUES MOTS SUR LE WEB SEMANTIQUE
Un ensemble de technologies, d’outils et de standards
Pour une information plus accessible, compréhensible, partageable
Construire des solutions interopérables et automatisables
Du Web 1.0 au WEB 3.0 …. Ou de la page à la « donnée »
Data
44 SMX PARIS – 6 ET 7 JUIN 2013
STANDARDS ET POINTS IMPORTANTS
Standards portés par le W3C• OWL pour les ontologies et modèles• RDF pour la description des ressources et objets d’informations• SKOS pour la gestion de référentiels ou métadonnées• SparQL pour l’interrogation
Notions importantes:• Multilingue : Unicode• Identification unique : URI• Des Vocabulaires partagés• Des terminologies de description• Un langage proche de l’humain
Information est décomposée en: sujet , prédicat , objet
doc.html a pour auteur Fabien , doc.html a pour thème Musique
Elles forment un graphe
55 SMX PARIS – 6 ET 7 JUIN 2013
DES POSTULATS
Le savoir est ce qui me permet de rendre une donnée utile• Transforme la donnée en information et l’information en savoir
Un savoir utile devient encore plus utile s’il est partagé• Une donnée inutile ou incomplète l’est encore plus en étant partagée
Le contenu sémantique des données est plus durable que tout format, tout mode de stockage et toute application qui les utilise
Ce qui est durable:• Les sujets, les entités, les objets dont on parle
Ce qui l’est moins:• Les phrases, les morceaux de textes, certains contenus…
Le durable mérite l’investissement…
66 SMX PARIS – 6 ET 7 JUIN 2013
POUR CRÉER DE LA VALEUR AVEC LE WEB SÉMANTIQUE
1
2
3
De l’intelligence, des ressources: pour décrire, comprendre, organiser
Des outils, des traitements, de l’automatisme: • pour traiter les contenus, assister les utilisateurs
Des moyens d’exposition de la richesse des contenus • Recherche, exploration dynamique, classification, publication
77 SMX PARIS – 6 ET 7 JUIN 2013
LE LINKED OPEN DATA
Un ensemble d’initiatives, de données, de vocabulaires, de langages disponibles… mais aussi le mouvement Open data
Dublin Core
Basic Geo
88 SMX PARIS – 6 ET 7 JUIN 2013
ET POUR LE SEO?
Être visible : présent sur les moteurs de recherche en bonne place
Etre compris: améliorer le taux de transformation
Etre accessible: par différents points d’entrées , par le jeu des relations
Savoir Retenir : richesse des contenus, des services, de la personnalisation
Le Web sémantique va aider sur ces différents axes. Il va constituer un cadre pour l’intelligence métier, offrir les moyens de doper les services et de pouvoir constituer des « contenus intelligents »
99 SMX PARIS – 6 ET 7 JUIN 2013
ET DE LA METHODE
Enrichir les contenus par de la sémantique:
• Structuration et organisation
• Identification des «entités», des sujets, des «POI»
• Repérage de concept
• Mise en relation
• Agrégation
Des métadonnées, des liens, de nouveaux contenus, de l’exploration intelligente
1010 SMX PARIS – 6 ET 7 JUIN 2013
CHAINE DE TRAITEMENT
Inférence
Ajout métadonnées
Contrôle Qualite
Content Annotation
Pilotage du Workflow
linguistique référentiels
pose metadatas
Content Classification
Classification basée sur des règles métier
publication dynamique
Ontologie et référentielsAlimente les composants
Seria
lisati
on fl
ux
Rules Editor
1111 SMX PARIS – 6 ET 7 JUIN 2013
ET ENSUITE?
Vocabulaire pour les métadonnées, définit les attributs ou propriétés utilisables pour décrire une « chose »
1) Les métadonnées traduites dans le formalisme Schema.org (autres aussi)2) Ajoutées aux contenus entre des balises de type /div
➤ Pour être « comprises » et « utilisées » par les moteurs de recherche web
Conduit à améliorer l’identification du contenu Permet une meilleure exposition des résultatsAméliore le taux de transformation via les rich SnippetsDifférents tests annoncent de 15 % à 30% de plus en CTR
1212 SMX PARIS – 6 ET 7 JUIN 2013
1313 SMX PARIS – 6 ET 7 JUIN 2013
ET LA GRANDE QUESTION
Est-ce que l’utilisation de schema.org améliore le ranking!
Google dit qu’il n’utilise pas les « meta » pour son algo de ranking… mais: Le contenu est mieux identifié Une page avec dans le texte paris et dans les metas «PARIS» ne pourra faire
qu’améliorer la réponse, d’autant si le PARIS est un identifiant connu!
Aussi: It would be better to ask “will schema.org metadata help people find my
pages using Google”, to which the answer is yes (phil barker)
1414 SMX PARIS – 6 ET 7 JUIN 2013
MAIS ENCORE PLUS LOIN
RDF est un langage formel, il autorise la mise en œuvre de raisonnementsDes règles pourront être appliquées sur les contenus pour:
• Classifier automatiquement ces contenus• Compléter l’information• Poser des liens entre contenus
Exemple de règle: si doc A porte la métadonnée « ville » des « usa » et nom d’un « joueur » de basket ou d’une « équipe » de basket et le terme « basket », alors affecter la catégorie IPTC, sport, basket, NBA
La classification permet d’affecter le contenu à une catégorie, un thème, un profil client etc… utilisée pour: • la recherche à facettes ( filtrage dynamique des résultats de recherche)• La navigation dynamique dans un portail
1515 SMX PARIS – 6 ET 7 JUIN 2013
EXEMPLE
1616 SMX PARIS – 6 ET 7 JUIN 2013
EXEMPLE
1717 SMX PARIS – 6 ET 7 JUIN 2013
ET DANS UN MONDE IDEAL
La recherche sur Google ramène en tête une page « hub » sur le sujet➤ Pérenne, durable, qu’on peut garder dans ses favoris
De cette page « hub » on peut naviguer vers ➤ Une fiche descriptive style dictionnaire➤ Des dossiers pour approfondir➤ Des sujets reliés : liens vers d’autres pages « hub »➤ Des articles, des discussions sur les forums➤ Eventuellement des pages de référence hors site
De toute page on peut naviguer vers les pages « hubs » des sujets dont traite la page, les pages « hub » sont donc une cible prioritaire du SEO
Elles sont produites automatiquement à partir des métadonnées, règles et classification depuis un TripleStore
1818 SMX PARIS – 6 ET 7 JUIN 2013
PAGES HUB
Produites à partir du graphe formé par les différentes assertions généréesOrganisés autour d’index ou de taxonomies ( plans de classements)
1919 SMX PARIS – 6 ET 7 JUIN 2013
PAGE HUB OU TOPIC PAGE
By jean delahousse
2020 SMX PARIS – 6 ET 7 JUIN 2013
NYT
2121 SMX PARIS – 6 ET 7 JUIN 2013
2222 SMX PARIS – 6 ET 7 JUIN 2013
2323 SMX PARIS – 6 ET 7 JUIN 2013
2424 SMX PARIS – 6 ET 7 JUIN 2013
AUTOUR DES SUJETS, CONCEPTS ET TERMINOLOGIES
Poser des métadonnées c’est bien… mais encore faut il que celles-ci répondent aux sujets et thèmes traités, qu’elles soient réutilisables, reconnues, organisées…
La constitution d’un référentiel constitue la première opération et se poursuit tout au long de la vie des contenus et productions.
Ce référentiel va servir aux rédacteurs comme aux outils pour « traiter » et enrichir les textes.
Le processus est dit d’annotation et consiste en la pose automatique de métadonnées pour des textes en s’appuyant sur ces référentiels. Une révision peut être faite ou non…
2525 SMX PARIS – 6 ET 7 JUIN 2013
EXEMPLE TOURISME
Constitues à partir des différentes études, publications de la destination, ainsi que des blogs et des pages facebook.
"L'identité du Territoire" repose sur une écoute et une analyse fine du territoire. Il s'agit de recueillir et analyser les images et valeurs identitaires du Territoire véhiculées par les acteurs culturels et touristiques. Puis de les relier aux mots des gens, de la marque et du territoire. à partir d'un corpus fourni par la Destination et ajustée par des entretiens terrain
mots métiers sont à la fois disponibles auprès de différents producteurs de données du LOD ( thésaurus, listes autorités…) mais aussi constitués par les producteurs de contenus
2626 SMX PARIS – 6 ET 7 JUIN 2013
EXEMPLE ARLES
2727 SMX PARIS – 6 ET 7 JUIN 2013
EN RDF SUR LE LOD