82
Video & Speech Processing SEO Campus 2015

Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 - 19/03/2015

Embed Size (px)

Citation preview

Video & Speech ProcessingSEO Campus 2015

Intro

< Disclaimer >

Nous n’allons pas parler des techniques habituelles liées au VSEO.

Intro

Jérôme Rocheteau Yann Sauvageon

Intro

Video is BIG !

Etat de l’art

Speech Processing

Enjeux SEO

1/ Video is BIG !

VIDEO IS BIG !

Crédit Photo : https://www.flickr.com/photos/photochiel/83361761

VIDEO IS BIG !

Source : http://www.ibtimes.co.uk/future-5g-barcelonas-mobile-world-congress-1490484

ème moteur

VIDEO IS BIG !

Source : http://www.alexa.com/topsites

VIDEO IS BIG !

Source : http://www.mediametrie.fr/internet/communiques/l-audience-de-la-video-sur-internet-en-france-en-janvier-2015.php

Un usage majeur !

Consommation hebdo de vidéo online

71%

74%75%

77%78%

80%

84%85%

90%

92%

96%

Germany Japan France Australia UnitedStates

UnitedKingdom

India Canada China Spain South Korea

Source : Juin 2014 - eMarketer; TNS - http://www.emarketer.com/Article/Where-Digital-Video-Viewing-Most-Popular/1011140

80%du trafic internet mondial en 2018.

Source : Cisco – Juin 2014

Ça va s’accélerer avec le mobile !

Source : http://go.ooyala.com/rs/OOYALA/images/Ooyala-Global-Video-Index-Q4-2014.pdf

Source : http://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/white_paper_c11-520862.html

% vidéo dans la data échangée sur Mobile

50%

55%

72%

2012 2014 2019

2020

Synodiance

Source : http://www.cnet.com/news/how-5g-will-push-a-supercharged-network-to-your-phone-home-and-car/

5G

Un film de 2H téléchargé en moins de 5 sec. !

“make all information universally accessible”

Video & Audio

2/ Etat de l’art

Juillet 2008“Google Elections Video Search gadget”

Mars 2009“Google Voice”

Mars 2009“Google Voice”

Novembre 2009“Automatic Captions in YouTube”

Novembre 2012“Automatic Captions” > Français

“Automatic Captions”

AllemandAnglaisCoréen

EspagnolFrançaisItalien

JaponaisNéerlandais

PortugaisRusse

« et puis on surveille et on voit si ça se passe bien »

« Tu écris et tu suis ton script ou c'est le script qui te suit ! »

C’est loin d’être parfait.

“We know there are issues. But going back to our very long-term goal

of making every video understandable to every user, technology is the only way that we can scale”

Brad Ellis, YouTube Product ManagerStreaming Media West Conference, Nov. 2013

“Our goal in Speech Technology Research is twofold: to make speaking to your phones and

computers ubiquitous and seamless, and to help make videos on the web accessible and

searchable.”

http://research.microsoft.com/en-us/projects/mavis/

http://www.vocapia.com/

http://voxolab.com/

Des limitations !

« Tu écris et tu suis ton script ou c'est le script qui te suit ! »

Source : http://www.3playmedia.com/2009/04/23/on-accuracy-part-i/

Taux de précision

mot clé

Mots clés incorrects

> 1 sur xPrécision sur un

texte de 8 mots

Précision sur un

texte de 10 mots

50% 1 sur 2 0% 0%

67% 1 sur 3 4% 2%

75% 1 sur 4 10% 6%

85% 1 sur 7 27% 20%

90% 1 sur 10 43% 35%

95% 1 sur 20 66% 60%

99% 1 sur 100 92% 90%

3/ Speech Processing

Next Level > Le « Deep Learning »

Andrew NG

Prof StanfordResponsable du projet “Google Brain”

Depuis 2014 > Directeur scientifique pour Baidu

4/ Enjeux SEO

Aujourd’hui

Google utilise-t-il les sous-titres automatiques pour le ranking que ce

soit sur Google ou YouTube ?

NON

“YouTube’s automatic captions do not get indexed by Google because they are

so error prone.”

“The only way for your captions to be indexed is to upload them yourself.”

2 enjeux SEO

TranscriptVideo Fiable

Catégorisation SEO

Fournir un transcript fiable à 100%

Speech Processing

HumainsFiabilité

100%

0,80 € < Tarif/min < 2,5 €

Uploadez ce transcriptsur votre vidéo YouTube

HTML5 > Balise <Track>

<Video> <Track>

subtitles

Captions

descriptions

chapters

metadata

<video id="video" controls preload="metadata">

<source src="video/sintel-short.mp4" type="video/mp4"><source src="video/sintel-short.webm" type="video/webm">

<track label="English" kind="captions" srclang="en" src="captions/vtt/sintel-en.vtt" default><track label="Deutsch" kind="captions" srclang="de" src="captions/vtt/sintel-de.vtt"><track label="Español" kind="captions" srclang="es" src="captions/vtt/sintel-es.vtt">

</video>

Catégorisation SEO

Plus de 700 vidéos rubrique « Food »

“Turmeric, Cinnamon, Cayenne, Paprika”

Catégorisation SEO

Détecter les thématiques saillantes

/ les mots clés principaux

Sous catégoriser

Catégoriser à la volée (News)

Speech to Text

• Fichier Brut

Filtrage thématique

• Onthologies

• Knowledgegraph

Optimisation VSEO

• Taggageautomatique

• Deep Linking

Conclusion

“make all information universally accessible”

Video & Audio

Conclusion

Google n’indexe pas les contenus audio.

Il a un terrain de jeu sans précédent : YouTube.

Le système s’enrichie de jour en jour.

De nombreux challenges et un objectif à long terme.

Aujourd’hui, le texte reste roi. Aidez Google !

Transcript Texte, Balisage HTML5 Track, Deep Linking, Catégorisation.

Source : http://googleresearch.blogspot.fr/2014/11/a-picture-is-worth-thousand-coherent.html

MERCI !

Questions / Réponses