Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
1
Google Toolbar
2
RankWhere
3
PageRank Prediction
4
urltrends
5
Nutch
6
Métricas en acción
URL Tamaño Visibilidad PageRank Popularidad
1 New York Metropolitan Museum of Art metmuseum.org 7.838 135.334 8 12,116
2 British Museum thebritishmuseum.ac.uk 707 36.278 8 39,905
3 Museum of Modern Art, New York moma.org 5.458 124.371 8 22,272
5 Natural History Museum, London nhm.ac.uk 9.652 105.365 8 35,473
6 Musee du Louvre louvre.fr 6.610 98,503 8 16,111
7 Smithsonian Institution si.edu 131,39 809,165 9 3,441
8 Guggenheim Museum guggenheim.org 457 65,537 9 45,521
14 American Museum of Natural History amnh.org 12,934 104,103 8 23,173
21 Victoria and Albert Museum vam.ac.uk 996 45,505 8 63,61
46 Philadelphia Museum of Art philamuseum.org 1.050 18,691 8 99,917
Posición y nombre de la sede
� Ejemplo (Septiembre 2002)� Búsqueda “museum” en Google� Tamaño y visibilidad según FAST (www.alltheweb.com)� Page Rank extraído del Google Toolbar� Popularidad según Alexa (www.alexa.com)
� Experimento� Búsqueda institucional
7
Popularidad
� Número de visitas� Dificil de conseguir en estudios amplios comparativos
� Posición relativa� Popularidad según AlexaAlexaAlexaAlexa www.alexa.com
� Sólo dominios� Amplia cobertura mundial� Algunos valores “absolutos” � Evolución temporal� Sesgos geográficos (+ Asia)
� SnapshotSnapshotSnapshotSnapshot snapshot.compete.com� Solo USA!!!
� Ranking.comRanking.comRanking.comRanking.com www.ranking.com� Traffic EstimateTraffic EstimateTraffic EstimateTraffic Estimate www.trafficestimate.com� Popularidad según NetcraftNetcraftNetcraftNetcraft toolbar.netcraft.com/site_report
� Sedes y variantes� Cobertura más restringida
� No comparables
8
Alexa
9
Limitaciones de Alexa
10
Desigualdades en Alexa
Posición % VISITAS
Top 3 23
Top 500 45
Número 10 5
Número 100 0,1
Número 1.000 0,06%
Número 10.000 0,02%
11
Snapshot
12
Ranking.com
13
Netcraft
14
Trabajando con enlaces
� Visibilidad� Inlinks (enlaces recibidos)
� Yahoo/MSN: linkdomain: -site:� Exalead: link: -site:
� Outlinks (enlaces emitidos)=Luminosidad� Inspectores de enlaces
� Selflinks (auto-enlaces)� Yahoo: linkdomain: +site:
� Impacto Web� Definición del WebIF
� Cálculo=Visibilidad/tamaño� Calidad
� Inspectores de enlaces
15
Terminología básica
� B has an outlink to C : ~ reference
� B has an inlink from A : ~ citation
� B has a selflink : ~ self-citation
� E and F are reciprocally linked
� A is transitively linked with H via B-D
� A has a transversal link to G : short cut
� C and D are co-linked from B,i.e. shared inlinks: co-citation
� B and E are co-linking to D,i.e. shared outlinks: bibliog.coupling
A
B
D
E G
F
H
C
co-links
16
Cibercienciometria� Desarrollo de indicadores de I+D en el Web
� Unidades
� sede institucional
� Modelos
� Indicadores
� Co-sitación, redes sociales y teoría del “small world”� Small World www.db.dk/lb/2002smallworld.pps
� Bibliometría de revistas-e y depósitos de documentos� CiteSeer citeseer.ist.psu.edu
� CiteBase citebase.eprints.org/cgi-bin/search
� Google Scholar scholar.google.com
� Arxiv arxiv.org
� Scirus www.scirus.com
� DBLP dblp.uni-trier.de
17
Indicadores Web
18
Indicadores (I)
19
Indicadores (II)
20
Indicadores (III)
21
Indicadores (IV)
22
Indicadores (V)
23
Obtención de indicadores
� Experimentos� Codificación
� Institucional� Temática (UNESCO)� Geográfica (NUTS)
� Cálculo de indicadores� Visibilidad (sitas)
� Visibilidad de los ficheros ricos� Visibilidad de artículos en depósitos� Visibilidad de revistas electrónicas
� Impacto (WebIF)� Diversidad� Co-citación
24
Indicadores combinados
� Factor de Impacto Web (WebIF)� Visibilidad (sitas)/ Tamaño páginas
� Webometrics (Academic) Rank
Ratio 1:1WR = WR = WR = WR = 2*S+1*R+1*2*S+1*R+1*2*S+1*R+1*2*S+1*R+1*ScScScSc ++++ 4*V4*V4*V4*V
� Tamaño� Páginas (motores)� Ficheros (motores)Ficheros ricos:pdf, ppt, doc, ps� ArtículosGoogle Scholar
� Visibilidad� Enlaces externos
recibidos (motores)
25
Webometrics Ranking
www.webometrics.info
26
Tamaño (número de páginas)
27
Co-citación
28
Ejemplo
29
Ejemplo (II)
30
Otros rankings
http://vcmike.blogspot.com/2006/01/ranking-colleges-using-google-and-oss.html
31
Otros rankings: G-factor
http://www.universitymetrics.com/g-factor
32
Related (I)
33
Related (II)
34
Cibermetría aplicada
� No sólo hay que publicar en la Web, sino lograr visibilidad� Lograr un gran número de visitas (audiencia real cercana a la
potencial)
� Recibir enlaces externos
� Estar presente en directorios y portales
� En el 80% de las sesiones Web se utilizan motores de búsqueda� El posicionamiento es clave para incrementar la visibilidad
� La calidad influye en la obtención de una buena posición, pero también ...
� El volumen de información
� La estructura hipertextual
� La anotación de los contenidos
35
Posicionamiento
� Medidas de presencia� Indización en directorios
� Páginas realmente indizadas por el motor/Páginas totales
� Medidas de visibilidad� Page Rank
� Prominencia por términos
� Medidas de uso y consumo� Popularidad
• Absoluta: Número de visitas
• Relativa: Ranking Alexa
� Consumo• Número de ficheros volcados
• Tiempo medio de visita
• Términos de referencia más frecuentes
36
PageRank Google
37
Visibilidad MSN Search
38
Problemas� El diseño es irrelevante e incluso puede ser
contraproducente
� Pocos contenidos indizables en la página principal
� Animaciones Flash o programas Java que impiden la navegación de los robots
� Internet invisible� Las bases de datos y muchas páginas dinámicas no son
indizadas por los motores de búsqueda
� Link quality
� Es necesario un exigente mantenimiento y actualización de los enlaces externos o internos
� Ficheros ricos
� Los ficheros documentales son prácticos para la distribución de información de valor añadido• Formatos pdf, ppt, doc, ps
39
Herramientas
Webmasters World tools.webmastersworld.org
SEO Encyclopedia www.seopedia.info
Webmasters Tools tools.devshed.com
SEO Online www.seoonline.info
PageStrength www.seomoz.org/tools/page-strength.php
Data Centers Tool www.seocritique.com/datacentertool
40
41
42
Criterios (Google)� Estructura hipertextual
� Madurez: Profundidad de las sedes
� Visibilidad: PageRank
� Vecindario: Enlaces internos y externos
� Frecuencia de aparición de los términos de búsqueda
� Posición relativa de los mismos
� Título y URL
� Metadatos
� Encabezamientos
� Etiquetas ALT y anclajes externos
� Periodicidad en la actualización
� Edad del documento (contenidos nuevos)
� Popularidad: Visitas a la página
� Aspectos locales (geográficos, lingüísticos)
43
Presencia de términos en la URL� Muy relevante
� Preferiblemente en el dominio o subdominio
� Recomendable hasta 30 caracteres
� El orden es importante
� http://mejor.bueno.xx/aceptable
� Palabras completas, no truncadas
� Términos independientes/frases (guión/guión bajo)
� Universidad-Complutense= +Universidad +Complutense
� Universidad_Complutense= “Universidad Complutense”
44
Agapea
45
Presencia de términos en el Título� Muy relevante
� Contenidos de la etiqueta <TITLE>!!!
� Palabras clave, no título
� La posición es importante: cuidar las primeras palabras
� Frase larga, sin palabras vacias (~60 caracteres)
� No repetir términos, opción bilingüe
� Identificación institucional, localización geográfica
� También considerados los contenidos en las etiquetas <Hn>
� El encabezamiento marca el título percibido <H1>
� Derivar palabras genéricas: “Hola”, “Bienvenidos”, “Página de”
a niveles inferiores <H2> ó <H3>
46
Términos en Título
47
Metaetiquetas� Han perdido peso
� Description
� Hasta 250 caracteres
� Etiqueta repetible para versiones en otros idiomas
� La posición es importante: cuidar las primeras palabras
� No repetir palabras
� Keywords
� Hasta 20 términos
� Los términos DEBEN aparecer también el texto
� Etiqueta repetible para versiones en otros idiomas
� La posición es importante: cuidar las primeras palabras
� No repetir términos
� Descripción pre-catalográfica
� Utilizar otras etiquetas: Modelo Dublin Core (15 repetibles)
48
Buscando términos
49
Generando etiquetas META
Meta Builder 2 vancouver-webpages.com/META/mk-metas.html
Meta Tags Generator www.meta-tags.us
MetaTags Generator tools.webmastersworld.org/MetatagsGenerator.php
Meta Tag Generator www.invision-graphics.com/meta-tag-generator.html
Meta Tag Generator www.submitcorner.com/Tools/Meta
DC-Dot www.ukoln.ac.uk/metadata/dcdot/
50
Palabras clave en el texto� Seleccionar correctamente
� Estudiar sinonimia, variantes, términos similares en otros idiomas
� Analizar consumo en motores
� Densidad
� Total: Hasta 25%
� Individual: Hasta 5%
� Posición
� Etiquetas de encabezamiento <Hn>
� Primeros párrafos
� Etiquetas modificadoras de fuente
� Negrita <B><strong>; Itálica <I>; Font size
� Promover la adyacencia de términos (en su caso)