Upload
ticinformaticauff
View
220
Download
1
Embed Size (px)
Citation preview
Máquinas de busca na Internet
1. Introdução2. Conceito3. Evolução4. Tipos de Máquinas de Busca5. Como funciona?6. Google7. Relevância8. SEO9. Meta tags
10. "Burlando" os resultados11. Conclusão12. Perguntas sobre o tema13. Referências
Sumário
Com a quantidade de informação disponível hoje na Web, seria muito difícil acharmos exatamente o conteúdo que procuramos com facilidade.
Para nos auxiliar nessa tarefa, foram criadas as máquinas de busca da web.
Nesta apresentação mostraremos o que são as máquinas de busca, como evoluiram e como elas funcionam.
Introdução
● Ferramenta criada com objetivo de busca de conteúdos armazenados na Web (World Wide Web), dentro de uma rede corporativa ou de um computador pessoal
● Permite que o utilizador solicite o conteúdo a partir de um critério específico, geralmente palavras chaves, e retorna com resultados relevantes a tal critério
Conceito
● Surgiram no século XX, ● A primeira máquina de busca, chamada Archie, foi
criada para indexar arquivos na Internet● Após o Archie e a criação da Web, vários surgiram:
○ Wanderer; Veronica; WebCrawler; AltaVista (muito utilizado); Lycos; Yahoo (navegação por diretórios); Google (PageRank); Bing
● Os primeiros motores de buscas as buscas eram feitas por categorias
● Inicialmente, Os Webmasters enviavam as suas URLs para as máquinas de busca
● Não eram possíveis buscar imagens, por exemplo
Evolução
Os principais são:● Baseadas em Crawlers (ou "Spiders")
○ São totalmente automáticas○ Não possuem hierarquia○ Resultados específicos
● Diretórios○ Possuem hierarquia○ São analisados por pessoas, que organizam o
conteúdo por categorias○ Resultados genéricos
Tipos de Máquinas de busca
Baseadas em Crawlers:
1. Varrem a web
2. Indexam o conteúdo
3. Classifica o conteúdo
4. Exibe os resultados
Como funcionam?
Varrendo a Web
● Spiders/Crawlers
● Caminham entre os links
● Armazenam as páginas
Como funcionam?
Indexação
● Catálogo de páginas
● Lê/Descompacta/Análisa
● Armazena as informações importantes
Como funcionam?
Classificação do conteúdo
● Faz a ordenação de todo o conteúdo indexado pela sua relevância.
Como funcionam?
Exibição do resultados
● Lista para o usuário os resultados mais relevantes para a busca feita.
● Exibe informações como título, breve descrição e link.
Como funcionam?
Como funcionam?
(Fonte:http://evoluindonainformatica.wordpress.com/author/lanalbs/)
● Criada em 1998, por Larry Page e Sergey Brin● A maior ferramenta de busca atualmenteCaracterísticas:● Utiliza "spiders"
● Busca por imagem
● Correção ortográfica
● Google Instant○ Resultados
● Qualidade dos resultados: relevância○ Como calcular?
PAGERANK!
RelevânciaPageRank ● Criado por Sergey Brin e Larry Page
● Mede a importância da página através dos links que apontam para ela e do quão importante esses links são.
● Escala de 0 a 10.
Retirado de: http://www.mestreseo.com.br/pagerank/pagerank-alto-como-conseguir-por-que em 24/02/2013
Fórmula do PageRank
PR(A) = (1 - d) + d(PR(T1)/C(T1) +...+ PR(Tn)/C(Tn))
Relevância
Exemplo de cálculo de PR(Meu site) PR(A) = 0PR(B) = PR(C) = PR(D) = 4PR(E) = PR(F) = PR(G) = PR(H) = PR(I) =3PR(J) = PR(K) = 2
C(B) = C(C) = C(D) = 10C(E) = C(F) = C(G) = C(H) = C(I) = 8C(J) = C(K) = 9
PR(A) = (1-0.85) + 0.85*(PR(B)/C(B) + … + PR(K)/C(K))PR(A) = (1-0.85) + 0.85*( 3*4/10 + 5*3/8 + 2*2/9)PR(A) = 3.14
- Exemplo retirado do artigo "PageRank 3 na primeira atualização? Saiba como e por quê" (Frank Marcel para MestreSEO)
Relevância
Além do PageRank, o Google e as outras ferramentas de busca analisam outras coisas, por exemplo:● A quantidade que a palavra chave aparece na web
page● O local que a keyword aparece: no título, no texto, na
URL● O domínio de topo (TLD - Top Level Domain)
Relevância
Em 2011, Google fez uma grande mudança no seu algoritmo, afetando cerca de 11,8%¹ das suas buscas. Essa atualização ficou conhecida como Panda.
Devido a grande mudança nos resultados das buscas, a Google fez um questionário com 23 perguntas para ajudar os Webmasters no ranking dos seus sites
Segue algumas:
Relevância
¹ http://www.google.com/competition/howgooglesearchworks.html
"5- A ortografia e o estilo do artigo estão corretos, ou inúmeros erros persistem ? "
"21- O artigo é curto, sem substância, ou sem especificações úteis? "
"18- Este é o tipo de página que você deseja marcar, compartilhar com um amigo ou recomendar? "
4- Você chegaria a dar informações sobre o seu cartão de crédito neste site?
Relevância
Fonte: http://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-revelado
Esforço do Webmaster para melhorar a classificação do site no motor de busca.
Técnicas White Hat:São considerados assim se estão de acordo com as orientações dos Search Engines.
Técnicas Black Hat:● Cloaking● Texto escondido
SEO (Search Engine Optimization)
São códigos implementados dentro da página para auxiliar máquinas de busca● Devem ser criadas individualmente para cada página● Ficam "escondidas" para quem navega através do
navegador. Só é possível visualizar vendo o código da página
● Eram muito utilizados pelas ferramentas de busca para auxiliar os robôs
Meta tags
Exemplos de Meta tags:● Meta Description
○ Definição da página
● Meta Keywords○ Palavras chaves para descrever a página
● Meta Robots○ Comandos para os "spiders"
● Title○ Não é uma Meta tag, mas é o mais importante
■ Exemplo:<title>Climatempo - Previsão do Tempo | Meteorologia e Notícias em Tempo Real</title>
Meta tags
Lembrando que no PageRank a classificação dos resultados é feita de acordo com o número de links que apontam para a página. Porém na web podem ser criadas páginas web "falsas".
Google bombs● Uma das mais famosa é a "Miserable Failure".
Spamdexing● Usado para fins comerciais
"Burlando" os resultados
Sem os motores de busca seria muito dificil as pesquisar por conteúdo na web. A invenção destes tornou possivel encontrar um assunto específico diante desta enorme quantidade de informação. Portanto podemos dizer que estes são base para a Internet da forma que conhecemos e nos habituamos a utilizar.
Conclusão
Beatriz Valadares Cendón (2001). Ferramentas de busca na Web - http://www.scielo.br/pdf/%0D/ci/v30n1/a06v30n1.pdfSergey Brin and Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine, Stanford University, Stanford, CA, USA - http://infolab.stanford.edu/~backrub/google.htmlSEOmoz - The Begginers Guide to SEO - http://www.seomoz.org/beginners-guide-to-seoWordStream - History of Search - chttp://www.wordstream.com/articles/internet-search-engines-historyWikipedia - Web Search Engine - http://en.wikipedia.org/wiki/Web_search_engineHow Stuff Work? - http://computer.howstuffworks.com/internet/basics/search-engine.htmSearch Engine Watch - http://searchenginewatch.com/article/2065173/How-Search-Engines-WorkRed Carpet Web - http://www.redcarpetweb.com/basics9.html
https://sites.google.com/site/historiasobreossitesdebusca/
Referências
Wikipedia - Bombardeio Googlehttp://en.wikipedia.org/wiki/Google_bombWikipedia - SEOhttp://en.wikipedia.org/wiki/Search_engine_optimizationWikipedia - Camuflagemhttp://en.wikipedia.org/wiki/CloakingWikipedia - Spamdexinghttp://en.wikipedia.org/wiki/SpamdexingSearchengineland - What is SEOhttp://searchengineland.com/guide/what-is-seohttp://www.seomarketing.com.br/meta-tags-google.phphttp://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-reveladohttp://www.youtube.com/watch?feature=player_embedded&v=mTBShTwCnD4http://brasilmedia.com/Como-funciona-uma-Maquina-de-Busca.html#.USrUFzd57nghttp://www.seohoje.com/blog/como-funciona-o-algoritmo-de-busca-do-google/http://evoluindonainformatica.wordpress.com/author/lanalbs/http://support.google.com/webmasters/bin/answer.py?hl=en&answer=79812http://www.google.com/competition/howgooglesearchworks.html
Referências