Como se dá o cálculo do pagerank do google, suas características e seu algorítmo. (parte 1)
O mecanismo mais conhecido de busca até poucos anos atrás era o Yahoo. No entanto era comum que os resultados da pesquisa não fossem suficientemente relevantes para agradar o usuário, e muitas vezes era necessário folhear as primeiras páginas até encontrar o resultado esperado.
No final da década de 90 dois estudantes, Sergey Brin and Lawrence Page, lançaram um paper sobre um novo mecanismo de pesquisa, que segundo eles, organizaria um conteúdo maior de páginas e utilizaria um sistema de pontuação das páginas(PAGERANK OU PR) para que quando fosse feita uma pesquisa, o resultado fosse o mais relevante e satisfatório possível.
Através de um paper de dois jovens pesquisadores surgiu o Google, uma personificação da palavra googol que significa o número gerado pela junção do algarismo 1 seguido por 100 zeros, um número que descreve o quão grande é a informação e a tentativa de organizá-la por um mecanismo de busca.
Eu não tenho dúvida de que o cálculo do PAGERANK seja o algorítmo mais importante desenvolvido até hoje, e eu tentei destrinchar ao máximo o paper anteriormente citado afim de explicar da melhor forma possível aspectos relacionados ao pagerank, vamos lá:
Como o PR funciona?
* PR é baseado não somente na quantidade de links de entrada(incoming) para uma página, mas também na qualidade desses links.
* Nem todos os links tem o mesmo peso;
* É melhor ter somente o seu link numa página do que vários links juntos ao seu;
* Links de entrada ruins não interferem em seu PR;
* O conteúdo não entra no cálculo do PR;
* Cada página possui um próprio PR, o PR não é o mesmo para o site todo;
* Como eu já havia dito, PR não é natural é real, apesar de expresso comumente como um número real, ele na verdade não o é;
* O cálculo do PR é baseado numa escala logarítmica e não linear, portanto é progressivamente mais difícil de alcançar;
* A base de dados sobre PR é permanentemente atualizada, só de tempos em tempos tomamos conhecimento da atualização;
* PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)). Essa é a equação para o cálculo do PR.













¬¬ ?
[]s
Filipe ~ www.sopojo.com
Sugiro que procure no google, lá tem vários…
Muito obrigado
Ou você tem dúvidas que há uma infinidades de sites ruins apontando para o próprio Google e ainda assim o Google conta com PR máximo e não tem ferramentas para contar o inbound link….
Muito esclarecedor este texto…
Apenas uma curiosidade sobre a origem do PR. Ambos fundadores do google, Brian e Page, eram acadêmicos e pertencem a famílias de acadêmicos.
Dentro da academia, uma tese (mestrado, doutorado ou qualquer outra coisa…) tem sua relevância medida pela quantidade de citações que recebe de outras teses e de publicações em revistas renomadas.
Portanto, eles adaptaram esse conceito à internet, e criaram uma fórmula que mensura a qualidade e quantidade de links que um site recebe (como já bem explicado acima).
O resto vcs já sabem…tanto no mundo acadêmico quanto no mundo da busca pela “visibilidade” de sites, há uma busca incessante por citações (ou links)….
abraços