Omówienie technologii
pokrótce o PageRank (cytat z :
google.com )
Oprogramowanie zastosowane w wyszukiwarce Google dokonuje serii
równoczesnych obliczeń, które zajmują zaledwie ułamek sekundy.
Tradycyjne wyszukiwarki w dużej mierze opierały swoje działanie na
liczbie wystąpień wyrazu na stronach internetowych. Google za pomocą
technologii PageRank™ bada całą strukturę linków stron internetowych i
określa, które strony są najważniejsze. Następnie dokonuje analizy
dopasowań hipertekstowych w celu stwierdzenia, które strony są istotne w
przypadku danego wyszukiwania. Łącząc ogólną ważność i trafność w
odniesieniu do zapytania, Google jest w stanie zaprezentować
najważniejsze i najpewniejsze wyniki w pierwszej kolejności.
-
Technologia PageRank:PageRank dokonuje obiektywnej
oceny ważności stron internetowych, rozwiązując równania z ponad 500
milionami zmiennych i 2 miliardami terminów. Zamiast zliczać
bezpośrednie linki, PageRank interpretuje link ze strony A do strony B
jako „głos” oddany na stronę B przez stronę A. W ten sposób PageRank
ocenia ważność strony: na podstawie liczby oddanych na nią głosów.
PageRank uwzględnia również ważność stron oddających głos, ponieważ
uznaje się, że głosy pewnych stron mają większą wartość, co zwiększa
również wartość stron, na które „głosują”. Ważne strony uzyskują wyższe
notowanie PageRank i są wyświetlane na początku listy wyników
wyszukiwania. W celu określenia ważności strony technologia Google
wykorzystuje całościowo informacyjne zasoby internetu. Ludzie nie
wpływają na wyniki wyszukiwania ani nimi nie manipulują — dlatego
użytkownicy darzą Google zaufaniem, uznając firmę za źródło obiektywnych
informacji, nieskażone sprzedażą miejsc w rankingu.
-
Analiza dopasowań hipertekstowych:wyszukiwarka Google
analizuje również zawartość stron. Zamiast jednak sczytywać po prostu
tekst na stronie (którym wydawcy mogą manipulować przy użyciu
metatagów), technologia Google analizuje pełną zawartość strony, z
uwzględnieniem czcionek, sekcji i dokładnego położenia każdego słowa.
Aby zapewnić trafne wyniki wyszukiwania, Google analizuje także
zawartość sąsiednich stron internetowych.
Cykl życia zapytania Google
Cykl życia zapytania Google jest zazwyczaj krótszy niż pół sekundy, a
obejmuje wiele różnych kroków, które muszą zostać ukończone, zanim
osoba szukająca informacji uzyska wyniki.
|
3. Wyniki wyszukiwania są zwracane użytkownikowi w ciągu ułamka sekundy. | | | 1.
Serwer internetowy wysyła zapytanie do serwerów indeksu.
Zawartość obsługiwana przez serwery indeksu jest podobna do indeksu
umieszczonego na końcu książki — zawiera ona informacje o tym, na
których stronach znajdują się słowa pasujące do zapytania. |
 | 2.
Zapytanie jest wysyłane do serwerów dokumentów, które pobierają
przechowywane dokumenty. Generowane są fragmenty opisujące każdy wynik
wyszukiwania. |  |
 |