Indiferent de combinația exactă de piese suplimentare de informații stocate de către o căutare motor, datele vor fi codificate pentru a economisi spațiu de stocare. De exemplu, lucrarea originală Google descrie folosind 2 bytes, de 8 biți fiecare, pentru a stoca informații despre ponderare - dacă cuvântul a fost capitalizată, dimensiunea fontului, pozitia, si alte informatii pentru a ajuta în clasament lovit. Fiecare factor poate dura până 2 sau 3 biți în cadrul grupului 2-byte (8 biți = 1 octet). Ca urmare, o mare cantitate de informații pot fi stocate într-o formă foarte compact. După ce informația este compactat, este gata pentru indexarea
Un index are un singur scop:. Permite ca informațiile să fie găsit cât mai repede posibil. Există destul de multe moduri de un indice care urmează să fie construite, dar unul dintre cele mai eficiente metode este de a construi un tabel hash. În hashing, o formulă se aplică pentru a atașa o valoare numerică pentru fiecare cuvânt. Formula este conceput pentru a distribui uniform intrările peste un număr predeterminat de diviziuni. Această distribuție numerica este diferită de distribuția cuvintelor peste alfabetul, și că este cheia pentru o eficacitate tabel hash este.
În engleză, există unele litere care incep multe cuvinte, în timp ce altele încep mai. Veți găsi, de exemplu, că " " M secțiune a dicționarului este mult mai gros decât " X " secțiune. Acest lucru înseamnă că inechitatea găsirea unui cuvânt care începe cu o foarte " de popular " scrisoare ar putea lua mult mai mult decât a găsi un cuvânt care începe cu unul mai puțin populare. Hashing uniformizează diferența, și reduce timpul mediu necesar pentru a găsi o intrare. Aceasta separă de asemenea indicele de la intrarea actuale. Tabelul hash conține numărul hash, împreună cu un pointer la datele reale, care pot fi sortate în orice mod îi permite acestuia să fie stocate mai eficient. Combinația de indexare eficient și eficace de stocare face posibil pentru a obține rezultate rapid, chiar și atunci când utilizatorul creează o căutare complicat.
Construirea unei Cauta
Căutarea printr-un index presupune construirea unui utilizator o interogare și prezentarea acestuia prin motorul de căutare. Interogarea poate fi destul de simplu, un singur cuvânt la minim. . Construirea unui complex de interogare mai necesită utilizarea de operatori booleeni care vă permit să rafina și ex