Descoperirea cunoştinţelor
/ Knowledge Discovery >> Descoperirea cunoştinţelor >> tech >> calculator >> Internet >> Noțiuni de bază despre internet >>

Modul în care Google Works

rnizarea de servicii utile -. le-a cumpărat, de asemenea, câteva companii inovatoare și integrarea acestora. Acestea includ YouTube (un site Web de video-sharing), Blogger (un serviciu weblog), Picasa (un serviciu de photo-sharing) și Jaiku (un serviciu SMS și micro-blog-ul).
Echipamente Google

Înapoi în 1998, echipamente Google a fost relativ modest. Co-fondatorii Larry Page și Sergey Brin second hand Stanford și mașini donate pentru a rula taxelor motorul de căutare Google. Echipamentul de la acea dată au inclus: Site-ul

  • servere (MHz) dual Pentium II Două 300-megahertzi cu 512 megaocteți (MO) de memorie
  • A patru procesoare F50 calculator IBM RS6000 cu 512 MB de memorie
  • A dual-procesor Sun calculator Ultra II cu 256 MB de memorie
  • Mai multe hard disk-uri (unele dintre care au fost adăpostite într-o cutie acoperită în cărămidă LEGO) variind de la 4 la 9 gigaocteți (GO) pentru un total de mai mult de 350 GB de spațiu de stocare [sursa: Google Stanford Hardware] Site-ul

    Astăzi, Google utilizează sute de mii de servere pentru a furniza servicii utilizatorilor săi. Strategia Google este de a folosi utilaje relativ ieftine care rulează pe un sistem de operare personalizat bazat pe Linux. Un program numit File System Google gestionează datele pe serverele Google. [Sursa: Google Arhitectura Cluster]

    Google utilizează servere pentru diferite sarcini. Servere de web a primi și interogări de utilizator proces, trimiterea cererii la următoarea serverul adecvat. Servere Index stoca indexurile Google și rezultatele căutării. Servere de documente pentru a stoca rezumate de căutare, informații de utilizator, Gmail și fișiere Google Docs. Servere de anunțuri stoca anunțurile Google afișează pe paginile de căutare.

    Google împarte informația de pe fiecare server indice în 64 de blocuri MB. Există trei exemplare din fiecare bloc de date, și fiecare copie este stocată pe un alt server care rulează pe o bandă de alimentare separat. Blocurile de date sunt distribuite semi-aleatoriu, astfel încât nu există două servere au exact aceeași colecție de blocuri de date. În acest fel, în cazul în care există o problemă cu un singur server, datele vor exista în continuare în alte masini. Folosind mai multe copii ale datelor pentru a preveni o întrerupere în serviciu se numește redundanță. Aflați mai multe în Cum Google fișier funcționează sistemul.

    Un calculator maestru gestionează fiecare set de servere. De l