GFS reproduce bucăți pentru a se asigura că datele sunt disponibile, chiar dacă hardware-ul nu reușește. Se stochează replici pe diferite masini din diferite rafturi. În acest fel, în cazul în care un raft întreg ar eșua, datele ar exista în continuare într-un format accesibil pe o altă mașină. GFS folosește identificatorul unic bucată pentru a verifica dacă fiecare replica este valabil. În cazul în care unul dintre mânere replica nu se potrivește mânerul bucată, serverul master creează un nou replica și atribuie-l la un chunkserver.
serverul master monitorizează, de asemenea, clusterul ca întreg și periodic reechilibreaza volumul de muncă prin trecerea bucăți dintr-un chunkserver la altul. Toate chunkservers rula la capacitate aproape, dar nu la capacitate maximă. Serverul master monitorizează, de asemenea, bucăți și verifică fiecare replica este curent. Dacă o replică nu se potrivește numărul de identificare al bucată de, serverul master desemnează ca o replică vechi. Replica stătut devine gunoi. După trei zile, serverul master poate șterge o bucată de gunoi. Aceasta este o măsură de siguranță - utilizatorii pot verifica pe o bucată de gunoi înainte de a fi șterse definitiv și pentru a preveni nedorite eliminări
Pentru a evita coruperea datelor, GFS foloseste un sistem numit sume de verificare.. Sistemul sparge fiecare 64 MB bucată în blocuri de 64 kilobytes (KB). Fiecare bloc într-o bucată are propriul control pe 32 de biți, care este un fel de amprente. Serverul master monitorizează bucăți uitandu-se la sumele de control. Dacă suma de control a unei replici nu se potriveste cu control în memoria serverului master, serverul master șterge replica și creează o nouă să-l înlocuiască.
Ce fel de hardware folosește Google in GFS ei? Aflați în secțiunea următoare.
Google File System Hardware
Google spune puțin despre hardware-ul se folosește în prezent pentru a rula alte GFS decât este o colecție de off-the-shelf, servere ieftine Linux. Dar într-un raport oficial GFS, Google a dezvăluit specificațiile echipamentului folosit pentru a rula unele teste de benchmarking privind performanța GFS. În ti