Descoperirea cunoştinţelor
/ Knowledge Discovery >> Descoperirea cunoştinţelor >> tech >> calculator >> Internet >> Web Design Development >>

Cum Google Cărți Works

ameni fac tot ce pot pentru a handicapul acest proiect indraznet.
Google Book scanare și Strategie

Este de la sine înțeles că scanare milioane de cărți este o întreprindere uriașă. Provocările tehnice numai sunt semnificative. Echipament de scanare tradițională utilizează o placă de sticlă care se aplatizează complet fiecare pagină, asigurându-se că software-ul OCR (recunoaștere optică a caracterelor) este capabil să identifice literele și numerele imprimate pe paginile fiind digitizate. După scanate, aceste caractere pot fi editate și căutat cu un computer.

Pentru a elimina nevoia de plăci de sticlă și pentru a reduce posibilitatea de deteriorare a cărților pe care dorește să păstreze, Google a patentat un nou proces de scanare carte. Lucrătorii pur și simplu așezați cartea pe un scanner carte deschisă, care nu are nici o placă de sticlă, nici orice alt echipament care ar putea aplatiza o carte. Software-ul Google de avansat scanează carte si conturile pentru curbură a paginilor, adică nu există nici o degradare a de recunoaștere a caracterelor. Scannerele de lucru la o rată de aproximativ 1.000 de pagini pe ora.

Google a dezvoltat acorduri cu biblioteci mari pentru a începe proiectul. The New York Public Library, precum și bibliotecile universitare la Harvard, Michigan și Stanford, toate au fost de acord să lase Google scaneze volumele lor. Cu ajutorul acestor instituții, Google a scanat deja aproximativ 12 milioane de cărți [sursa: von Lohmann].

expansivitate proiectului înseamnă că cea mai mare promisiune sa se acordă acces la cărți pe care oamenii nu s-ar vedea altfel. Un student în Florida poate accesa o colecție nativ american special pe cealaltă parte a țării. Oamenii care nu își pot permite să călătorească pentru a vedea textele antice din Franța s-ar putea parcurge aceste volume din camerele lor de trai. Și datorită eforturilor suplimentare Google, o persoană cu deficiențe de vedere pot vizualiza cărți pe ecrane mărite, utilizarea echipamentelor Braille, sau ascultați la documente prin a citi cu voce tare tehnologie.

Inițial, Google Books planificat de a digitaliza funcționează numai în public domeniu, ceea ce a făcut cu aproximativ 20 la suta din toate cărțile [sursa: Toobin]. În Statele Unite, carti introduceți domeniul public 70 de ani după moartea autorului; ca domeniu public, acestea nu mai sunt protejate de dreptul de autor.

Cu toate acestea, în calitate de scanat Google, a început

Page [1] [2] [3] [4] [5] [6]