Veți găsi mai multe definiții de date mari acolo, așa că nu este de acord în întregime pe toată lumea ceea ce este inclus, dar poate fi orice oricine ar putea fi interesat să știe că pot fi supuse analizei calculator. Și aceste seturi mari, greoaie de date necesita noi metode de a colecta, stoca, procesa și a le analiza.
Cât de mare Datele sunt analizate și folosite
de date Big trebuie să fie colectate, masat, legate împreună și interpretate pentru a fi de folos nimănui. Companii și alte entități trebuie să filtreze cantitatea mare de date disponibile pentru a ajunge la ceea ce este cel mai relevant pentru ei. Din fericire, hardware și software, care poate procesa, stoca și analiza cantități uriașe de informații devin mai ieftine și mai rapide, astfel încât lucrarea nu mai necesită supercomputere masive și prohibitiv. O parte din software-ul este din ce în ce mai ușor de utilizat, astfel încât să nu ia în mod necesar o echipa de programatori si oameni de stiinta de date pentru a ceartă datele (deși nu-l doare de a avea oameni în cunoștință care pot înțelege cerințele dumneavoastră).
Companiile profita de servicii de cloud computing, astfel încât acestea nu au nici măcar să cumpere propriile lor computere de a face tot ceea ce ronțăit datele. Centre de date, de asemenea, numit ferme de servere, pot distribui loturi de date pentru prelucrarea pe mai multe servere, iar numărul de servere pot fi scalate în sus sau în jos repede după cum este necesar. Acest calcul scalabilă distribuit este realizată folosind instrumente inovatoare cum ar fi Apache Hadoop, MapReduce și procesare intens paralel (MPP). Baze de date NoSQL au fost dezvoltate ca mai ușor scalabilă alternative la sistemele tradiționale de baze de date bazate pe SQL.
O mare parte din această prelucrare a datelor de mare și de analiză are ca scop găsirea de modele si corelații care să ofere perspective care pot fi exploatate sau utilizate pentru a face decizii. Întreprinderile pot al meu acum cantități masive de date pentru informații despre obiceiurile de consum, popularitatea produselor lor "sau modalități mai eficiente de a face afaceri. Google Analytics de date de mare poate fi utilizat pentru a viza anunțuri relevante, produse si servicii la c