PROIECT DE PRACTICA

Bine ati venit pe blogul meu!
Acesta este primul meu blog si in acelasi timp - un proiect de practica, cu tema: MongoDB.

Hadoop

Hadoop este o implementare a unui cadru software cloud computing (a facilitatii Map/Reduce), care pemite scrierea si executarea aplicatiilor distribuite care procesează cantităti mari de date sub o licenta libera. Aplicatiile se pot executa pe sute de sisteme de calcul independente si pot prelucra petabytes (1 PB=2 la puterea 50 octeti) de informatie. 

Hadoop ofera un mediu de stocare partajat de înaltă disponibilitate si o analiză a sistemului. Înalta disponibilitate în distribuirea datelor si procesarea pe mai multe clustere (grupuri) de calculatoare se fundamentează pe detectarea si corectarea erorilor la nivel de aplicatie.

Sistemul de fisiere Hadoop, numit HDFS, este  sistem de fisiere distribuit, scalabil si portabil, scris în Java. Fiecare nod dintr-o instantă Hadoop are în mod uzual un singur nod pentru stocarea informatiei. Un cluster de noduri pentru stocarea informatiilor formează un cluster HDFS. Replicarea informatiilor pe mai multe masini gazdă conferă fiabilitate si nu necesită stocare pe discurile de la nivelul masinii de calcul gazdă.

Mai multe informatii:
wiki:    Wiki Page
Tutorial: Hadoop Tutorial






Niciun comentariu:

Trimiteți un comentariu