Hadoop este o implementare a unui cadru software cloud computing (a facilitatii Map/Reduce), care
pemite scrierea si executarea aplicatiilor distribuite care procesează
cantităti mari de date sub o licenta libera. Aplicatiile se pot executa pe sute
de sisteme de calcul independente si pot prelucra petabytes (1 PB=2 la puterea
50 octeti) de informatie.
Hadoop ofera un mediu de stocare partajat de înaltă
disponibilitate si o analiză a sistemului. Înalta disponibilitate în
distribuirea datelor si procesarea pe mai multe clustere (grupuri) de
calculatoare se fundamentează pe detectarea si corectarea erorilor la nivel de
aplicatie.
Sistemul de fisiere Hadoop, numit HDFS, este sistem de fisiere distribuit, scalabil si
portabil, scris în Java. Fiecare nod dintr-o instantă Hadoop are în mod uzual
un singur nod pentru stocarea informatiei. Un cluster de noduri pentru stocarea
informatiilor formează un cluster HDFS. Replicarea informatiilor pe mai multe
masini gazdă conferă fiabilitate si nu necesită stocare pe discurile de la
nivelul masinii de calcul gazdă.
Mai multe informatii:
wiki: Wiki Page
Niciun comentariu:
Trimiteți un comentariu