Windows

Red Hat, Hortonworks prep OpenStack til Hadoop

Creating Hadoop 2-Node Cluster

Creating Hadoop 2-Node Cluster
Anonim

sammenlægning af verdener med store data og cloud computing redhat, hortonworks og hadoop integrator mirantis er i fællesskab opbygge en software program, kaldet Savanna, der gør det nemmere at installere Apache Hadoop på en OpenStack cloud service.

Softwaren vil "tillade Hadoop at udnytte den opskalere lagringsarkitektur, OpenStack tilbyder," siger Adrian Ionel Mirantis CEO. "Virksomhederne vil have en meget nemmere måde at implementere og bruge Hadoop på skalaen."

Mirantis lancerede projektet tidligere i måneden og donerede koden til OpenStack Foundation. OpenStack er en samling af open source-software designet til at tilbyde delte computere, lagrings- og netværkstjenester på forespørgsel. Og Apache Hadoop er en databehandlingsramme til analyse af store mængder data på tværs af flere servere i en klynge. Begge sæt af software bliver i stigende grad testet og implementeret af organisationer.

[Yderligere læsning: De bedste tv-streamingtjenester]

"Skyen giver en økonomisk billig infrastruktur, der let skaler ud. Og det er noget der er meget vigtig i Hadoop-verdenen, da mange af disse projekter spinder sig hurtigt ind i forretningsenheder, og de snakker ikke nødvendigvis med IT-folkene, "sagde Shaun Connolly, Hortonworks Vice President of Strategy. Savanna vil arbejde med enhver standard Hadoop-distribution, ikke kun Hortonworks egen distribution.

Savanna vil give en nem måde at installere en Hadoop-klynge på en OpenStack-sky. Administratorer kan angive kluster topologi, antallet af noder, krævede hardware og andre attributter. Projektet forbereder Savanna til at være et element i OpenStack-pakken, der er tilgængelig enten ved hjælp af en API (applikationsprogrammeringsinterface) eller via en GUI, der er tilgængelig for OpenStack dashboard.

Med tiden vil softwaren tilbyde ekstra funktionalitet, såsom automatisk -scaling, evnen til at planlægge, når en Hadoop-implementering kører og evnen til at styre flere Hadoop-klynger. Savanna vil også kunne omfordele ubrugt computerkraft på et OpenStack-net til Hadoop-arbejdsbyrder. Og Savanna vil tilvejebringe et integrationspunkt for Hadops-leverings- og administrationssoftware, især Apache Ambari.

Holdet forventer at have demonstrationer af softwaren klar til Hadoop-topmødet i juni.

Ud over at give et potentielt tids- Savanna er bemærkelsesværdigt, fordi det viser, hvordan virksomhederne bliver mere afhængige af open source-software. "Vi begynder at se store projekter som Hadoop og OpenStack for at integrere, fordi der er dette store drev i virksomheden for at nå frem til en samlet open source-infrastruktur," siger Ionel.

Joab Jackson dækker virksomhedssoftware og generel teknologibrud Nyheder til IDG News Service. Følg Joab på Twitter på @Joab_Jackson. Joabs e-mail-adresse er [email protected]