Komponenter

Aster Data Updates 'frontlinie' Analytisk database

Introducing FindTime

Introducing FindTime
Anonim

Start Aster Data Systems udgivet 3.0 versionen af ​​sin nCluster analytiske database på tirsdag, der ramte den som ideel til "frontline" datalagring.

"Traditionelt tænker vi på datalagring som en back-office-opgave," skrev Aster CEO Mayank Bawa i en blog post tirsdag. "Data warehouse kan indlæses i separate belastningsvinduer; belastninger kan køre sent (netværdien er, at erhvervsbrugere får deres rapporter for sent); belastninger, backup og opskalering kan tage data warehouses offline - hvilket er ok siden Disse opgaver kan gøres i ikke-forretningsmæssige timer (nætter / weekender). "

Men Asters kunder, der omfatter aCerno, et internetannonceringsnet," baserer sig på dataanalyse for deres indtægter ", siger Bawa.

Aster's nCluster 3.0 spredes arbejdsbyrder over en række servere og gør det nemt at tilføje ekstra maskiner til mere strøm. Softwaren opdeler også de forskellige komponenter i en dataanalyse arbejdsbyrde i diskrete stykker.

Et "loader" -niveau beskæftiger sig med dataindlæsning og eksport til og fra eksterne kilder; et "arbejdstagerlag" lagrer data på lokalt tilsluttede diske til forespørgsel; og et lag med "dronning" noder udfører intelligent forespørgselsplanlægning og behandling.

I mellemtiden arbejder brugerne med klyngen som om den var en enkelt enhed.

Muligheden for selektivt at skala segmenter i klyngen betyder, at brugerne kan tilføje ressourcer I områder, hvor de er mest brug for, siger Aster.

Til disse kernekapaciteter tilføjer 3.0-udgivelsen en række funktioner til "altid-on" -brug, herunder evnen til at tilføje kapacitet, genbalancere data og gendanne data, mens Systemet er i live.

Aster har også arbejdet for at tilføje parallelisering i hele systemet, ifølge en virksomhedets officielle.

"Vi vil bygge systemer, der kan håndtere 10x, 100x flere data end noget andet system i dag. Men det er også meget data for en enkelt råvareserver ", siger CTO Tasso Argyros i et blogindlæg. "Så vi laver en masse F & U-indsats for at parallelisere hver eneste funktion i systemet - ikke kun forespørgsel, men også indlæsning, dataeksport, backup og opgraderinger. Desuden tillader vi vores brugere at vælge, hvor meget de vil parallelisere alle disse funktioner uden at skulle opskalere hele systemet. "

Udgivelsen omfatter også support til MapReduce, en programmeringsteknik, der oprindeligt blev udviklet af Google, hvilket gør det lettere for udviklere at skrive programmer til analyse af store datasæt. Asters konkurrent Greenplum meddelte også for nylig MapReduce-support.

Yderligere funktioner omfatter muligheden for at vælge datakomprimeringsniveauer for individuelle tabeller, et "et klik" opgraderingsværktøj; og bedre sikkerhedsfunktioner, såsom LDAP (Lightweight Directory Access Protocol) til godkendelse og evnen til at administrere brugerrettigheder på klyngen, database og tabelniveauer.

Mange af Asters initialkunder, der også omfatter MySpace, er webfokuserede, siger Curt Monash, præsident for Monash Research.

"En enorm del af væksten og mulighederne i datalagring ligger i at beskæftige sig med relativt nye typer data," sagde han. "Der er store datalagre, der beskæftiger sig med traditionelle OLTP, transaktionsdata, men Aster er ikke nødvendigvis en førende konkurrent i at analysere det. Den søde plet ved analyse af store mængder data er i øjeblikket webdata og tilhørende netværksbegivenheder."

Monash citeret parallelbehandling og understøttelse af MapReduce som Aster's vigtigste styrker: "Aster er en opstart med et relativt umodent produkt, men de har lagt stor vægt på, hvordan man gør det nemt at administrere parallelbehandling."

NCluster 3,0 kører på standard x86-servere. Prissætning er baseret på, hvor meget data der administreres. Virksomheden sagde tidligere, at omkostningerne starter med US $ 100.000.