Hjemmesider

Krydsdata på den billige

Anonim

Datasystemer er dyre, men mange virksomheder har ikke desto mindre været villige til at grave dybt og satse på, at analyser vil give ny indsigt i deres forretning og en konkurrencemæssig fordel.

I en rapport, der blev udgivet tidligere i år, forudsagde forskningsfirmaet IDC datalagringsplatformsmarkedet vil vokse fra omkring 7,9 mia. USD i 2009 til omkring 10,8 mia. dollars i 2013.

Den gode nyhed for it-butikker, der ønsker at komme i gang med analyser, men ikke har budgettet lige nu, er den seneste fremkomst af fri software muligheder, der pakker ret seriøs datakrydsende ildkraft.

I oktober offentliggjorde Greenplum en enkelt nodeudgave af sin MPP-database (massivt parallelbehandling). MPP-arkitekturer opdeler datarbejdsbelastninger i flere stykker, der administreres uafhængigt af en serie af servere.

Single Node-versionen kan bruges i produktionsmodus på en x86-server med op til to CPU-stik og ubegrænsede kerner. Det kan også implementeres i en enkelt virtuel maskine med op til otte virtuelle kerner. Der er ingen opbevaringsdæksel. Single Node Edition kan også knyttes tilbage til en bredere implementering af Greenplum.

Også i oktober udgav Calpont InfiniDB Community Edition, en open source-kolonneorienteret database. Den kolonneformede metode kan i mange tilfælde reducere disk I / O-efterspørgslen betydeligt sammenlignet med systemer, der lagrer data i rækker, og opnår også højere kompressionsniveauer, siger analytiker Curt Monash fra Monash Research.

InfiniDB Community Edition er også begrænset til en enkelt server, men har ingen cap på CPU-tæller, antallet af kerner, hukommelse, datavolumen eller samtidige brugere.

Calpont har også en kommerciel udgave af InfiniDB, nu i tidlig adopter-fase, som giver brugerne mulighed for at uddele systemet til flere servere.

InfiniDB Community Edition følger udgivelsen sidste år af en anden open-source kolonne-datalagringsplatform fra Infobright. Sidstnævnte kan have en kant for nu over InfiniDB i form af fællesskabsstøtte; Infobright sagde for nylig, at softwaren er blevet downloadet mere end 15.000 gange.

Endelig har disse gratis datalagringsindstillinger deres grænser og sandsynlige brugsscenarier, ifølge Monash.

"Hvis du har en enkelt analytiker eller lille team af analytikere gør tidlige sonderende forespørgsler mod nogle terabyte data eller mindre, så vil disse produkter sandsynligvis gøre jobbet, "sagde han.

Virksomheder kan heller ikke have budgettet til at anskaffe noget andet eller kan ikke få finansiering uden at udføre et første bevis på konceptet, tilføjede Monash.

"Der er helt sikkert arbejdsbyrder, som de ikke er tilstrækkelige til, og du skal betale penge til et produkt, der vil gøre jobbet for dig," sagde han. "Men hvis du vil få mere værdi ud af dine data, kunne disse gratis produkter være et godt sted at starte."