Komponenter

Aster Data Updates 'frontlinje' Analytisk databas

Alteryx and Teradata Unified Data Architecture - Demo

Alteryx and Teradata Unified Data Architecture - Demo
Anonim

"Traditionellt tycker vi om datalagring som en back-office-uppgift, skrev Aster VD Mayank Bawa i en blogg post tisdag. "Datalageret kan laddas i separata belastningsfönster, laster kan köras sent (nätverkseffekten är att företagsanvändare får sina rapporter sena), laster, säkerhetskopieringar och uppskalning kan ta data lagrar offline - vilket är OK sedan Dessa uppgifter kan göras på icke-öppettider (nätter / helger). "

Men Asters kunder, som inkluderar aCerno, ett Internet-annonseringsleveransnätverk," är beroende av dataanalys för sina intäkter ", säger Bawa.

Asters nCluster 3.0 sprider arbetsbelastningar över ett antal servrar och gör det enkelt att lägga till ytterligare maskiner för mer ström. Programvaran delar också upp de olika komponenterna i en dataanalys arbetsbelastning i diskreta bitar.

En "loader" -nivå behandlar dataöverföring och export till och från externa källor; ett "arbetstagarlag" lagrar data på lokalt fästa skivor för att fråga, och ett lager av "queen" noder utför intelligent sökplanering och bearbetning.

Samtidigt arbetar användare med klustret som om det var en enda enhet.

Möjligheten att selektivt skala segmenter i klustermedlet kan användare lägga till resurser I områden där de behövs mest, säger Aster.

Till dessa kärnfunktioner lägger 3.0-utgåvan ett antal funktioner för "alltid-på" -användning, inklusive möjligheten att lägga till kapacitet, balansera data och återställa data medan Systemet är live.

Aster arbetade också för att lägga parallellisering i hela systemet, enligt en tjänsteman.

"Vi vill bygga system som kan hantera 10x, 100x mer data än något annat system idag. Men det här är också mycket data för varje enskild råvareserver ", säger CTO Tasso Argyros i ett blogginlägg. "Så vi lägger mycket på FoU-insatser för att parallellisera varje enskild funktion i systemet - inte bara att fråga, men också ladda, data-export, säkerhetskopiering och uppgraderingar. Dessutom tillåter vi våra användare att välja hur mycket de vill parallellisera alla Dessa funktioner, utan att behöva skala upp hela systemet. "

Utgåvan inkluderar också stöd för MapReduce, en programmeringsteknik som ursprungligen utvecklats av Google, vilket gör det enklare för utvecklare att skriva program för att analysera stora datamängder. Asters konkurrent Greenplum meddelade också nyligen MapReduce-support.

Ytterligare funktioner inkluderar möjligheten att välja datakomprimeringsnivåer för enskilda tabeller, ett "ett klick" uppgraderingsverktyg; och bättre säkerhetsfunktioner, till exempel LDAP (Lightweight Directory Access Protocol) för autentisering och förmågan att hantera användarbehörigheter på kluster-, databas- och tabellnivåer.

Många av Asters initiala kunder, som även inkluderar MySpace, är webbfokuserade, säger Curt Monash, president för Monash Research. "En enorm del av tillväxten och möjligheten i datalagring ligger i att hantera relativt nya typer av data," sa han. "Det finns stora datalager som hanterar traditionell OLTP, transaktionsdata, men Aster är inte nödvändigtvis en ledande konkurrent för att analysera det. Den söta punkten vid analys av stora mängder data är för närvarande webbdata och tillhörande nätverkshändelser."

Monash citerade parallellbehandling och stöd för MapReduce som Asters nyckelstyrkor: "Aster är en start med en relativt omogen produkt, men de har lagt stor vikt vid hur man gör det enkelt att administrera parallell bearbetning."

NCluster 3.0 körs på standard x86-servrar. Prissättning baseras på hur mycket data som hanteras. Företaget har tidigare sagt att kostnaderna börjar på US $ 100,000.