Komponenter

Databasleverantörer Lägg till Googles MapReduce

Hadoop. Введение в Big Data и MapReduce

Hadoop. Введение в Big Data и MapReduce
Anonim

Greenplum och Aster Data Systems, två startups inblandade i storskaliga dataanalys, meddelade i veckan att deras produkter kommer att stödja MapReduce, en programmeringsteknik som ursprungligen utvecklats av Google för parallell behandling av stora datasatser över varuvaror.

Programutvecklare tenderar att vara mer bekväma med språk som Java och C ++ än databassspråk SQL, säger Mayank Bawa, grundare och vd för Aster, tillverkare av ett klusterdatabasystem som delar upp arbetsbelastningar i flera diskreta nivåer.

"De flesta utvecklare kämpar med nyanserna att skapa en databas som dansar bra i deras riktningar" skrev i ett blogginlägg. "Det krävs faktiskt en SQL maestro för att utföra intressanta frågor för datatransformationer (under behandling med ETL-bearbetning eller Extract-Load-Transform) eller datautvinning (under analys)."

Ange MapReduce, vars mål var att tillhandahålla en "trivialt parallelliserbara ramar så att även nybörjareutvecklare (aka praktikanter) kan skriva program på olika språk (Java / C / C ++ / Perl / Python) för att analysera data oberoende av skalan", skrev Bawa.

Under tiden Greenplum, tillverkare av en databas som det säger kan skala till en petabyte av information, sade i veckan att en MapReduce-ram kommer att vara en del av sin dataflödesmotor i september.

Tvillingsmeddelandena nekade godkännande från en nära observatör av databasen värld.

"MapReduce kan på egen hand göra mycket viktigt arbete inom datapanulation och analys. Integrering med SQL bör bara öka användbarheten och kraften", skrev Curt Monash från Monash Research på DBMS2-bloggen.

"MapReduce behövs inte för tabu tillåter datahantering. Det har effektiviserats på andra sätt på ett annat sätt, "tillade han." Men om du vill bygga icke-tabellstrukturer som textindex eller grafer, är MapReduce en stor hjälp. "