De nøkkelforskjell mellom RDBMS og Hadoop er det RDBMS lagrer strukturerte data mens Hadoop lagrer strukturert, halvstrukturert og ustrukturert data.
RDBMS er et databasebehandlingssystem basert på relasjonsmodellen. Hadoop er en programvare for lagring av data og kjørende applikasjoner på klynger av råvarehardware.
1. Oversikt og nøkkelforskjell
2. Hva er RDBMS
3. Hva er Hadoop
4. Side ved side-sammenligning - RDBMS vs Hadoop i tabellform
5. Sammendrag
RDBMS står for Relational Database Management System basert på relasjonsmodellen. I RDBMS brukes tabeller til å lagre data, og nøkler og indekser bidrar til å koble tabellen. Et bord er en samling av dataelementer, og de er enhetene. Den inneholder rader og kolonner. Riktene representerer en enkelt oppføring i tabellen. Kolonnene representerer attributter.
For eksempel kan salgsdatabasen ha kunde- og produkt-enheter. Kunden kan ha attributter som customer_id, navn, adresse, phone_no. Varen kan ha attributter som product_id, navn etc. Hovedtasten til kundebordet er customer_id mens primærnøkkelen til produkttabellen er product_id. Plasser product_id i kundetabellen som fremmednøkkel kobler disse to enhetene til. På samme måte er tabellene også relatert til hverandre. De gir data integritet, normalisering, og mange flere. Få av de vanlige RDBMS er MySQL, MSSQL og Oracle. De bruker SQL for å spørre.
Hadoop er et Apache open source rammeverk skrevet i Java. Det bidrar til å lagre og behandle en stor mengde data på tvers av datamaskiner via enkle programmeringsmodeller. Hadops hovedmål er å lagre og behandle Big Data, som refererer til en stor mengde komplekse data. Gjennomførelsen av Hadoop, som er kapasiteten til å behandle et volum av data innen en bestemt tidsperiode, er høy.
Det finnes fire moduler i Hadoop-arkitekturen. De er Hadoop Common, Yarn, Hadoop Distributed File System (HDFS) og Hadoop MapReduce. Den vanlige modulen inneholder Java-biblioteker og verktøy. Det har også filene til å starte Hadoop. Hadoop YARN utfører jobbplanlegging og klynge ressursstyring.
Videre er Hadoop Distributed File System (HDFS) Hadoop-lagringssystemet. Den bruker master-slave-arkitekturen. Hovednoden er navnetNoden, og den administrerer metasdataene for filsystemet. Andre datamaskiner er slave noder eller DataNodes. De lagrer de faktiske dataene. På den annen side gjør Hadoop MapReduce den distribuerte beregningen. Det har algoritmer å behandle dataene. I HDFS har Master node en jobbsporing. Det kjører kartet redusere jobber på slave noder. Det er en oppgavespor for hver slave node for å fullføre databehandling og sende resultatet tilbake til hovedknutepunktet. Samlet gir Hadoop massiv lagring av data med høy prosessorkraft.
RDBMS vs Hadoop | |
RDBMS er et systemprogramvare for å lage og administrere databaser som er basert på relasjonsmodellen. | Hadoop er en samling av åpen kildekode programvare som kobler sammen mange datamaskiner for å løse problemer som involverer en stor mengde data og beregning. |
Datasort | |
RDBMS lagrer strukturerte data. | Hadoop lagrer strukturert, halvstrukturert og ustrukturert data. |
Datalagring | |
RDBMS lagrer gjennomsnittlig mengde data. | Hadoop lagrer en stor mengde data enn RDBMS. |
Hastighet | |
I RDBMS, leser er raske. | I Hadoop, leser og skriver er raske. |
skalerbarhet | |
RDBMS har vertikal skalerbarhet. | Hadoop har horisontal skalerbarhet. |
maskinvare | |
RDBMS bruker avanserte servere. | Hadoop bruker råvarehardware. |
gjennomstrømming | |
RDBMS gjennomstrømning er høyere. | Hadoop gjennomstrømning er lavere. |
Denne artikkelen diskuterte forskjellen mellom RDBMS og Hadoop. Hovedforskjellen mellom RDBMS og Hadoop er at RDBMS lagrer strukturerte data mens Hadoop lagrer strukturert, halvstrukturert og ustrukturert data.
1.Tutorials Point. "SQL RDBMS Concepts." , Tutorials Point, 8. januar 2018. Tilgjengelig her
2.Tutorials Point. "Hadoop Tutorial." , Tutorials Point, 8. januar 2018. Tilgjengelig her
1.'8552968000'by Intel Free Press (CC BY-SA 2.0) via Flickr