Star- ja Snowflake Schema
Tietovarasto on järjestelmä, jonka avulla tallennetaan ja järjestetään tietoja keskusvarastoissa, mukaan lukien tiedot muista lähteistä. Se on liiketoiminnan älykkyyden keskeinen käsite relaatiotietokantojen malleissa, joissa analyyttiset tekniikat hyödyntävät yritystietojen sisällyttämistä keskustietokantaan.
Datamuistissa käytetään kahta yleistä arkkitehtonista mallia:
- Star-järjestelmä
- Snowflake Schema
Molemmat ovat yleisiä moniulotteisia tietokantamalleja, joita käytetään suurien tietokantojen tarpeisiin vastaamiseksi analyyttisiin tarkoituksiin todellisissa datavarastoissa.
Esittelemme puolueettoman vertailun näiden kahden välillä, jotta voimme paremmin ymmärtää, mikä on parempi kuin toinen.
Mikä on Star Schema?
Se on yleisin ja laajalti hyväksytty arkkitehtoninen malli, jota käytetään datavarastojen ja datamuotojen kehittämiseen, jossa tiedot on organisoitu tosiasioihin ja mittoihin. Se on yksinkertaisin arkkitehtoninen malli, jossa yksi tosipöytään käytetään viittaamaan moniulotteisiin taulukoihin, jotka jäljittelevät tähtikuviota.
Kuten nimestä käy ilmi, kaavio muistuttaa tähtiä, jossa keskipisteessä oleva taulukko ja useita ulottuvuustauluja, jotka säteilevät siitä.
Se tunnetaan myös nimellä Star Join Schema ja se tallentaa kaikki ulottuvuuksien attribuutit yhdeksi nanomateriaalitietueeksi nopeasti navigoimaan suurista moniulotteisista datajoukkoista, jotka antavat nopeasti kyselyn vasteajat.
Mikä on Snowflake Schema?
Se on tähtikuvion laajennus lisätoiminnoilla. Toisin kuin tähtikuva, lumihiutaleiden skaalan mitat taulukot normalisoidaan useisiin samankaltaisiin taulukoihin.
Arkkitehtuurimalli edustaa taulukoiden loogista järjestelyä monimuotoisessa suhdehierarkiassa, jossa moniulotteiset taulukot normalisoidaan alimittataulukoiksi, jotka muistuttavat lumihiutaleen kaltaista mallia, joten nimeä.
Se on monimutkaisempi versio tähtikuvasta, jossa on enemmän yhteyksiä mittatiheyksien välillä, mikä merkitsee hidasta käsittelyaikaa datan hakemiseen, mikä tarkoittaa hidasta kyselyjen vasteaikaa. Se minimoi tietojen irtisanomisen, mikä puolestaan parantaa kyselyn suorituskykyä.
Ero Star- ja Snowflake Scheman välillä
Star- ja Snowflake Schema -arkkitehtuuri
Relaatiotietokannoissa tähtikuvassa on yksinkertaisin arkkitehtuurimalli, jota käytetään datavarastojen ja moniulotteisten datamuotojen kehittämiseen. Kuten nimestäkin käy ilmi, malli muistuttaa tähtiä, jonka keskipisteestä säteilevät pisteet merkitsevät sitä, että se on keskipiste ja pisteet ovat mittataulukoita. Muiden mittasuhteiden tavoin se koostuu tietoista ja mitoista. Lumihiutaleiden skeema on toisaalta monimutkaisempi arkkitehtoninen malli, joka viittaa moniulotteiseen tietokantaan, jossa on looginen taulukoiden järjestys lumihiutaleina.
Mittataulukko
Lumihiutaleiden skeema on melko samanlainen kuin tähtiskeema, paitsi että sillä voi olla enemmän kuin yksi ulottuvuustaulukoita, jotka normalisoidaan edelleen useisiin asiaan liittyviin taulukoihin, joita kutsutaan alimittataulukoiksi. Se edustaa useita suhteita, jotka jakautuvat lumihiutaleiden kuvioon. Tähtikuvassa tallennetaan kuitenkin kaikki mitatun attribuutit yhteen denormalisoiduksi mitatulokuvaksi, mikä helpottaa yksinkertaisten kyselyjen ymmärtämistä ja käsittelyä.
Star- ja Snowflake Schema -yritysmalli
Mittataulukko ei voi sisältää kaksinkertaisia rivejä relaatiotietokannan malleissa, koska se voi luoda epäselvyydet haussa. Jokaisessa taulukossa pitäisi olla sarake tai sarakkeiden yhdistelmä, jota kutsutaan ensisijaiseksi avaimeksi, joka yksilöi kaikki taulukkotiedot. Ulkopuolinen avain on sarake tai sarakeryhmä, joka muodostaa linkin kahden taulukon välille. Tähtikuvassa jokaisessa mitatuluvassa on ensisijainen avain, joka liittyy todellisen taulukon vierasavaimeen. Snowflake-skeeman liiketoimintahierarkia edustaa ensisijaisen avaimen / ulkomaisen avaimen suhde mittatiheyksien välillä.
Data Integrity Star- ja Snowflake Schema -ohjelmassa
Näiden kahden relaatiotietokannan keskeinen ero on normalisointi. Tähtikuvion mitat taulukot eivät ole normalisoituja, joten liiketoimintamalli käyttää suhteellisen enemmän tilaa mittapöydän tallentamiseen ja enemmän tilaa tarkoittaa enemmän irtisanomisia, mikä lopulta aiheuttaisi epäjohdonmukaisuutta.Lumihiutaleiden skeema puolestaan minimoi datan irtisanomisen, koska mitat taulukoita normalisoidaan, mikä merkitsee huomattavasti pienempiä irtisanomisia. Liiketoimintahierarkia ja sen mittasuhteet säilyvät referenssitason avulla, joten suhteet voidaan päivittää itsenäisesti datavarastoihin.
Kyselyn tehokkuus
Tähtikuvassa on vähemmän yhteyksiä mittapöydän ja tositepöydän välillä verrattuna lumihiutaleiden skeemaan, jossa on useita liitoksia, mikä vähentää kyselykompleksia. Koska tähtikuvassa olevat mittasuhteet yhdistetään keskitetysti tehdyllä taulukolla, sillä on selkeät liittymispolut, jotka tarkoittavat nopeita kyselyvasteen vastausaikoja ja nopea vasteaika tarkoittaa parempaa suorituskykyä. Lumihiutaleiden skeemassa on enemmän liittymiä, joten kyselyjen vasteaika on niin pitkä, mikä johtaa monimutkaisempaan kyselyyn, mikä lopulta kompromissii suorituskykyä.
Star Schema vs. Snowflake Schema: vertailukaavio
Tiivistelmä tähtien jakeista Snowflake Schema
Molemmat ovat yleisimpiä ja laajasti hyväksyttyjä arkkitehtonisia malleja, joita käytetään tietokantojen ja datamuotojen kehittämiseen. Jokaisella liiketoimintamallilla on kuitenkin reilu osa etuja ja haittoja. Vaikka tähtikuvassa on yksinkertaisin moniulotteinen malli, jota käytetään tietojen organisoimiseen tosiasioihin ja mittoihin, se on ihanteellinen datamuotojen kehittämiseen, joissa on vähemmän monimutkaisia suhteita. Snowflake-skeema on looginen esitys taulukoista moniulotteisessa tietokannassa, jossa mitat tallennetaan alimittataulukoihin. Näiden kahden tärkein ero on normalisointi. Snowflake-skeemien mitat taulukot normalisoidaan kokonaan useisiin hakutaulukkoihin, kun taas tähtiskeemassa mitat taulukot denormalisoidaan yhteen keskustietopöytään.