Hva om organisasjoner behandlet alle dataene sine til beslutningsstøtte? Hva ville skje hvis de brukte spesialisert programvare som tjente til presentasjon av informasjonen og analyse av den? Vi vil gi noen Data Warehouse eksempler å svare på disse spørsmålene.

Datavarehuseksempler
I første omgang er det viktig å skille mellom to termer som på grunn av forkortelsen lett kan forvirre oss, og fra begynnelsen er intensjonen at brukeren skal vite hva han kan forvente og kjenne noen grunnleggende begreper de skal gå til. å møte. Her vil vi vise uendelige eksempler som tjener slik at individet har verktøyene til å skille disse elementene.
Definisjon
Gitt forskjellen mellom de to begrepene, vil vi fortsette å definere dem formelt, siden det er en prosess som trekker ut, transformerer, konsoliderer og integrerer dataene til en organisasjon, både internt og eksternt, for å gjøre dem tilgjengelige og nyttige i beslutninger -laging.
På samme måte kan datalageret også defineres som en base med elektronisk filsysteminformasjon, som lagrer nødvendige data for informasjonsanalyse og beslutningstaking. Forskjellen er at den er forretningsorientert, integrert, tidsvarierende og ikke-flyktig.
I utgangspunktet er Data Warehousing (DWH) en prosess og Data Warehouse (DW) er en database.
funksjoner
Det er flere aspekter som kjennetegner datavarehuset som gir de nødvendige verktøyene for optimal bruk, og dermed overholder programmerte retningslinjer som genererer verktøyene for bruk på best mulig måte. Vi vil detaljere egenskapene til et datavarehus:
Forretningsorientert
Bare relevante data legges inn i datavarehuset for analyse og beslutningstaking. Det vil si at data som ikke har analytisk verdi, for eksempel romadresser, postnummer, e -postadresser, ikke blir vurdert. Men de er av variabel interesse, for eksempel type klient, geografisk beliggenhet, alder osv.
Enheter på høyt nivå administreres, for eksempel kunder, produkter, varer, områder og andre. Dataene lagres på en flerdimensjonal måte, det vil si faktisk og dimensjonstabeller.
integrert
Alle data fra heterogene kilder er konsolidert for å garantere kvaliteten og rensligheten. De viktigste datakildene er:
Etter brukertype.
-
- Operasjonelt: Det produserer en stor mengde data daglig, men i seg selv er det lite relevant for den nødvendige analysen. For eksempel produktsalg.
- Middels: Genererer data med implikasjon på kort og mellomlang sikt, basert på operasjonelle data. Et godt eksempel på dette konseptet er lagergenerering.
- Ledelsesmessig: Bruker data som følger av integrerings- og transformasjonsprosessen. På sin side genererer den ny informasjon. Det refererer i utgangspunktet til brukeren av datavarehuset.
I henhold til området eller avdelingen i organisasjonen
-
- Områder: Hver har et veldefinert ansvar. De produserer sine egne data som deles med de andre områdene.
- Underavdelinger: De er vanligvis geografiske. De gir posisjonsdata, som må inkorporeres sammen med de andre.
Ifølge kilden
-
- Intern: De genererer sine egne data, som kommer fra selskapets daglige aktiviteter.
- Eksternt: De utfyller interne data, for eksempel folketellinger og statistikk.
Variant i tid
Det gir tilgang til forskjellige versjoner av den samme situasjonen, siden nåværende data lagres sammen med historiske data, i datavarehuseksemplene.

Ikke flyktig
Det garanterer stabiliteten til informasjonen, siden dataene først kommer inn, endres de ikke. Det vil si at dataene manipuleres bare når de legges inn og når de konsulteres.
Oppsummert er hovedkvalitetene til datavarehuset:
Kvaliteter
Den håndterer data i volum, en konsekvens av akkumulering av historiske, nåværende og aggregerte data, fra forskjellige kilder.
Det plasserer hele datamengden i en enkelt sentralisert database. Strukturere dataene på en flerdimensjonal måte.
Fordeler
På grunn av sine egenskaper og kvaliteter presenterer datavarehuset følgende fordeler:
- Det reduserer minimumstiden som kreves for å samle alle relevante data om et bestemt emne.
- Tilbyr analyseverktøy.
- Mange rapporter og analyser er brukerdefinerte.
- Den lar deg direkte få tilgang til, analysere og overvåke organisasjonens indikatorer.
- Det hjelper til med å identifisere faktorene som påvirker selskapets drift.
- Det gjør det mulig å avansere og bestemme institusjonens fremtidige oppførsel.
- Brukere kan spørre data raskt og enkelt.
Kort sagt, Data Warehouse hjelper organisasjonen med å svare på viktige spørsmål for beslutningstaking. Dette oppnår konkurransedyktige fordeler som optimaliserer deres posisjon i markedet de opererer i. Noen av disse spørsmålene er:
- Hva er profilen til klientene?
- Hvordan er deres oppførsel?
- Hva er lønnsomheten til virksomheten?
- Hva er risikoen for organisasjonen?
- Hvilke tjenester og produkter bruker du, og hvordan kan du øke dem?
Bruksområde
Et datavarehus kan tilpasses enhver organisasjon, uavhengig av størrelse og kompleksitet. Dette er en konsekvens av agendaen til enhver institusjon, selskap eller organisasjon når det tas relevante beslutninger om dataene de produserer.
Søknadsrisiko
Det krever en stor investering fra organisasjonens side. Fordelene med implementeringen blir ikke sett på kort sikt, men på mellomlang og lang sikt.
Manipulering av data truer manipulering av sensitive data.
Aspekter å ta hensyn til
Som nevnt i begynnelsen er det flere aspekter som må tas i betraktning for anvendelsen av disse elementene for bruk av en server. Blant dem kan vi nevne følgende:
Søknadskostnader
Et datavarehus bærer bygg-, drifts- og støttekostnader. Byggekostnaden innebærer kostnadene for menneskelige ressurser, tid og teknologi, mens drift og vedlikehold tar hensyn til kostnadene ved utvikling, vekst og de som er forårsaket av endringer i dataenes opprinnelse.
Påvirkning på mennesker
Bruken av et datavarehus genererer alltid forventninger hos brukere, som nødvendigvis må tilegne seg nye ferdigheter. Suksessen til denne typen data avhenger av aktiv bruk og tilbakemelding fra brukere.
Virkning på forretnings- og beslutningsprosesser
Ved bruk av et datavarehus kan visse mangler i forretningsprosesser avsløres, men samtidig øker tilliten til de beslutninger som tas basert på resultatene oppnådd av den.
Arkitektur
Den generelle arkitekturen til et eksempeldatavarehus er vist i figuren ovenfor. Som vi kan se, innebærer dette systemet en rekke interaksjoner mellom komponentene. I denne forbindelse og som et sammendrag kan driften beskrives som følger:
- Dataene er hentet fra forskjellige kilder, for eksempel webtjenester, filer og andre databaser, både interne og eksterne.
- Når dataene er trukket ut, blir de integrert, transformert og renset for senere å bli lastet inn i datavarehuset.
- For å generere taktisk og strategisk informasjon, innhentes rapporter og analyser fra lasting av dataene.
- Til slutt kan brukerne konsultere og utforske rapportene og analysene som er generert.
Elements
Vi skal nå beskrive noen av elementene som kan evalueres i datavarehuset som bør vurderes.
Datavarehuskilder
Vanligvis er de resultatet av selskapets daglige aktivitet, i så fall kalles de interne kilder. Når data hentes fra for eksempel webservere, regnes disse som eksterne kilder. De er forskjellige fra hverandre, fordi de er avhengig av opprinnelse, format, funksjon, etc.
Utvinning, transformasjon og lasting
Kjent som ETL, er det prosessen som inkluderer alle oppgavene som utføres fra dataene er innhentet til de er lastet inn i datavarehuset. Disse er: ekstraksjon, manipulasjon, kontroll, integrering, datarensing, lasting og oppdatering.
Utdrag
Den inkluderer teknikker fokusert på å skaffe, fra forskjellige kilder, bare de relevante dataene og lagre dem i intern lagring. Denne typen lagring gjør at data kan manipuleres uten å gripe inn eller endre kildene eller datavarehuset med flere data, skape et ekstraksjonslag mellom lesing og lasting, lagring og administrering av metadataene som genereres i prosessen og forenkler integrering.
Ekstraksjonen er basert på brukernes behov og kravene som er definert for løsningen.
Transformation
Dette er teknikkene som er ansvarlige for å gjøre de forskjellige formatene kompatible, samt filtrere og klassifisere dataene og relaterte kilder.
Denne funksjonen er ansvarlig for å bruke alle passende kommandoer i forhold til dataene, for å markedsføre dem på en sterk og rimelig måte som er kompatibel og i samsvar med datavarehuset. I tillegg er det ansvarlig for renslighet og kvalitet på dataene.

Carga
Når det gjelder teknikkene for den første lastingen av dataene og den periodiske oppdateringen av datavarehuset.
- Den første lasten refererer til den første lasten av data som datavarehuset mottar. Vanligvis er det veldig tidkrevende på grunn av det store antallet poster som tilhører lange perioder.
- Periodisk oppdatering refererer til innsetting av små datamengder. Målet ditt er å legge til dataene i datalageret bare de dataene som er generert fra den siste oppdateringen. Det avhenger av brukerens behov og krav.
Kort sagt, gjennom prosessen med datalasting er vedlikehold av datavarehuset garantert.
Oppsummert kan det sies at ETL -prosessen utføres som følger:
- Dataene, når de er trukket ut fra de relevante kildene, blir deponert i den interne lagringen.
- Mens dataene lagres i intern lagring, er de integrert og transformert.
- Når dataene er renset, etter det forrige trinnet, blir de sendt til datavarehuset.
Rapporter
Rapportene er grafiske verktøy som lar brukeren få detaljerte rapporter om informasjonen til din bedrift. Måten å samhandle med disse rapportene er ganske enkel for brukeren, siden de er enkle å følge instruksjoner. I utgangspunktet må du velge alternativer fra en meny, med henvisning til betingelsene og spesifikasjonene for emnet som presenteres.
OLAP
Det er den kraftigste komponenten i datavarehuset, siden den inneholder den spesialiserte flerdimensjonale spørringsmotoren i systemet.
Det tillater analyse av organisasjonen fra forskjellige historiske scenarier. Den projiserer sin oppførsel og utvikling fra en flerdimensjonal visjon, det vil si ved å kombinere forskjellige perspektiver, temaer av interesse eller dimensjoner. Dette gjør at trender kan utledes ved å oppdage forhold mellom perspektiver som ville være vanskelig å finne ved første øyekast.
Data Mining
Det er først og fremst et statistisk verktøy, forutsigelser som kan gjøres. Det handler om å anta atferd, uten at det er forhåndsbestemte regler. Den genererer blant annet rapporter i form av tabeller og grafer, som fremmer beslutningstaking på en proaktiv måte. Det fungerer på grunnlag av informasjon som allerede er fullstendig behandlet.
Forskjell mellom OLAP og Data Mining
Når hovedaspektene ved OLAP og Data Minig er vurdert, kan en grunnleggende forskjell mellom dem etableres.
- Ved hjelp av OLAP blir den nåværende situasjonen i selskapet tolket, og gir raske svar som letter beslutninger.
- Data Minig forutsier situasjoner, basert på studiet av skjult kunnskap som provoserer visse typer atferd.
Følgelig håndterer begge systemene å løse forskjellige typer analytiske situasjoner.
Data Minig og dets forhold til Data Warehouse
Et Data Minig -system er en støtteteknologi for sluttbrukeren, som har som mål å trekke ut nyttig informasjon fra informasjonen i selskapenes database. Med andre ord er opprinnelsen til informasjonen som brukes av Data Minig -algoritmene vanligvis historiske data som finnes i et datavarehus.
Det må være en integrasjon mellom Data Minig -teknikker og prosessene som er involvert i datavarehuset. Det vil si at for å kunne utføre forretningsanalysen må det være enighet mellom Data Minig, Data Warehouse og OLAP -serveren.
Hver gang Data Warehouse gir nye resultater, kan selskapet bruke Data Minig på nytt for å optimalisere beslutningstaking.
Kort sagt, Data Minig og Data Warehouse er fullt kompatible verktøy. Data Warehouse gir minne og Data Minig -intelligens.
Tradisjonelle databaser vs datavarehus
Analysen av aspektene som er avslørt så langt, får oss til å forstå at et datavarehus skiller seg fra databasene som støtter daglige transaksjoner i organisasjoner. Her er de grunnleggende forskjellene
- I tradisjonelle databaser er informasjonen organisert slik at den enkelt kan hentes og oppdateres. Et datavarehus er organisert og orientert mot sluttbrukeren, som bare kan gjøre forespørsler.
- Transaksjonelle databaser tar seg av den daglige behandlingen av dataene. Data Warehouse jobber med historiske data, det vil si tilsvarende lange tidsperioder.
- Tradisjonelle databaser er tilgjengelig flere ganger i løpet av en arbeidsdag. I et datavarehus er avlesningene og forespørslene minimale, ettersom de nås sporadisk.
- Datamengden som et datavarehus administrerer er mye større enn det som administreres i tradisjonelle databaser.
- Strukturen til transaksjonsbasene er stabil. Strukturen til et datavarehus varierer i henhold til dets egen utvikling og bruk.
Deretter vil vi etablere noen Data Warehouse eksempler.
Datavarehuseksempler
Et nasjonalt selskap, dedikert til salg av rengjøringsmidler til engros og detaljhandel, som i tillegg til middels størrelse vurderes på grunn av salgsvolumet, har hovedmålet å maksimere fortjenesten. På samme måte, for å få flere kunder, vil du utvide til et nytt nivå på markedet og senere utvide produktlinjen. En av hovedpolicyene er å kontinuerlig forbedre seg for å få en bedre posisjon i forhold til konkurrentene til datavarehusprøver.
Anvendelsen av et datavarehus gir følgende fordeler for organisasjonen.
- Det lar brukerne få oversikt over virksomheten.
- Gjør driftsdata om til analytisk informasjon, fokusert på beslutningstaking.
- Generer dynamiske rapporter som forenkler analysen din.
- Det letter dannelsen av strategier for oppfyllelse av målene for organisasjonen.
- Det fordeler stabiliteten i selskapets struktur.
Et annet eksempel på et daglig datavarehus refererer til ledelsen av en utdanningsinstitusjon, som har mangler når det gjelder kommunikasjon med studentene. På samme måte mangler det et enhetlig informasjonssenter som har all informasjonen deres. Målet med institusjonen er å følge studenter i løpet av karrieren og etter eksamen, å tilby nye forslag som forbedrer prestasjonen til organisasjonen og utviklingen av studenter.
Med søknaden om et datavarehus søker vi å svare på universitetets behov. I prinsippet eliminerer duplisering av informasjon og tilstedeværelsen av feilaktige detaljer om studentene, så vel som all informasjon som generelt anses av dårlig kvalitet og som ikke er relevant. I tillegg er all informasjon integrert og danner en enhetlig oversikt over studenter som fungerer som grunnlag for riktig utvikling av institusjonens prosjekt.
Til slutt fremmes markedsføringsaktiviteter, noe som gir universitetet større nytte og hjelper veksten gjennom riktig håndtering av informasjon.
Avslutningsvis gir det i datavarehuseksempler muligheten til å vite hva som skjer i organisasjonen, hva som har skjedd, hva som kan skje og hvorfor. Du kan se artikkelen typer datavirus.



