Databehandling og statistisk analyse er brede felt, både knyttet til måter at data er lagret , behandlet og analysert . Selv om de to feltene er separate, forekommer betydelig overlapping mellom de to, gitt at dataene må lagres og renset før den kan bli analysert , og at en analyse av data som er nødvendig for å bestemme den mest passende måte å lagre og håndtere den. Data Management - Definisjon
data management er en prosess der data er organisert , modellert eller lagres på en slik måte som å være nyttig til en bedrift eller annen organisasjon . Dette kan innebære å sette opp systemer som data arkitekturer og prosesser som er utført på data regelmessig . Data management kan referere til statiske kilder til data , slike undersøkelsen svar, men generelt refererer til dynamiske kilder som salgsdata , som er jevnlig oppdatert med ny informasjon.
Data Management Metoder
Flere organisering metoder er tilgjengelige på data management. Data hierarkier kan være skapt av hvor dataene er strukturert - dette kalles " datamodellering . " Datavarehus refererer til å trekke data fra en rekke kilder til én depot slik at den kan analyseres . De måter som de overføres gjennom et system er ganske enkelt kalt " data bevegelse . " Når samlet i en database , "database administrering " er utført for å sikre at data er tilgjengelig, robust og sikker .
Statistisk analyse - Oversikt
Statistisk analyse brukes til å identifisere mønstre , trender, relasjoner og forskjeller i et sett med data . Ofte er det grunn til å gjøre noen data management i første omgang slik at disse analysene skal utføres . Statistiske analyser finner disse mønstrene , og bestemme sannsynligheten for at de faktisk forteller en nyttig historie motsetning til å være tilfeldig variasjon i dataene. Opplysningene som gis kan deretter brukes til å informere virksomheten eller handel beslutninger , eller for å teste hypoteser i vitenskapelige studier.
Statistiske analysemetoder
Det enorme utvalget av tilgjengelige statistiske analyser kan grupperes i to hovedkategorier - de som ser etter sammenhenger , og de som ser etter forskjeller mellom variabler. Eksempler på tidligere spenner fra enkle korrelasjoner og regresjon /flere regresjonsanalyser , opp til komplekse metoder som faktoranalyse . Eksempler på den senere inneholder t-tester og analyser av varians ( ANOVA ) . Andre metoder ser etter trender over tid , inkludert de som arbeider i tidsserieanalyse og overlevelse analyse.