Big Data – En kort innføring

BigDataDontKnowHva er Big data?

Den mest utbredte definisjonen på Big Data er data som kjennetegnes av de 3 V-ene Volume (volum), Variety (variasjon) og Velocity (hastighet).

  • Volume
    Mengden av data er stor og sterkt økende.
  • Variety
    Ulike typer av data er tilgjengelig fra en rekke forskjellige kilder. Det kan være strukturerte kilder, slik vi er vant med å tenke på data. I tillegg har vi mer eller mindre ustrukturerte data, som for eksempel tekst, lyd, video, «click streams», loggfiler, RFID-data osv.
  • Velocity
    Data er tilgjengelig raskere enn før og man ønsker gjerne å behandle dem i tilnærmet sanntid for å maksimere verdien av dataene.

I 2012 kom Gartner med denne definisjonen av Big Data:

Big Data is high-volume, high-velocity and/or high-variety information assets that demand cost-effective, innovative forms of information processing that enable enhanced insight, decision making, and process automation.

Hvorfor Big Data?

BigDataSolveProblem

Den store fordelen med Big Data er kanskje ikke nødvendigvis de store mengdene med data. Fordelen er først og fremst at man kan bearbeide store mengder data og sette sammen forskjellige typer data fra flere ulike kilder. Uten de begrensninger som finnes i tradisjonelle datavarehusløsninger, med tanke på dataene som finnes der og at disse ikke er helt ferske. Her må det legges til at Big Data ikke er noe som skal erstatte eksisterende datavarehusløsninger, men noe som kommer i tillegg til dette, gjerne med input fra datavarehuset eller at bearbeidede data legges inn i datavarehuset.

På denne måten vil man kunne få ny innsikt på områder man allerede har løsninger for. Og ikke minst vil man få innsikt på nye områder.

Hele poenget med Big Data vil være å få et bedre grunnlag for å ta beslutninger. Altså et skifte fra mer eller mindre synsing og magefølelse til faktabaserte beslutninger.

BigDataPredictiveAnalysis




Om forfatteren

Geir Hølen Fredheim

Lyst å lære mer om dette?

Del denne artikkelen