Hopp til innhold

Dataprodukt

Fra Wikipedia, den frie encyklopedi

Innen dataforvaltning og produktledelse er et dataprodukt en gjenbrukbar, aktiv og standardisert dataressurs som er utformet for å levere målbar verdi til brukerne, enten internt eller eksternt, ved å anvende de strenge prinsippene for produkttenkning og produktledelse.

Den består av en eller flere dataartefakter (for eksempe datasett, modeller, datakøer/pipelines) og er beriket med metadata, inkludert datastyrings-retningslinjer, regler for datakvalitet, datakontrakter, og der det er aktuelt en programvare-stykkliste for å dokumentere dets avhengigheter og komponenter. Eierskap til et dataprodukt er knyttet til et spesifikt domene eller brukstilfelle, hvilket sikrer ansvarlighet, forvaltning og kontinuerlig utvikling gjennom hele livssyklusen.

I samsvar med FAIR-prinsippene (finnbarhet, tilgjengelighet, interoperabelitet og gjenbrukbarhet, for å lette maskinlesbarhet uten menneskelig inngripen) er et dataprodukt utformet for å være oppdagbart, skalerbart, gjenbrukbart og i samsvar med både forretnings- og regulatoriske standarder, med formål om å drive innovasjon og effisiens i moderne dataøkosystemer.

I 2012 foreslo DJ Patil den første dokumenterte definisjonen, som var at et dataprodukt er et produkt som fremmer et sluttmål gjennom bruk av data.[1]

I 2019 introduserte Zhamak Dehghani datamaske med et sterkt fokus på domeneorienterte dataprodukter.[2] I 2020 konkretiserte hun datamasker rundt fire prinsipper, hvorav ett er «data som produkt» hvor hun definerer et dataprodukt som noden på masken som innkapsler tre strukturelle komponenter som kreves for dets funksjon, og gir tilgang til domenets analytiske data som et produkt.[3]

I 2024 publiserte Andrea Gioia en av de første bøkene spesifikt om dataprodukter etter at datamaske ble annonsert. I boken sin definerer Gioia konseptet «et rent dataprodukt».[4]

I 2025, under konferansen Data Day Texas kom Jean-Georges Perrin og et kollektiv av produktledere og dataingeniører sammen for å utforme den nåværende definisjonen og gjøre den tilgjengelig for offentligheten.[5] I juli 2025 ga prosjektet Bitol fra Linux Foundation ut en tidlig versjon av Open Data Product Standard (ODPS) som hadde som mål å normalisere dataprodukter.[6]

  • Dataforvaltning, alle disipliner knyttet til håndtering av data som en ressurs
  • Datakontrakt, skjema som kobler virksomhet (logisk representasjon av dataene) og teknologi (dens fysiske implementering)
  • Datateknikk, bygging av datasystemer for å samle og gjøre data brukbare
  • Modulært design, oppdeling av et system i mindre deler som uavhengig kan bygges, modifiseres, erstattes eller byttes ut med andre deler eller mellom forskjellige systemer
  • Produktledelse, håndtering av produkters livssyklus fra begrunnelse, planlegging, utvikling, verifisering, prognoser, prissetting, lansering til markedsføring

Referanser

[rediger | rediger kilde]
  1. ^ Patil, DJ (16. juli 2012). «Data Jujitsu: The Art of Turning Data into Product». O’Reilly Media (på engelsk). Besøkt 24. desember 2025. 
  2. ^ Dehghani, Zhamak. «How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh». martinfowler.com. Besøkt 24. desember 2025. 
  3. ^ Dehghani, Zhamak. «Data Mesh Principles and Logical Architecture». Besøkt 30. januar 2025. 
  4. ^ Patil, DJ. «Data Jujitsu: The Art of Turning Data into Product». O'Reilly. Besøkt 30. januar 2025. 
  5. ^ Perrin, Jean-Georges (29. januar 2025). «Defining Data Products: A Community Effort». Data Mesh Learning (på engelsk). Besøkt 24. desember 2025. 
  6. ^ «Announcing ODPS 0.9.0 – A Major Step Toward Standardizing Data Products – Bitol» (på engelsk). Besøkt 24. desember 2025.