Linked Data

Linked Data kan bruges at skabe sammenhæng mellem data på tværs af organisationer og systemer.

Linked Data er en række principper, der baseres på anvendelse af internetteknologier, og som muliggør entydig semantisk beskrivelse af data og både søgning efter og sammensætning af data på tværs af it-systemers og organisationers grænser. LD kan supplere arkitekturer som SOA og EDA.

Kort om Linked Data (LD)

Linked Data

  • LD gør det muligt at foretage distribuerede forespørgsler og at lade maskiner navigere på tværs af datasæt og opdage nye sammenhænge
  • LD er et mønster til at skabe indbyrdes sammenhæng mellem maskinlæsbare datasæt ved hjælp af velkendte internetteknologier – i særdeleshed ved brug af RDF og HTTP URIer
  • LD anvender RDF-standardfamilien (RDF, RDFa, RDFS og OWL) til at skabe dataudveksling og –integration, og sproget SPARQL til at foretage forespøgsler
  • LD er en relativt nem, billig og moden teknologi, der kan bygges oven på eksisterende løsninger
  • LD kan f.eks. give værdi i relation til effektiv sagsbehandling og kontrol og rummer tillige vækstpotentialer 

Linked Data principperne

At tilbyde et fælles (universelt) API for data er bedre og mere praktisk anvendeligt end mange adskilte og forskelligartede APIer publiseret af individuelle leverandører.

Tim Berners-Lee, initiativtager til Linked Data-projektet, foreslog følgende fire principper som Linked Data er baseret på:

  1. Brug URIer til at navngive ting;
  2. Brug HTTP URIer så ting kan henvises til og ‘slås op’ af mennesker og maskiner;
  3. Når nogen slår en URI op, giv anvendelig information ved at bruge de åbne web-standarder som RDF og SPARQL.;
  4. Inkluder links til andre relaterede ting ved at bruge disses URIer, så flere ting kan opdages.

Linked Data-arkitektur

Linked Data-arkitekturen baseres på to søjler:

  • REST som kommunikationsmetode mellem it-systemer.
  • RDF som rammemodel der entydigt kan beskrive ressourcer og deres indbyrdes relationer.

Som et tredje element suppleres arkitekturen af søge- og opdateringssprog SPARQL.

Linked Data er med andre ord en standard rammemodel og metode der muliggør:

  • Data der er selvbeskrivende (for maskiner og personer).
  • Beskrivelse af sammenhæng mellem data fra adskilte og forskelligartede datakilder.
  • En ensartet måde at søge efter og hente data uafhængigt af de datakildernes forskelligartethed.
  • En bred vifte af mulige formater til repræsentation af data.

Mulige implementeringsmetoder

Brugen af Linked Data-arkitekturen kan implementeres så den respekterer de it-relaterede investeringer der er foretaget gennem årene ved at bruge løsninger der ikke påtvinger organisationer et radikalt teknologisk skifte af underliggende systemer.

Linked Data-principperne kan dermed anvendes til at udvide og løfte eksisterende systemer parallelt med at disse forsat anvender de hidtil anvendte protokoller og dataformater hvis det ønskes. Derfor vil det i langt de fleste tilfælde være muligt at foretage de teknologiske forbedringer som en trinvis proces der sikrer tid til koordinering af organisatoriske processer, ressourcer og økonomi.

Linked Data skaber semantisk integration

Semantisk integration er forudsætningen for at opnå fleksible og dynamiske integrationsmuligheder mellem data, der er skabt indbyrdes uafhængigt og placeret i forskellige systemer.

Semantisk integration inkluderer:

  • Standardiserede grænseflader mod informationskilder til at hente og/eller opdatere informationer og data gennem.
  • Standardiserede grænseflader der giver mulighed for at foretage søgninger, forespørgsler og analyser mod alle tilgængelige it-systemer på en gang.
  • Standardbaseret ramme for sammenhængende ressourcebeskrivelse.
  • En enkel, men udtryksfuld logik (beskrivelseslogik) der kan anvendes til at drage slutninger/konklusioner ud fra eksisterende data og – som resultat af disse slutninger - at danne nye data og dermed ny information.

Semantisk integration gør det muligt at gå væk fra foruddefinerede punkt-til-punkt-integration og –udveksling, og gå hen imod at kunne håndtere den ikke-forudsete anvendelse, hvor brugere og applikationer kan finde og anvende data når behovet opstår.

Med anvendelse af Linked Data-principperne etableres tværorganisatorisk standardisering på integrationsniveau, for at lette anvendelse og udveksling af data.

Med Linked Data etableres der semantisk og syntaktisk entydighed på tværs af eksisterende systemer, så data kan præsenteres i både en syntaktisk korrekt form og i en semantisk forståelig form.

Implementering af Linked Data vil gøre det muligt:

  • At data fra forskelligartede kilder kan integreres fleksibelt, hurtigt og med et minimum af ressourceforbrug.
  • At organisationers brugere og it-systemer bringes frem til en situation, hvor data kan hentes og kombineres, på det tidspunkt hvor behovet opstår.
  • At foretage søgninger og datasammensætning på tværs af datakilder.
  • At ovenstående punkter i væsentligt øget omfang kan automatiseres og overlades til maskinelle processer.

Linked Data og SOA plus EDA

Linked Data er ikke et alternativ til hverken SOA eller EDA, men kan indgå i og udvide potentialet i hver af disse to arkitekturprincipper.

Permanent URL til denne artikel: http://arkitekturguiden.digitaliser.dk/node/805