ituddannelse

  

data – information – viden

 

Det datadrevne samfund

Det officielle mål er, at samfundet skal blive mere datadrevet, men hvad vil det egentlig sige?

Danmark er kendt som et af verdens mest dataintensive. Vi er et land med tradition for at indsamle og behandle mange oplysninger om alle borgere, og fordi nummeret i Det Centrale Personregister er nøglen til et væld af offentlige registre, så kan man principielt finde og kombinere detaljerede oplysninger, fra vi bliver født og i princippet for evigt herefter.

Der er allerede godt gang i indsamlingen af endnu mere data som omfatter langt flere mennesker for at bruge det til mange ting, som ligger udenfor den enkeltes forståelse og fatteevne.

Fra morgen til aften gennemtrævles alt, hvad vi gør, for at høste data: Når telefonen bruges, der laves en opdatering på SoMe, søges information i en browser, indkøbes i supermarkedet eller simpelthen, når der tændes for strømmen i hjemmet.

Når data er elektroniske, er de nemmere at udveksle – men så også nemmere at bruge til nye formål. Og når der hele tiden støder nye formål til, så får data ofte en helt anden betydning (og effekt), end man forventede, da de blev skabt.

Data har skabt nye former for forretning, har muliggjort vigtig forskning, og selv udvekslingen af data gør mange ting nemmere for brugerne.

Det, som oprindeligt blev set som store datasæt i et lille land, er nu bare bitte små datasamlinger i et uendeligt hav af data

Visionen om det datadrevne handler først om, hvad er data, så skal der sættes grænser for hvad der tæller som information, for til sidst at nå til viden og selvfølgelig, hvad der er værd at vide.

Hvad er data?

Data er et råt faktum, oftest en objektiv og ustruktureret kendsgerning, der i sig selv ikke er meningsfuld.
Data udledes af enumereringer, målinger, observationer og registreringer og består grundlæggende af bitmønstre målt ud i bytes af forskellig længde, der dog oftest kan læses som tegn, tal, symboler eller billeder.

På laveste niveau består data af tal, bogstaver eller tegnsæt, der kan være strukturerede, tabeldata, graf, datatræ osv.

Generelt skal al data behandles eller fortolkes af et menneske eller en maskine for at give mening, hvorved sprog, ideer og tanker kan baseres på de givne data. Til trods for at data mange gange er ret enkle, så kan de være fuldstændig utilgængelige, hvis de på samme tid er uorganiserede.

Bortset herfra er forskningsbaserede eksperimenter, hvor der forsøges med at lade Deep Learning systemer traversere ubehandlede og ustrukturerede data mhp. at finde mønstre i sumpen, som intet menneske kunne have forudset

Under normale forhold vil ustrukturerede data være vanskeligt tilgængelige og en granskning heraf kan kun give meget lille udbytte – så strukturerede data ifa. ordnede, tilgængelige og informative data er fundamentet for alle it-systemer.

Selve ordet Data er flertalsformen af det latinske datum (ental), der set fra en etymologisk synsvinkel oprindeligt kommer fra “noget, som er givet”. Og i tidens løb er "data" i øvrigt blevet et flertalsord.

Egenskaber ved data:

  • Data er afgrænsede og entydige
  • Data har ikke noget specifikt formål i sig selv
  • Data består af (objektive) optegnelser og observationer
  • Data kan gemmes analogt, fx nedskrevet på papir, digitalt, fx på computere eller huskes af en person
  • Data er kvantitative, ikke kvalitative

Hvad er information?

Data alene har ingen betydning - det er informationerne, der er vigtige, så behandlet på en meningsfuld måde kan betydningen udledes ved en fortolkning.

Hvis data ligeledes behandles, struktureres eller præsenteres i en relevant sammenhæng, kan det komme til at udgøre ekstraheret information.

Således er information et sæt data, der har relevans, formål og en velkendt kontekst, der bakker op om forståelsen - og som er behandlet på en måde, der gør den meningsfuld i henhold til de stillede forventninger

Muligvis skal der forudgående ske en manipulation af rådata for at de bliver forståelige, fx ved at blive vinklet til den kontekst, de skal sættes ind i.

Når data tildeles mening som led i at opbygge information, så sker det gennem en fokusering, der eliminerer uvedkommende/ubrugelige detaljer. Det er ægte win-win, for der løber tillige værdi den anden vej, nemlig ved at bidraget til information øger pålideligheden af selve datagrundlaget.

Information er altid specifik ift. kravene og forventningerne, fordi alle irrelevante fakta og tal fjernes under den proces, hvor data transformeres til information.

Hvis data (måleenhed i bits og bytes) lægges over i enheder som tid, mængde osv. kan det udgøre støtte til beslutningstagning

  • Information kendetegnes ved nøjagtighed, fuldstændighed, relevans og tilgængelighed
  • Information løfter fakta, så de bliver til kendetegn og karakteriserer nogen eller noget
  • Information har en logisk betydning og kan forbedre læring.
  • Information bygger udelukkende på og afhænger af data.
  • Informationens værdi eller betydning afgøres ift. modtagende person, situationen og (det rigtige) tidspunkt

Hvad er viden?

Viden er bearbejdet information, der opbygges i en kombination med erfaring og allerede vundet indsigt.

Bearbejdningen er med til at styre normdannelsen og hvorledes der lukkes hhv. op eller i for nye input fra omgivelserne.

Viden oparbejdes og besiddes af hver enkelt som et resultat af evalueringen af egne individuelle oplevelser.

Viden giver handlekraft, der hjælper den enkelte eller organisationen og er på den måde det med til at aggregere know-how og forståelse - for den enkelte, for organisationen.

  • Viden er fokuseret, og indeholder alle de nødvendige data.
  • Viden er grundlag for at træffe de mest passende og korrekte beslutninger.
  • Viden er fastholdt i almindelige, letforståelige formater.
  • Viden er meningsfuld og nyttig i beslutningsprocesser.
  • Viden er forudsætningen for valide estimater, skøn og vurderinger
  • Viden reducerer usikkerhed og sikrer at alt belyses

Exempler

Exempler på data
Indsamlede data i 5 portioner

  • 4,8,12,16
  • Høns, får, køer, grise
  • vil, så, nej, ikke, det, helst, jeg
  • 165.2, 175.2, 198.3, 174.3, 169.3
  • lørdag, 1614, VEGA, 20191010, 20200404, When Saints Go Machine

Exempler på information
Kun når vi giver en kontekst eller tildeler en betydning, så bliver de indsamlede data til information.
Således bliver det hele meningsfuldt, når det afsløres at:

  • 4,8,12,16 er de første fire svar i 4-tabellen
  • Høns, får, køer, grise er en liste over landbrugsdyr
  • En stillingtagen: nej, det vil jeg så helst ikke
  • 165.2, 169.3, 174.3, 175.2, 198.3 er højderne for fem 18-årige studerende, angivet i stigende orden med én decimal og -punkt.
  • Per 10. oktober 2019 er der forsolgt 1614 billetter til koncert i VEGA med When Saints Go Machine, lørdag den 4. april 2020

Exempler på viden
Hvis informationerne anvendes til reflektion, så nås et reelt vidensniveau ved at sige, at:

  • 4, 8, 12, 16 er de første fire værdier i 4-tabellen - og 20, 24 er de næstfølgende, da algoritmen siger at 4-tabellen starter ved fire og stiger med fire ad gangen, sådan at fire går op i hele talrækken. Ligeledes starter 5-tabellen ved fem, stiger med fem, så fem går op i hvert tal i rækken.
  • En undulat er ikke et landbrugsdyr, da den dels ikke er på listen, og dels ikke indgår i kendte måltider.
  • Svar på spørgsmålet om man fortsætter på de gældende lønvilkår: "nej, det vil jeg så helst ikke"
  • Der indgår 5 målinger, som bl.a. viser, at den højeste studerende er markant højere end alle de andre, nemlig 198,3 cm - altså må man gentænke opstillingen til klassebilledet
  • P.grl.a. 1614 forsolgte billetter i VEGA, lørdag den 4. april 2020 kan der udarbejdes en salgsrapport per region og sted for When Saints Go Machine's landsdækkende turné. Denne information er grundlag for at opbygge viden om hvilke steder, der er rentable for koncert-aktivitets-sporet - eller ikke, ifald planen må omlægges

Data, information og viden

Ovenstående klarificering af de strukturelle og funktionelle forhold mellem data, information og viden er ment som et oplæg til en diskussion af de indbyrdes relationer: Data versus Information - er der et modsætningsforhold? Hvornår bliver information til viden?

Data kan initiere særlige måder at vide noget på, som kan være indsigtsfulde og medvirkende til at løse mange typer af opgaver, og hvis de data, der er indsamlet af forskeren, ikke videregives med oplysninger om den rette kontekst, så kan data miste sin betydning eller i værste fald, endda være misvisende. Som information er samme forskningsresultater nyttige og værdifulde, da den er let tilgængelig for andre forskeres brug.

Når data bliver vores kilde til viden, så er der graden af tilstrækkelighed, der definerer grænserne for, hvad vi kommer til at afdække, og for at bruge data bedre, er det vigtigt at række hen over information for at kunne vurdere, hvilken type viden, der er brug for - og hvornår.

Dermed er der brug for at udforske det arbejde, som data omhandler, at undersøge, hvordan det snit, der lægges for at vælge data, reelt forholder sig til det, der kortlægges, og endelig at forstå, hvad tolkningen af data gør ved måden, arbejdet fungerer på. Der er en tendens til at den måde en jobfunktion, der er i undersøgelsens fokus, udføres på, så efterfølgende ændrer sig – alene fordi den har været bestand for øget opmærksomhed

Der er en vis tilbøjelighed til at lade casens scope faktisk blive bestemt af de indsamlede data, så undersøgelsen kun kommer til at dreje sig om dét, som man har målinger på – uagtet om disse i både omfang og kvalitet er klart utilstrækkelige i forhold til opgaven og problemstillingen.

Nøgleforskelle

  • Data er en rå og uorganiseret kendsgerning, der kræves behandlet for at skabe noget meningsfuldt, mens information er det sæt af data, der giver mening efter behandling i henhold til det givne krav.
  • Data har ikke noget specifikt formål, mens Information har en betydning, der er tildelt ved fortolkning af data.
  • Data alene har ingen betydning, mens information i sig selv er signifikant.
  • Data afhænger aldrig af information, mens information afhænger af data.
  • Data målt i bits og bytes, mens information opgøres i meningsfulde enheder som tid, mængde osv.
  • Data kan struktureres, tabeldata, graf, datatræ, mens information er sprog, ideer og tanker baseret på de givne data.
  • Information (bør) betragtes som mere pålidelig end data.
  • Information er et sikkert afsæt for at foretage yderligere analyse.
  • Information hjælper med at udvikle ideer eller at nå konklusioner
  • Information leverer ikke nok til forudsigelser, mens viden gør forudsigelser mulig, hvis man besidder den fornødne erfaring.
  • Information er ekstraheret p.grl.a. raffinerede data, mens viden er bearbejdet, nyttig information
  • Information forbedrer overblik og repræsentation mens viden øger bevidstheden
  • Information leverer svar til spørgsmålene: hvem, hvornår, hvad eller hvor, mens viden besvarer spørgsmålene om hvorfor og hvordan.
  • Information kan let distribueres/overføres, mens videregivelse af viden kræver at modtageren har erkendt behov derfor.
  • Resultatet af information er forståelse, mens resultatet af viden er indsigt.

Overvågningsteknologi

Overvågning og overvågningsteknologi tjener mange nyttige formål i det moderne samfund og det er ikke længere forbeholdt stater eller for den sags skyld store firmaer. Det er derimod teknologi, der er til rådighed, og som bliver brugt af os alle sammen.
Vi bruger fx overvågningsteknologi til at opspore smittespredning i samfundet, så man efterfølgende kan arbejde målrettet for at inddæmme spredningen af sygdom
Der er osse gode ambitioner i at bruge teknologi til at støtte ældre medborgere, så de kan blive i eget hjem længst muligt.
Men selv om teknologien anvendes med formålet at hjælpe, så er det samtidig overvågningsteknologi.
Overvågning er et ekstremt kraftfuldt værktøj, der kan styre og adfærdsregulere dem, der bliver udsat for overvågningen – som når forældre holder øje med, hvad deres børn laver online fx på sociale medier.
Et af de helt centrale problemer ved den massive udspredning af overvågning og indsamling af data i samfundet er, at det er helt umuligt at spærre data inde. Det er gentagne eksempler på, at systemerne slet ikke er så lukkede, som de forventes at være.
Pludselig bliver medicinske sundhedsoplysninger spredt. Uddannelsesinstitutioner kommer upåagtet til at dele personfølsomme oplysninger på nettet. Fejl og proceduresvigt, som tillige omfatter de gange, hvor hackere med forskellige lokkemidler får adgang til store firmaers data-systemer.
Det er yderst svært at styre og kontrollere, hvad der sker med de indsamlede data.
Et eksempel er kameraer, som blev opsat i en boligforening, der var ramt af bandekriminalitet og bilafbrændinger. Kameraerne udløste en debat for og imod overvågning. Da det senere kom frem, at boligforeningen samtidig med overvågningen havde afsløret en lokal entreprenør, der brugte foreningens containere til at komme af med sit affald, så forstummede debatten.
Når målet for overvågningen flytter sig, så flytter den måde, vi bruger overvågningen på, sig osse. man er mere tilbageholdende med overhovedet at indsamle data, og at vi bliver bedre til at forstå, hvad data overhovedet kan bruges til.
På uddannelsesområdet er de de studerende genstand for en omfattende dataindsamling.
Det kan være brugt til at spotte behovet for tidlig indsats mhp. at mindske et frafald blandt de studerende
Data er lette at regulere. Man kan ensarte repræsentationerne, så de kan sammenlignes. De studerende bliver til et nummer i et regneark, hvor man billedligt talt klemmer dem til som små firkanter, der passer ind i cellerne i regnearket.

Men der er masser af pitfalls.
Vigtigst er måske at huske, at de indsamlede data ikke giver det fulde billede af, hvem de studerende er – indholdet af de enkelte celler er jo ikke de studerende selv, men derimod blot repræsentationer ifa digitaliserede kopier.
Samfundet kan komme langt med lovgivning, men selve forståelsen af, hvad overvågningen gør ved os, ligger et andet sted.

Customer Relationship Management

På bagkant af overvejelserne om den transformation, der foregår når data først beriges til information for dernæst at sammenstilles til viden, ligger virksomhedernes fokus på kundepleje og -fastholdelse

En vigtig drivkraft for dette er Customer Relationship Management, ofte bare nævnt som CRM, der direkte kan oversættes til kunderelationsstyring.

Et CRM-system indeholder en række data om virksomhedens kunder, der bl.a. dækker attituder omkring indkøbsmønstre, men osse demografiske oplysninger er indeholdt heri. De indsamlede data kan anvendes til analyser, som kan danne grundlag for en bedre forståelse af kundernes behov og den adfærd, der skal imødekommes.

I et globaliseret samfund, præget af stigende konkurrence, har disse systemer åbnet for, at virksomhederne kan blive mere effektive i deres salgsstrategi. Først og fremmest kan sandsynligheden for at træffe de rigtige valg øges ved at forbedre analysen af kundeadfærd, men samtidig kan CRM-systemerne medvirke til at finde flaskehalse og dermed vise retningen for at automatisere en række arbejdsprocesser.

Det gælder både integreringen af fysiske systemer, hvor robotter betjener kunder eller laver tunge løft og logiske systemer, der dels består af triviel behandling af store transaktionsmængder, dels af en blanding af kunstig intelligens og maskin- eller dyb læring

Finanssektorens dataintensivering

Den øgede dataintensivering i samfundet hænger sammen med digitaliseringen og det rejser nye problemstillinger.

Finanssektoren er i stigende grad blevet afkoblet fra offentlig styring, og pengeskabelsen er blevet privat. Kommunikationsstrukturerne er blevet tilpasset til de økonomiske fordringer, hvorved der er opstået en række knudepunkter, hvor digitale teknologier og finansmarkedet hidser hinanden op.

Automatiserede højfrekvenshandler resulterer både i kortsigtede spekulative "bull"-markeder og langvarige selvdestruktive "bear"-kriser. Langt størsteparten af alle netbaserede finanstransaktioner er ustyrlige og foregår uden brug af menneskelig dømmekraft. Inkorporerede signaler varsler så systemerne selv finder de hurtigste løsninger målt op på den ultra-korte bane. Handelsvolumen på børserne er vokset eksponentielt og værdien af finansielle transaktioner udgør mange gange verdens samlede bruttonationalprodukt.

Der tages hele tiden nye skridt: Facebook har barslet med et helt nyt betalingssystem, hvor fri handel bygger på en digital valuta, som ingen offentlige, statslige eller overstatslige instanser har eller får den ringeste indflydelse på.

Hemmelige algoritmer

The New York Times har på baggrund af dybdegående research påvist, at spilindustrien bruger meget aggressive metoder når de går efter de mest spilafhængige personer. En af historierne drejer sig om en mand, som det endelig var lykkedes at komme ud sin spilafhængighed, der nu allerede havde kostet hundredtusindvis af kroner, samt at han tillige sad med en kæmpemæssig gæld. Men samtidig med at han prøvede på at få sit liv på ret køl igen, så blev han konstant med reklamer og pop-ups påmindet om den spille-app, som han havde brugt flest penge på.
Spillefirmaet havde nemlig skaffet sig adgang til en mængde data, der udpegede ham som en særlig værdifuld kunde, der potentielt ville bruge endnu flere penge, hvis han kunne lokkes til at spille igen. Ved at kombinere oplysninger om brug af kreditkort med allerede kendte data om spillemønstre og risikovillighed, så kunne firmaet målrette deres kampagne for at få ham tilbage som kunde Ifølge The New York Times tjener spilindustrien 60 procent af sin indkomst på de 5 procent af kunderne, som har det mest ukontrollerede og problematiske forhold til spil, så ud fra et rent kommercielt perspektiv gav det god mening at få skabt kontakt igen – selv om den slags jo slet ikke burde foregå

I alt dette spiller digitale teknologier en helt central rolle, fordi de gør det muligt at indsamle data fra alle dele af vores liv og bruge algoritmer til at pege på, hvordan og hvornår vi bedst kan påvirkes til at ændre vores adfærd.

Men metoderne kan bruges i mange andre sammenhænge: De er indbygget i sociale medier, marketingfolk har længe brugt dem, og forsikringsbranchen eksperimenterer med dem. Før vi ser os om, bliver de teknikker også en naturlig del af det offentlige liv og et værktøj, som politisk kan bruges til at påvirke vores privatliv.

Det handler altså ikke blot om at blive forfulgt af irriterende annoncer, eller at folk får bekræftet deres (manglende) synspunkter i ekkokamre, men om fremtiden for vores velfærdssamfund og hele fundamentet for vores demokrati. Derfor er diskussionen om, hvilken vej vi vil gå, helt grundlæggende.

Sociale Medier

Der er faktisk ingen, der med sikkerhed ved, hvor mange tal og tegn, der florerer på nettet og sætter gang i milliarder af transaktioner hver eneste dag. De digitale netværk kan cirkulere data, så alle kan handle og udveksle med alle. Verden er blevet forvandlet til data, der er penge værd.

Digitale redskaber skaber og håndterer data på måder, som kontrollerer de fleste data på borgerne og den accelererende digitalisering har betydet, at den kritiske sans er kommet til at halse bagefter.

SoMe data håndteres og registreres via koder, der lynhurtigt aflæser og producerer (nye) handlinger i lukkede, selvforstærkende systemer. I det mindste for udenforstående, så er meget af selve indholdet komplet ligegyldigt og uden nogen som helst sandhedsværdi - det er ikkeviden, der bringes til at cirkulere og accelerere, så vedtagne kriterier for sandhed opløses.

Vi er mere eller mindre blevet ført ind i et spil, hvor vi på én gang både er producenter og forbrugere af de store net-giganters data. Ved den blotte anvendelse af de udbudte apps bidrager nærmest alle opkoblede mennesker med at sende dataspor i hænderne på de store teknologikonglomerater som Facebook, Amazon, Apple, IBM og Google.

Sådan har det ikke altid været altid. I sin begyndelse var selskaberne langt mere altruistiske og for fleres vedkommende endda heller ikke drevet af kommercielle interesser.

Men guldet lå jo bare der og ventede på at blive samlet op…

Så i dag er Google og Facebook dybt afhængige af personlige data for at kunne sælge annoncer, og i Googles tilfælde er søgemaskinens effektivitet tillige baseret på, at brugerne lader deres internetvaner nøje registrere.

Intet er gratis – for i bytte med, at vi lader Googles søgemaskine skabe orden i et kaotisk internet, så afgiver vi frivilligt vores personlige informationer til firmaernes databaser og indvilger endda i at modtage målrettede reklamer.

Det er et spørgsmål om manglende tekniske kompetencer når SoMe uhindret får lov til at penetrere privatlivets sfære - mange mennesker har ganske enkelt begrænsede evner og/eller viden til at forholde sig til de betingelser, der skal accepteres - så handlingerne i den videre fremfærd sker således uden at tænke.

Vejen ind skal være på oplyst grundlag - og vejen ud må være ligeledes være kendt

Vi har vænnet os til, at de sociale medier (tænk lige over betegnelsen én gang mere) ved stort set alt om os, og uden at vide hvor langt der rækkes ind i privatsfæren, så forventer vi bare, at der ikke gøres slemme ting med oplysningerne.

Det hører jo med til at være et lille, homogent samfund, at der er stor tillid og "man kun behøver frygte, hvis man har noget at skjule".

Den tillid er måske ikke altid velbegrundet, for hvad der startede som små firmaer, udviklet af sympatiske unge it-nørder med lige dele idealisme og innovationskraft, er i det stille ved at udvikle sig til moderne udgaver af Orwells Big Brother.

Vi må som forbrugere have kontrol over vores personlige data - og skal individuelt kunne tillade hvilke, der lagres, og hvad der må ske dem. Ligeledes skal det senere være muligt at få slettet specifikke data, når man ønsker det.

Det bør gøres klart hvad forholdet skal være mellem de data, vi rent faktisk kender til og som i stort omfang er vores private, og den enorme mængde, der ligger uden for synsfeltet, og dermed i det skjulte lægges i hænderne på disse private aktører. Der må spørges og findes svar på, hvordan det rykker ved grænserne for vores privatsfære?

Digitalisering og styring

Digitalisering og styring hænger sammen, så hvordan begrænses kontrollen og lysten til at bruge den?

De nye digitale dataværktøjer åbner for at styre arbejdet mere gennemgribende. Ønsket om at analysere arbejdsfunktioner og -situationer ved hjælp af data skaber muligheder for at optimere, effektivisere og ensrette arbejdet, samt selvfølgelig, at overvåge.

Mange virksomheder anvender elektroniske værktøjer til at registrere medarbejdernes arbejdsstillinger, rytme, mængder og pauser – alt sammen for at skabe en bedre balance mellem de forskellige arbejdssituationer og selve produktionsmaskineriet.
Et gammelt mundheld siger: "Lys på det, og det bevæger sig", så det er nok ikke overraskende, at et spin-off kan være forøget effektivitet i arbejdssituationerne.

Nogle steder udvikler det sig til skridt i retning ad målrettet at kunne belønne medarbejdere, der lever op til firmaets forventninger og målsætninger – og udpegning af dem, der ikke matcher.

Men man kan osse gå en tredie vej, som i en helt anden grad udstråler omtanke for medarbejderne, nemlig hvor man foretager registrering af medarbejderes skrivetempo, ordvalg, stemmeleje, samt hvilke internetsider, de besøger – simpelthen for at kunne analysere sig frem til at opdage tegn på stress, depression eller andre helbredsmæssige og sociale problemer i et tidligt stadium, som så kan forebygges.



 

Epilog

Nedlukningerne under corona-epidemien i 2020 og 2021 har understreget betydningen af digitale og automatiserede arbejdsgange, som har banet vejen for, at virksomhederne i udstrakt grad har kunnet opretholde aktivitetsniveauet og i nogen tilfælde har virksomhederne endda forbedret deres produktivitet.

Continue reading...

Kontakt os