Big data er defineret som indsamling, opbevaring, analyse, processering og tolkning af store mængder af data. Begrebet giver derfor god mening i kvægsektoren, som har en lang tradition for at opsamle og systematisere data på enkeltdyr – herunder data, som understøtter arbejdet med sundhed og velfærd.
Den næste fase i brugen af kvægbedriftens mange data er opbygning af kunstig intelligens, som integrerer data fra forskellige kilder ved brug af avanceret statistik og maskinlæring.
Samkøring af data kan afdække mønstre i data, som den menneskelige hjerne ikke kan se. På den måde giver big data helt nye data til overblik og beslutningsstøtte (Carbrera et al., 2020 og Anonym 2021).
Nye teknologier og sensorer betyder samtidig, at nye data dukker op – og den løbende strøm og hastighed bliver fortsat øget.
Ifølge Cabrera et al. (2019) sker udviklingen faktisk så stærkt, at hverken mælkeproducenter eller rådgivere får høstet den fulde fordel af de mange nye datastrømme.
Dyrlægen får en ny rolle
I lystet af udviklingen omkring big data har en forskergruppe fra universitetet i Nottingham (Hudson et al., 2018) givet deres vurdering af den praktiserende dyrlæges nye rolle på kvægbedrifter, som investerer i systemer til opsamling og samkøring af data.
Artiklen tager udgangspunkt i, at dyrlægens arbejde fortsat ændrer sig fra at være behandler til også at være rådgiver om sundhedsindsatser baseret på bedriftens data.
De engelske forskere peger derfor på, at det er vigtigt for dyrlægen at være offensiv og at indbygge de nye databaserede muligheder i forretningsmodellerne. Det gælder også i den løbende markedsføring af sundhedsrådgivning til kvægbesætninger Omkring big data og de mange nye datakilder opstår der således tit udfordringer på bedrifterne.
En af udfordringerne er, at det tit er svært for mælkeproducenten at beregne en samlet cost-benefit på en investering i udstyr, som bidrager med data til overvågning og beslutningsstøtte vedrørende sundhed.
Det kunne være en investering i bedre sengebåse versus en investering i teknologi, som kan finde halte køer.
Der udvikles mere teknologi til opsamling af data end økonomiske beregninger kan retfærdiggøre en investering i. Data kan have høj og sikker kvalitet. Men at man kan måle noget, er ikke ensbetydende med, at det netto har værdi i sundhedsarbejdet med malkekøer, skriver Hudson et al. (2018).
Vigtigt med uafhængig og faglig kompetence
Dyrlægen får derfor en rolle som uafhængig rådgiver, der kan vurdere værdien af data til det givne formål i den aktuelle besætning. Dyrlægen kan også give sparring i situationer, hvor en investering i teknologi konkurrerer med investeringer, som kan betyde bedre sundhed og velfærd på en anden måde. Det kunne være en investering i bedre sengebåse versus en investering i teknologi, som kan finde halte køer.
Videre er det ifølge Hudson et al. (2018) også oplagt, at dyrlægen har en aktiv rolle, når der foreligger nye typer af beslutningsgrundlag fra samkørte data. Det kunne være forudsigelser om sygdom – herunder mastitis, ketose, risiko for udsætning mv.
Det samme gælder, når et givet system er anskaffet på bedriften (fx drøvtygningsmålere, aktivitetsmålere og celletalsmålere), og der skal etableres en praksis, hvor data bliver brugt optimalt.
For at dyrlægen kan få en central rolle i kvalitetsvurdering af de nye beslutningsgrundlag, er det vigtigt med viden om den grundlæggende biologi bag de registreringer, som de samkørte data eller en aktuel sensor bidrager med.
Det er også vigtigt, at dyrlægen kan bidrage med generel viden om årsagssammenhænge for sygdomme. Dyrlægen kan så give en kvalificeret og faglig funderet hjælp med at tolke resultater og sætte dem ind i muligheder og sammenhænge på bedriften.
Nye datakilder
En lang række af kvægsektorens data er basis, som er knyttet til det enkelte dyr. Det gælder data for fødsel, sygdom, behandlinger, inseminering, kælvning, ydelse, mv.
De fleste malkekøer er desuden med i ydelseskontrol, og det betyder løbende data for mælkeydelse og mælkens sammensætning – herunder celletal.
Nye datakilder dukker så op i takt med en lang række sensorer, som kan registrere adfærd og fysiologiske parametre hos koen.
De fleste sensorer er ifølge Neethirajan & Kemp (2021) non-invasive og er enten placeret i stalden/malkeanlægget til at registrere på mange dyr (video, kamera, varmeudstråling, metan, ledningsevne i mælk, vægt, foderindtag mv.) – eller de er placeret direkte på den enkelte ko i øremærke, halsrem eller ben (fx aktivitet, liggetid og drøvtygning).
Hertil kommer invasive sensorer, som koen indtager, og som kan rapportere om tilstanden i vommen (bl.a. pH og temperatur).
Bewley (2021) har lavet en ikke-komplet liste over aktuelle og mulige kommende data-strømme på kvægbedriften – se boks. De mange nye muligheder bidrager til et samlet billede af big data, som ifølge Neethirajan & Kemp (2021) er karakteriseret ved fire centrale forhold: Omfang, hastighed, variation og validering.
Og det passer på mange måder til situationen i kvægsektoren, hvor omfanget af data er stort, hastigheden, hvormed de kommer, er ofte høj, variationen er rigtig stor, og behovet for validering er højt.
Modeller på vej for mastitis og ketose
Et ambitiøst eksempel på et aktuelt tiltag for at bruge big data i indsatsen mod tabsgivende sygdomme i malkekvægbesætningen er en såkaldte »Dairy Brain«, som forskere ved universitetet i Wisconsin arbejder på at udvikle (Cabrera et al., 2020). Målet er her en tidlig udpegning af køer med risiko for klinisk mastitis.
Systemet integrerer data fra ydelseskontrol (mængde, celletal, fedt og protein), management, vaccinationer, behandling og registrerede sygdomme, daglige mælkemængder, ledningsevne og flow; genetiske data for afkom og DNA-info fra testede dyr.
Modellen har fortsat ikke helt tilfredsstillende sensitivitet (andelen af syge dyr, som bliver fundet) og specificitet (modellens evne til at undgå falsk positive). En af udfordringerne er, at en justering af modellen for at få en højere sensitiviteten betyder, at specificiteten falder (Cabrera et al., 2000).
Pralle og White (2020) har arbejdet med mulighederne i at samkøre data i en model, der finder køer med ketose, og som kan understøtte management af den sygdom.