Af Jens Winther Jensen, læge, MPH, direktør, Regionernes Kliniske Kvalitetsudviklingsprogram

Nysgerrighed er et godt redskab, hvis du vil i gang med kvalitetsudvikling: Hvordan går det egentlig med de patienter, vi behandler? Er de blevet raske? Har de komplikationer? Har de bivirkninger? Er de godt tilfredse?

Og hvornår er kvaliteten god nok? Er det ok at ligge på gennemsnittet? Eller skal der mere til? Kunne vi gøre det bedre? Hvordan gør de bedste af vores kolleger?

For at svare på disse spørgsmål er der brug for data. Det kan være data, som du selv samler ind i den kliniske hverdag, eller tal, som du kan finde i eksisterende systemer, statistikker eller databaser.

Hvor man tidligere mest styrede sundhedsvæsenet ved hjælp af økonomiske nøgletal, sengedage, DRG-takster osv., er det de senere år blevet mere almindeligt – både på afdelings- organisations- og nationalt niveau - at der er tal, som afspejler den patientnære kvalitet. Det kan fx være mortalitet, uventede hjertestop (se casen), sygehusinfektioner, tryksår, patienttilfredshed osv. I det nationale kvalitetsprogram måles fx på en række indikatorer, der afspejler kvalitet.

Det er også mere almindeligt, at der er tilgang til data, der er mere tidstro og hyppige, og at data præsenteres på en klar og visuelt overskuelig måde som fx i seriediagrammer (1), som i eksemplerne optiCAP og fødende (beskrevet senere i dette kapitel).

Når man har egne data, er det også muligt at undersøge, hvordan man ligger i forhold til andre, der arbejder med samme opgaver, såkaldt benchmarking. Benchmarking har fået en lidt negativ klang, fordi det kan bruges i kontrolsammenhæng til at udpege og måske ”udstille” enheder, som ikke ligger i toppen. Men benchmarking kan også anvendes postitivt til at undersøge, hvor højt det er muligt at nå og eventuelt at lære af dem, der ligger i toppen for selv at opnå samme høje niveau. Som kvalitetsudvikler vil man typisk ikke lade dig nøje med at ligge på gennemsnittet. Spørgsmålet er ikke, om kvaliteten er god nok til, at man undgår at komme i fedtefadet, men om kvaliteten er så god, som den overhovedet kan blive.

Et anderledes databehov

I traditionel evidensgenerende forskning, hvor formålet er at dokumentere ny viden om en behandlings effekt, er der ofte brug for randomiserede, kontrollerede undersøgelser af tilstrækkeligt store, repræsentative populationer. Ellers bliver konklusionen ikke sikker nok.

I forbedringsarbejdet er behovet for data anderledes. Her drejer det sig om, hvordan arbejdsgangene kan indrettes, så patienten med sikkerhed modtager de evidensbaserede ydelser. Altså typisk implementering af en allerede kendt behandling, hvor evidensen er beskrevet.

Går du ud og kigger på fem patienter og opdager, at der er mangler i plejen eller behandling hos tre af dem, så behøver du ikke at undersøge, om de fem patienter er repræsentative for den samlede patientpopulation. Det kan med det samme konstateres, at arbejdsprocessen ikke er robust, og at der er behov for forbedring. I stedet for at fortsætte målingerne, vil du ofte få mere ud af at studere de fem patientforløb nærmere og undersøge, hvad der gik godt, og hvad der gik skidt.

I forbedringsarbejdet er der sjældent brug for store datamængder, men til gengæld er det altafgørende, at data afspejler den aktuelle kvalitet, og at udviklingen kan følges over tid, som monitorering af forbedringsarbejdets effekt. Det interessante er niveauet: er vi tilfredse med den ydelse, vi leverer? Og retningen: gør vi det bedre for vores patienter i dag, end vi gjorde i går?

Hvor forskeren som regel udtrykker data i rater og procenter for at kunne sammenligne effekten af forskellige interventioner, bruges i forbedringsarbejdet også absolutte tal, som i højere grad er med til at sætte fokus på de patienter det drejer sig om. Her er det ikke 3 pr. 1000 indlagte, der får komplikationer, men i stedet er det Kirsten, Jens og Bente, der får tryksår, sygehusinfektion eller sepsis og dermed er forhindrede i at deltage i barnebarnets konfirmation. Når der kommer ansigt på data, er det med til at motivere for forbedringer.

Data Forsker Kvalitetsudvikler
Formål At skabe ny viden At forbedre kvalitet ved at implementere eksisterende viden
Hypotesens fleksibilitet

Statisk

Fastsættes fra starten og fraviges ikke

Dynamisk

Tilpasses efterhånden som ny erkendelse opnås

Målehyppighed

Ét eller få måletidspunkter Hyppige målinger (dage/uger/måneder)
Afprøvning

Én stor afprøvning

Samtidig for hele stikprøven

Gerne blindet

Mange hyppige afprøvninger over tid

Synlige data
Stikprøvestørrelse

Stor population

Mange parametre for at kunne lave en reel sammenligning
Hyppige målinger på små stikprøver
Statistiske metoder Komparative metoder (t-test, chi2, regression osv.) Procesanalyser (statistisk processtyring)

Tabel. Karakteristika for data til henholdsvis forskning og kvalitetsudvikling. 
Kilde: Udarbejdet på baggrund af Provost LP, Murray SK, The Health Care Data Guide, Learning from Data for Improvement, 2011 (side 27).

Care bundles – pakkebegrebet

Pakker er kendt i sundhedsvæsenet. Der er diagnostiske pakker, behandlingspakker og pakkeforløb inden for fx kræft, hjertesygdomme og psykiatri. Pakkernes formål er at sikre systematik, så patienterne modtager relevante tilbud uden urimelige forsinkelser.

Pakker, der anvendes i forbedringsarbejdet (eng: care bundles), ser lidt anderledes ud, men formålet er det samme. En pakke beskriver i få punkter de vigtigste handlinger inden for et afgrænset klinisk område, fx behandling af patienter, der indlægges med lungebetændelse (optiCAP), eller forebyggelse af alvorlige fødselslæsioner (casen om forebyggelse af fødselsskader). Pakken har til formål at sikre, at alle patienter modtager hovedelementerne i den pleje og behandling, som sundhedsfaglige eksperter på forhånd er enige om, er den rette.

Pakken er altså et udtryk for systematisering og prioritering af den eksisterende best practice, som ofte i forvejen er beskrevet i vejledninger og retningslinjer. Nye forskningsresultater og ny klinisk viden indarbejdes løbende i pakken.

Erfaringen fra forbedringsprojekter er, at pakkerne er et godt redskab. Når de fire-fem-seks vigtigste interventioner er samlet, er der større sandsynlighed for, at de bliver leveret, frem for hvis man skal huske på dem enkeltvis (2) (3). Pakkerne gør det også nemmere at arbejde med forbedringer, fordi det bliver tydeligt for forbedringsteamet, hvilke processer der er nødvendige for at levere best practice, hvilke processer som allerede fungerer, og hvilke processer som er usikre, og hvor der er brug for ændringer i arbejdsgangene

Enkelte og sammensatte indikatorer

For hvert element i pakken, kan man have en procesindikator, der siger, hvor stor en del af patienterne, der har modtaget det pågældende element i processen/udredningen/behandlingen, og eventuelt en standard, der siger, hvilket niveau man stræber efter for den pågældende indikator. På den måde kan opfyldelsesgraden (eller ”leveringssikkerheden”) for de enkelte elementer i pakken vurderes hver for sig.

Der kan også anvendes sammensatte (‘kompositte’ indikatorer). De to mest almindelige er opportunity-based indikatoren og all-or-none indikatoren.

Med opportunity based indikatoren beregnes, hvor stor en andel af de samlede relevante ydelser, der er leveret. Har vi 10 patienter, der alle skal have en pakke med fem elementer, er der i alt 50 anledninger (opportunities) for at levere. Hvis der i alt er leveret fx 30 ydelser, er indikatoren 60%.

Med all-or-none indikatoren kigger man på andelen af patienterne, der har modtaget hele pakken af relevante ydelser. Dvs. andelen af patienter, der har fået den ”perfekte” (”defect free”) behandling. Hvis man som i ovenstående eksempel har leveret 30 ud af 50 ydelser kan all-or-none indikatoren godt være 0%, hvis der fx er et enkelt element, som ingen af patienterne har fået.

Både i optiCAP-eksemplet og i fødselseksemplet har man kigget på all-or-none-indikatoren.

Som patient vil man nok betragte det som en selvfølge, at man modtager alle relevante dele af pleje og behandling, og fra patientens synsvinkel giver all-or-none-målingen derfor rigtig god mening (4).

Men all-or-none indikatoren er også et meget hårdt mål for kvaliteten. Samtidig tager denne indikator ikke hensyn til, at nogle af ydelserne i pakken er vigtigere end andre (5). Det lyder hårdt i OptiCAP-eksemplet, at kun syv procent af patienterne har fået den samlede pakke, men ser man på de enkelte ydelser, er det langt hovedparten af patienterne, der har fået taget røntgenbillede af lungerne og er startet antibiotikabehandling inden for de otte timer, mens der var større problemer med at få opfyld de to andre indikatorer, altså luftvejssekret og CURB65-scoring af patientens almentilstand.

De kliniske kvalitetsdatabaser, der gennem de seneste årtier er etableret inden for mange lægelige specialer, er også en slags pakker eller care bundles. I databaserne, der er samlet under Regionernes Kliniske Kvalitetsudviklingsprogram, RKKP, er der ud fra gældende guidelines inden for de enkelte specialer og i samarbejde med de faglige miljøer i de lægevidenskabelige selskaber fastsat en række indikatorer, og for hver indikator en standard for opfyldelsesgraden for den pågældende indikator. I RKKP måles både på processerne, dvs. de enkelte ydelser, og på resultater, dvs. fx mortalitet.

I en rapport fra RKKP og Danish Center for Clinical Health Services Research (DACS) (6), Aalborg Universitet, har man beregnet opportunity based indikatoren og all-or-none indikatoren for de vigtigste elementer i seks af RKKP’s databaser (Dansk Depressions Database, Dansk Nationale Skizofrenidatabase, Dansk Hjertesvigtdatabase, Dansk Hjerterehabiliteringsdatabase, DANARREST – Registrering af hjertestop på hospital og Atrieflimren i Danmark). Kun procesindikatorer er relevante i denne sammenhæng, da det ikke giver mening af kombinere proces- og resultatindikatorer (dvs. målinger af fx patienttilfredshed, ventetid, mortalitet eller smerter) i de kompositte indikatorer. Rapportens konklusion er, at de kompositte indikatorer er velegnede til at give et overblik over kvaliteten, og at de forskellige typer af kompositte indikatorer supplerer hinanden i den sammenhæng.

Se man på analysens resultater ligger opportunity based indikatoren på landsplan på 84 % eller derunder, mens all-or-none indikatoren er betydeligt lavere, typisk på omkring 50 % eller derunder. Der er altså kun ca. halvdelen af patienter i Danmark, der får en ”defekt-fri” behandling.

Det kan virke overraskende, at det er så svært at få leveret ydelserne til patienterne, selv om de er planlagte og nedskrevne. En del af forklaringen kan selvfølgelig være mangler i registreringerne. Desuden er det jo databaserne formål at sætte barren højt. Databaserne (der er under stor indflydelse fra relevante klinikere inden for et givent område) er dynamiske, indikatorer udskiftes løbende og standarder ændres.

Men som eksemplet fra fødeafdelingen i Herning/Holstebro viser, opstår der i den kliniske hverdag også en række forhindringer, som gør det svært. I forbindelse med et kvalitetsudviklingsprojekt vil der ofte ske det, at disse forhindringer bliver tydelige, sådan at de kan håndteres én efter én. Enten ved at problemerne løses, eller ved at man bevidst accepterer, at det ikke kan være anderledes.

 

Case: Færre alvorlige læsioner hos fødende

Kilde: Obstetrisk kvalitetsansvarligt team ved Jordemodersupervisor Charlotte Sander Andersen og Overlæge Ole Bredahl Rasmussen, Gynækologisk-obstetrisk afdeling, Hospitalsenheden Vest, Herning

I 2012 erkendte jordemødre og fødselslæger ved Gynækologisk-Obstetrisk Afdeling i Herning og Holstebro, at hyppigheden af svære udrifter i mellemkødet ved fødsler var for høj. Der var stor motivation i afdelingen for at gøre noget ved problemet, som kan medføre livsvarige gener for dem, det rammer.

En litteraturgennemgang viste, at man i Norge flere steder havde haft held til at halvere hyppigheden af udrifter hos førstegangsfødende med vaginal fødsel fra cirka 6% til cirka 3% ved hjælp af særlige håndgreb og aftaler med den fødende.

Afdelingen valgte at implementere de norske håndgreb i et gennemarbejdet kvalitetsforbedringsprojekt, hvor man dokumenterede de anvendte håndgreb og aftaler.

Det lykkedes at halvere hyppigheden af svære udrifter ved fødslen inden for det første år til cirka samme niveau som i Norge og ikke mindst også at fastholde succesen (7) (8).

I projektet blev defineret en pakke (care bundle) med fem procesindikatorer, dvs. mål for om de nye arbejdsgange blev fulgt og i hvilket omfang.

  1. Anvendelsen af håndgreb aftales med den fødende inden fødslen.
  2. Ved fødslen eleveres lejet, så der er godt udsyn til mellemkødet.
  3. Ved fødslen lægges hele hånden på barnets hoved for at holde igen.
  4. Ved fødslen anvendes et såkaldt "pistolgreb" for at støtte mellemkødet, og det gør det nemmere at få barnets hoved ud uden følgeskader.
  5. Alle ansatte fødselslæger og jordemødre kommer igennem uddannelsesforløb og bliver certificerede.

Det lykkedes at opnå godt 90% opfyldelse af de enkelte indikatorer og godt 80% for all-or-none (andel af fødende, hvor alle fem indikatorer var opfyldt). Men hvorfor blev andelen, der fik alle elementer, ikke højere?

Her er nogle af forklaringerne:

  • Nogle kvinder kommer ind i ”bragende” fødsel, hvor man kun lige når ”at gribe barnet”.
  • Nogle kvinder ønsker at føde fx stående, hvor det ikke er muligt at opfylde alle processerne.
  • For nogle kvinder var det pga. tilfældigheder ikke lykkedes at mødes og præsentere problematikken og finde frem til, hvad kvinden ønskede i relation til dette.
  • Nyansatte i afdelingen skulle først gennemgå en certificering ved en fødsel, for at den femte procesindikator kunne krydses af som opfyldt. Derfor var der en naturlig begrænsning dér.
  • Ved vandfødsler eller ved stående fødsler er der begrænsninger for fødselshjælperens anvendelse af håndgreb. Men aftaler med kvinden er stadig en mulighed.

De nye udfordringer skabte nye indsigter:

I løbet af projektet blev det klart, at den vigtigste faktor for at mindske risikoen for svær udrift var at bremse farten på fødslen ved at holde hele hånden mod barnets hoved. Dette kan udføres i alle situationer – også ved såkaldt alternative fødestilliger.

En jordemoder fandt på at lægge kvinden på en pude i vandet ved vandfødsler, hvorved den fødende blev løftet så højt op i vandet, at alle håndgreb kunne opfyldes og hun stadig kunne føde som ønsket.

Jordemoderstuderende skal tage imod mange fødende i løbet af deres uddannelse. Der var brug for også at inddrage dem i projektet.

Graferne viser opfyldelsesgraden for de enkelte elementer i pakken, samt (øverst) andelen af fødende, hvor samtlige elementer i pakken var opfyldt (9).

Der ses signifikante stigninger i hyppigheden af anvendelsen af de enkelte elementer i pakken bortset fra elementet "synligt perineum". Det er dog påfaldende, at stigningerne i hhv "kommunikation", "hånd på barnets hoved" og "støtte til perineum" var relativt små (om end signifikante).

Kun "certificering" viste lav anvendelse fra starten af projektet og stærk stigning herefter. Formentlig er forklaringen, at jordemodergruppen var stærkt motiveret til at give sig i kast med den nye intervention.

Kort forinden havde der været et andet projekt på samme område, som desværre ikke hjalp, hvilket sandsynligvis øgede interessen for det nye projekt. Starten af projektet var planlagt til 1. juli 2013. Men mange begyndte hurtigt at anvende elementerne, endda før de var blevet certificerede.

For at få det mest troværdige billede af anvendelsen af elementerne fra før starten af projektet, var det nødvendigt at fremskynde starten til d. 1. juni.

Stor motivation og stærkt engagement kan på den måde risikere at mindske muligheden for at kunne vise en gevinst ved en ny intervention – især hvis man ikke registrerer anvendelsen af elementerne i interventionen, dvs. procesindikatorerne.

Referencer

  1. Michael Moesmann Madsen, Jan Nørholm Mainz & Jens Winther Jensen, Ugeskr Læger 2019;181:V11180759
  2. Resar R, Griffin F, Haraden C, Nolan T. Using Care Bundles to Improve Health Care Quality. IHI Innovation Series white paper. 
  3. Et kvalitetsprogram – Fra Patientsikkert Sygehus til forbedringsarbejde på sundhedsområdet. Dansk Selskab for Patientsikkerhed, juli 2015.
  4. Nolan T, Berwick DM. All-or-none measurement raises the bar on performance. JAMA. 2006 Mar 8;295(10):1168-70. http://doi.org/10.1001/jama.295.10.1168 PMID: 16522838.
  5. Barclay M, Dixon-Woods M, Lyratzopoulos G The problem with composite indicators. BMJ Quality & Safety 2019;28:338-344. http://doi.org/10.1136/bmjqs-2018-007798
  6. Pinar Kara og Søren Paaske Johnsen. Construction and use of composite indicators for RKKP-databases. Regionernes Kliniske Kvalitetsudviklingsprogram og Danish Center for Clinical Health Services Research. 2021.
    https://www.rkkp.dk/siteassets/om-rkkp/rapporter/rkkp_report__081120kompositte_.pdf
  7. Rasmussen OB, Yding A, Anhøj J, Andersen CS, Boris J. Reducing the incidence of Obstetric Sphincter Injuries using a hands-on technique: an interventional quality improvement study. BMJ Quality Improvement Reports 2016;5:u217936.w7106.
  8. Rasmussen OB, Yding A, Lauszus F, Andersen CS, Anhøj J, Boris J. Importance of Individual Elements for Perineal Protectionn in Childbirth: An Interventional Prospective Trial. Am J Perinatology Reports 2018;8:e289-e294.
  9. Rasmussen OB, Yding A, Anhøj J, Andersen CS, Boris J. Reducing the incidence of Obstetric Sphincter Injuries using a hands-on technique: an interventional quality improvement study. BMJ Quality Improvement Reports 2016;5:u217936.w7106.