Articles / november 15, 2021

Anvendelse af optimal kontrolteori på komplekse epidemiologiske modeller til at informere om håndtering af sygdomme i den virkelige verden

Introduktion

Matematisk modellering spiller en stadig vigtigere rolle i forbindelse med politiske og forvaltningsmæssige beslutninger om invaderende sygdomme. Det kan imidlertid være vanskeligt at identificere effektive og omkostningseffektive kontrolforanstaltninger på grundlag af modeller, især når modellerne omfatter meget detaljerede repræsentationer af sygdomsoverførselsprocesser. Der findes en række matematiske værktøjer til udformning af optimale strategier, men der findes ingen standard til at omsætte resultaterne af matematisk motiverede forenklinger til praksis. Et åbent spørgsmål er, hvordan man kan indarbejde tilstrækkelig realisme i en model til at muliggøre nøjagtige forudsigelser af virkningerne af bekæmpelsesforanstaltninger, samtidig med at man sikrer, at den virkelig optimale strategi stadig kan identificeres . I denne artikel identificerer vi vanskelighederne – samt potentielle løsninger – ved at opnå en praktisk anvendelig optimal strategi og fremhæver den potentielle rolle, som open-loop og modelprædiktiv styring kan spille ved hjælp af et enkelt eksempel.

(a) Realistiske simuleringsmodeller

Optimering af sygdomsstyring indebærer, at man skal bestemme den eller de mest hensigtsmæssige bekæmpelsesmetoder, f.eks. vaccination, karantæne eller roguing, og den bedste strategi for anvendelse af denne metode eller kombination af metoder for at minimere virkningerne af sygdommen. Denne minimering kan være vanskelig, når ressourcerne er begrænsede, og der er økonomiske omkostninger forbundet med både bekæmpelsesforanstaltninger og sygdom. Metoder, der simulerer det forventede forløb af en epidemi og eksplicit modellerer virkningerne af interventioner, kan hurtigt kvantificere den potentielle virkning af en given strategi . Disse simuleringsmodeller gengiver nøjagtigt det virkelige systems dynamik og er derfor blevet vigtige redskaber til vurdering af politiske beslutninger vedrørende realtidsstyringsreaktioner og øget beredskab over for fremtidige trusler. Som eksempler kan nævnes vaccinationspolitikker for human papillomavirus i Det Forenede Kongerige , politikker for nedslagning af husdyr og optimering af vaccinationer mod mund- og klovsyge samt optimale værtsfjernelsesstrategier for citrussygdomme og pludselig egedød i træer .

Forskellige kompleksiteter i sygdomsdynamikken, f.eks. rumlige heterogeniteter og iboende individuelle forskelle i modtagelighed og patogenoverførsel (risikostruktur), har vist sig at være vigtige determinanter for mønstre og hastigheder for epidemisk spredning . For at sikre nøjagtige forudsigelser af epidemier skal disse faktorer medtages i simuleringsmodeller, der er udformet som støtte til beslutningstagning. Inddragelse af disse heterogeniteter resulterer imidlertid typisk i meget komplekse modeller med mange mulige kontrolforanstaltninger, hvilket gør optimering beregningsmæssigt uoverkommelig, når interventioner kan kombineres, og især når kontrolforanstaltninger også kan variere over tid, i rummet eller i forhold til sygdomsrisiko . For de fleste simuleringsmodeller er den eneste brugbare mulighed at bruge modellen til at evaluere en lille delmængde af plausible strategier, der forbliver faste i løbet af epidemien, eventuelt ved at scanne over en enkelt parameter som f.eks. en aflivningsradius. Vi vil betegne denne fremgangsmåde som “strategitestning”. Ved at anvende denne fremgangsmåde er det vanskeligt at have stor tillid til den bedst fungerende strategi, da der ikke er nogen rammer for valget af den, og det er derfor sandsynligt, at det sæt af strategier, der testes, vil være skævt. Da det sæt, der skal testes, ikke kan dække hele rummet af kontrolmuligheder, er det desuden usandsynligt, at det sande optimum vil blive fundet.

(b) Optimal kontrol af epidemiologiske modeller

Der findes mange matematiske teknikker til at karakterisere den sande optimale kontrol for en sygdom, f.eks. ligevægts- eller slutstørrelsesanalyse, afhængig af det system, der analyseres . Vi fokuserer her på optimering af tidsvarierende kontrol af dynamiske systemer, hvortil optimal kontrolteori (OCT) er meget anvendt . Ved at analysere et sæt ligninger, der beskriver sygdommens dynamik, kan OCT matematisk karakterisere den optimale indsættelsesstrategi for en given kontrolmetode og give indsigt i den underliggende dynamik uden den gentagne simulering, der kræves for at optimere simuleringsmodeller. På grund af den underliggende matematiske kompleksitet kan der imidlertid kun gøres få fremskridt med OCT, medmindre de underliggende modeller for sygdomsspredning er stærkt forenklede. Det tidlige arbejde inden for OCT fokuserede på optimale vaccinations- og behandlingsniveauer, mens der senere kom udvidelser til at omfatte yderligere interventioner, herunder karantæne, screening og sundhedsfremmende kampagner . Sygdomsmodeller kan også kobles med økonomiske virkninger, og inden for OCT er dette blevet anvendt til at afbalancere flere omkostninger, f.eks. overvågning og kontrol eller profylaktisk versus reaktiv behandling.

De optimale strategier, der identificeres ved hjælp af OCT, kan være meget komplekse, idet de ofte specificerer kontroller, der skifter strategi på bestemte tidspunkter i løbet af en epidemi. Den øgede kompleksitet af disse skiftende kontroller kan forbedre sygdomsstyringen betydeligt, når de testes på en rumligt eksplicit model, men kan føre til dårlige resultater, hvis det nøjagtige tidspunkt for skiftet ikke er kendt , f.eks. når parameterusikkerhed giver et bredt spektrum af mulige skifttidspunkter. Dette viser, at usikkerheder og yderligere kompleksitet ofte forhindrer OLT i at være direkte anvendelige i den virkelige verden. Det er også uklart, hvordan indsigt fra OCT alene kan omsættes til praktiske råd. For at bevæge sig i retning af robuste strategier, der kan anvendes i praksis, har nyere arbejde fokuseret på at inddrage yderligere funktioner og heterogeniteter i de modeller, der anvendes i OCT, navnlig rumlige dynamikker. Rummet indgår normalt kun i begrænset omfang, f.eks. ved at anvende metapopulationsmodeller (f.eks. ) eller partielle differentialligninger (f.eks. ) til optimering af rumlige strategier, så det er fortsat et åbent spørgsmål, om de tilføjede heterogeniteter er tilstrækkelige til at identificere robuste og praktiske kontrolstrategier.

(c) Overgang til praktisk kontrol

Selv om man finder den matematisk optimale kontrolstrategi, er det nødvendigt med store forenklinger af systemet som modelleret for at gøre det muligt at gøre fremskridt ved hjælp af OCT. Det er derfor ofte uklart, hvordan disse strategier ville fungere, hvis de blev vedtaget af de politiske beslutningstagere. På den anden side er det ofte umuligt at optimere modeller, der er tilstrækkeligt realistiske til at informere politikken direkte, fuldt ud. Der er derfor behov for en ramme for at kombinere OCT’s optimeringsmuligheder med de nøjagtige forudsigelser fra modeller af simuleringstypen, som er nødvendige i forbindelse med politikudformning. Spørgsmålet er så, hvordan vi skal gøre praktisk brug af OCT?

I §2 beskriver vi to metoder fra kontrolsystemteknik til anvendelse af OCT-resultater og sammenligner disse med strategitestning ved hjælp af en simpel illustrativ model i §3. Vi søger at besvare, hvordan man under de nuværende beregningsmæssige begrænsninger kan anvende resultater fra OCT og samtidig bevare den realisme, der er nødvendig for praktisk anvendelse.

Anvendelse af optimal kontrol på realistiske systemer

Uden for epidemiologien har OCT haft bredere anvendelse på tilnærmede modeller af komplekse systemer. I en nyere undersøgelse gennemgås brugen af OCT til agentbaserede modeller (ABM’er) , en type model, der simulerer autonome agenters individuelle adfærd. An et al. foreslår, at der anvendes en model, der tilnærmer sig ABM’ens dynamik, og som er udformet således, at den er enkel nok til at muliggøre en matematisk analyse af den optimale kontrol. En passende tilnærmet model vælges og tilpasses enten til reelle data eller til syntetiske data fra ABM’en. OLT-resultaterne fra den tilnærmede model overføres derefter til den ABM, der skal testes: en proces, der kaldes “lifting”, og som lige så godt kan anvendes på de detaljerede epidemisimuleringsmodeller, der behandles i denne artikel. Vi beskriver nu to mulige rammer fra kontrolsystemteknik til at gøre brug af denne tilgang til kontrolløftning.

(a) Open-loop control

Den første metode er den enkleste anvendelse af kontrolløftning, og den ramme, som An et al. implicit foreslår. Styringen optimeres på den tilnærmede model én gang ved hjælp af simuleringsmodellens startbetingelser. Den resulterende optimale kontrolstrategi løftes til simulatoren og anvendes i hele simuleringens køretid (figur 1). Ved gentagen simulering af OLT-strategien på simuleringsmodellen kan den vurderes i forhold til andre mulige kontrolstrategier. Optimeringen giver en enkelt, tidsafhængig strategi for alle simuleringsrealiseringer og indeholder således ikke nogen feedback. Den betegnes derfor som “open-loop”-styring, da den er fuldt ud specificeret af de indledende simuleringsbetingelser og den bane, der forudsiges af den tilnærmede model. Anvendelse i epidemiologi er ualmindelig, selv om Clarke et al. bruger OCT i en tilnærmet model til at finde optimale niveauer for klamydiascreening og kontaktopsporing, som derefter kortlægges på en netværkssimulering.

Figur 1. Open-loop og modelprædiktiv styring (MPC). Modelhierarkiet er vist, med optimerede kontroller fra den tilnærmede model, der er direkte overført til simuleringsmodellen. Det reelle system er grønt, modellerne og tilpasningsprocesserne er blå, og styringsrammen er orange. Uden den orange stiplede feedback-sløjfe er der tale om styring med åbent kredsløb. MPC nulstiller tilstanden af den tilnærmede model ved regelmæssige opdateringstrin, før den genoptimeres og løfter styringen til simuleringsmodellen indtil næste opdateringstidspunkt.

(b) Model Predictive Control

Open-loop styring kræver, at den tilnærmede model forbliver nøjagtig over hele epidemiens tidsskala. Af hensyn til tractability må den tilnærmede model imidlertid nødvendigvis udelade mange heterogeniteter, der er til stede i simuleringsmodellen, f.eks. rumlige virkninger og risikostruktur. Når de strategier, der følger af OCT, derefter anvendes på simuleringsmodellen eller på det virkelige system, vil sygdomsforløbet sandsynligvis afvige systematisk fra den bane, der er forudsagt af den tilnærmede model. Model Predictive Control (MPC) er en optimeringsteknik med systemfeedback, som kan tage højde for sådanne forstyrrelser . På regelmæssige opdateringstidspunkter nulstilles værdierne af tilstandsvariablerne i den tilnærmede model, så de stemmer overens med værdierne i simuleringen på det pågældende tidspunkt. Styringen optimeres derefter igen, og den nye styringsstrategi anvendes på simuleringen indtil næste opdateringstidspunkt. Den tilnærmede model og simuleringsmodellen køres derfor samtidig, med flere optimeringer pr. realisering, for at sikre, at den tilnærmede model og styringsstrategien passer nøje til hver enkelt simuleringsrealisering (figur 1). Disse multiple optimeringer er beregningsteknisk dyre, men er håndterbare, i modsætning til at udføre optimering på den fulde simuleringsmodel.

MPC har haft en vis anvendelse inden for den epidemiologiske litteratur, hvoraf størstedelen har været til kontrol af lægemiddelanvendelser for enkeltindivider snarere end kontrol af epidemier på populationsniveau. Eksempler herpå er at finde styringsstrategier for HIV, der er robuste over for målebrus og modelleringsfejl , og kontrol af insulintilførsel hos patienter med diabetes . Disse undersøgelser fremhæver fordelene ved MPC til robust styring, dvs. styring, der forbliver effektiv på trods af systemforstyrrelser. Kun én undersøgelse koncentrerer sig imidlertid om epidemistyring , og den tester ikke eksplicit feedback-kontrollen på simuleringer.

Optimeringsstrategier på en illustrativ netværksmodel

(a) Metoder

For at demonstrere open-loop og MPC til epidemistyring bruger vi en stokastisk SIR-netværksmodel, der omfatter værtsdemografi og risikostruktur. Modellen er bevidst holdt enkel for at vise, hvordan den underliggende idé er bredt anvendelig på tværs af sygdomme hos mennesker, dyr og planter. Selv om modellen og dens parametre er vilkårlige og ikke repræsenterer en specifik sygdom, bruger vi den til at repræsentere et scenarie, hvor en simuleringsmodel allerede er blevet tilpasset et reelt sygdomssystem; netværksmodellen bruges derfor her som en proxy for en potentielt meget detaljeret simuleringsmodel.

(i) Simuleringsmodel

I vores model spredes infektionen stokastisk over et netværk af knudepunkter, der er grupperet i tre forskellige regioner (figur 2a). Hvert knudepunkt indeholder en værtspopulation, der er stratificeret i høj- og lavrisikogrupper. Infektionen kan spredes mellem individer inden for knudepunkter og mellem forbundne knudepunkter. Nettoinfektionshastigheden for risikogruppe r i knudepunkt i er givet ved

Sir∑ jσij (ρrHI jH+ρrLI jL),3.1

hvor S og I er antallet af henholdsvis modtagelige og inficerede værter, hvor de dybereliggende tegn angiver knudepunktet, og de overliggende tegn angiver høj (H) eller lav (L) risikogruppe. Summen er over alle forbundne knudepunkter, herunder selve fokusknuden, med den relative transmissionsstyrke til knudepunkt i fra knudepunkt j givet ved σij, og risikostrukturen givet ved 2 × 2-matricen ρ. Alle detaljer om modellen findes i det elektroniske supplerende materiale, S1. Selv om modellen i ligning (3.1) ikke er begrænset til disse anvendelser, kunne modellen i ligning (3.1) repræsentere afgrøde- eller husdyrsygdomme, der spredes gennem gårde, eller seksuelt overførte infektioner, der spredes gennem byer eller lande.

Figur 2. (a) Det netværk, der er anvendt til den illustrative simuleringsmodel, herunder regionsmærker. Epidemien er sat i den røde knude i region A og kan sprede sig mellem forbundne knuder (grå linjer). I (b) er kontroltildelingen vist for en enkelt rumbaseret MPC-kørsel, med den tilsvarende open-loop-tildeling angivet med den sorte stiplede linje. (c) Det samlede antal smittede individer under en enkelt kørsel med rumbaseret open-loop-kontrol. Styringen er baseret på forudsigelsen af den tilnærmede model med udgangspunkt i de indledende betingelser. (d) Antallet af smittede individer i simuleringen og den rumbaserede tilnærmede model svarende til den MPC-kontrol, der er udført i (b). Her nulstilles forudsigelsen til at stemme overens med simuleringen ved hvert opdateringstrin (0,5 tidsenheder), og styringen optimeres på ny. Ved gentagne gange at korrigere for forskelle mellem kortsigtede modelforudsigelser og det realiserede antal inficerede individer – i stedet for at stole på en potentielt stadig mere unøjagtig forudsigelse, der er foretaget på det indledende tidspunkt – giver MPC bedre forudsigelser af simulationstilstanden samt forbedret styring sammenlignet med open-loop (bemærk de forskellige skalaer på y-aksen). a.u., arbitrære enheder.

Massevaccination er den eneste intervention, som vi overvejer, med mulighed for at målrette på grundlag af både risikogruppe og region, men randomiseret på tværs af værtsinfektionsstatus (dvs. vaccinen gives til alle værter, men er kun effektiv på modtagelige). Logistiske og økonomiske begrænsninger inddrages ved hjælp af en maksimal samlet vaccinationsrate (ηmax), der kan fordeles mellem risikogrupper og regioner. Inden for hver gruppe vaccineres modtagelige personer med følgende hastighed: fηmaxS/N, hvor f er den andel af kontrollen, der tildeles den pågældende gruppe, og N er den samlede gruppepopulation.

Optimal fordeling af vaccinationsressourcerne minimerer en epidemisk omkostning J, der repræsenterer epidemiens sygdomsbyrde på tværs af alle inficerede værter i løbet af simuleringstiden (T): J=∫t=0TI(t) dt. I lighed med den særlige kontrol, vi overvejer, og de risiko- og rumlige strukturer, blev dette enkle valg af målfunktion blot foretaget for at illustrere vores metoder, men rammen generaliseres straks til mere komplekse indstillinger.

(ii) Approksimative modeller

Udførlig optimering af kontrollen ved hjælp af simuleringsmodellen, på tværs af rum, risikogruppe og tid, er tydeligvis meget beregningsmæssigt dyrt. For at vurdere det bedste tilnærmelsesniveau overvejer vi to forskellige deterministiske tilnærmede modeller af simulatoren. Den første model er rent risikostruktureret, idet den udelukker alle rumlige oplysninger og efterlader en befolkningsgruppe med høj risiko og en med lav risiko. Denne model er deterministisk og baseret på den antagelse, at alle knudepunkter er rumligt godt blandet med hinanden. Den anden tilnærmede model er mere kompleks, idet den også er deterministisk og risikostruktureret, men den omfatter desuden en første tilnærmelse til værtens rumlige struktur ved at inddrage de regionale værtsoplysninger. Den rumlige dynamik indgår mellem de tre regioner, men ikke inden for de tre regioner, for at bevare tilstrækkelig enkelhed til at opnå optimale kontrolresultater, hvorved det antages, at knudepunkterne er rumligt godt blandet inden for hver region. Dette kunne f.eks. betyde, at man optimerer kontrollen på landsplan, men ikke på regionalt plan. Vi betegner denne model som den rumlige tilnærmede model. Et enkelt sæt parametre tilpasses for hver model til data fra et ensemble af simuleringsmodelkørsler. Vi tester derefter, hvilken af de to tilnærmede modeller der er den mest anvendelige til kontroloptimering. Detaljerede oplysninger om de tilnærmede modeller, tilpasnings- og optimeringsprocedurer findes i det elektroniske supplerende materiale, S1 og S2.

(iii) Kontrolscenarier

Vi tester seks forskellige kontrolscenarier, som sammenligner strategiprøvning af kontrol baseret udelukkende på simuleringsmodellen (scenarier 1 og 2) med open-loop og MPC anvendt ved hjælp af begge vores tilnærmede modeller (scenarier 3-6):

(1) ‘Høj’: Vacciner udelukkende højrisiko-individer.
(2) ‘Split’: Fordel kontrolressourcerne mellem høj- og lavrisikogrupper på grundlag af en optimering, der er udført på forhånd.
(3) ‘Risk OL’: Kontrol i åbent kredsløb ved hjælp af den risikobaserede tilnærmede model.
(4) ‘Risk MPC’: MPC ved hjælp af den risikobaserede tilnærmede model.
(5) “Space OL”: styring med åbent kredsløb ved hjælp af den rumlige tilnærmede model.
(6) “Space MPC”: MPC ved hjælp af den rumlige tilnærmede model.
(6) “Space MPC”: MPC ved hjælp af den rumlige tilnærmede model.

Den optimale konstante tildeling for strategien ‘Split’ blev fundet ved at køre mange simuleringsmodelrealiseringer for hver af en række fordelingsværdier, som i , og vælge den værdi, der gav de laveste gennemsnitlige epidemiske omkostninger (elektronisk supplerende materiale, figur S8). De seks strategier vurderes ved gentagne gange at køre simuleringsmodellen under hvert kontrolscenarie.

(b) Resultater

OCT-resultaterne for optimering af vaccinationsstrategien i den risikobaserede tilnærmede model fører til indledende vaccination af kun højrisiko-individer, før der skiftes prioritering og behandles næsten udelukkende den mere folkerige lavrisikogruppe. OCT-resultaterne fra den rumlige tilnærmede model viser dette samme skift (figur 2b), men der ses også en række rumlige skift, hvilket gør det muligt for kontrollen at følge epidemien, mens den udvikler sig gennem de tre regioner (elektronisk supplerende materiale, figur S9). De rumlige strategier er derfor langt mere komplekse end de risikobaserede kontroller.

Anvendelse af kontrolscenarierne på simuleringsmodellen og sammenligning af epidemikosterne viser, at indarbejdelse af større realisme gennem en mere kompleks tilnærmet model samt ved brug af MPC giver mulighed for forbedret sygdomsstyring (figur 3 og elektronisk supplerende materiale, figur S10). Af de konstante og rent simulationsbaserede “brugerdefinerede” strategier er det en smule mere effektivt at opdele kontrollen mellem risikogrupper end blot at vaccinere højrisikogruppen. Den optimale tildeling til højrisikogruppen, der anvendes i “Split”-strategien, er 63 % af vaccinationsressourcerne, mens resten anvendes til at vaccinere lavrisiko-individer, selv om dette sker i et bredt minimum af epidemiske omkostninger (elektronisk supplerende materiale, figur S8). Anvendelse af optimeringerne fra den risikobaserede tilnærmelsesmodel på simuleringsmodellen giver en forbedring i forhold til nogen af de “brugerdefinerede” strategier, selv om der kun er ringe forskel i epidemiske omkostninger mellem open-loop- og MPC-rammerne (se nedenfor). Tilføjelse af rum i den tilnærmede model forbedrer kontrollen yderligere, hvilket fører til de mindste epidemiske omkostninger, når den rumlige MPC-ramme anvendes.

Figur 3. Resultater af forskellige styringsoptimeringsordninger på den illustrative simuleringsmodel. Spatial MPC klarer sig bedst og viser en forbedring i forhold til både open-loop (OL) og brugerdefinerede strategier. a.u., arbitrære enheder.

Den illustrative model demonstrerer de styringsforbedringer, der kan opnås ved at kombinere OL med både open-loop og MPC. De vigtigste resultater af OCT-analyserne er styringsomkoblingstiderne. Anvendelse af skiftekontrollen fra en af de to tilnærmede modeller med styring med åbent kredsløb giver lavere epidemiske omkostninger end de naivt valgte “brugerdefinerede” strategier. Den feedback, der er til stede i MPC-kontrollerne, giver mulighed for yderligere reduktioner af de epidemiske omkostninger. Ved at revurdere tidspunktet for skiftet i løbet af epidemien og eventuelt inkludere yderligere skift kan styringen reagere tættere på den nøjagtige bane for den aktuelle simuleringsrealisation (figur 2b-d). Dette giver en styring, der er mere robust over for usikkerhed og systematiske fejl i den tilnærmede model, og som derfor klarer sig bedre på den komplekse simuleringsmodel.

I de risikobaserede strategier er der kun lidt forskel mellem open-loop og MPC. Dette skyldes, at den præcise timing af skiftet fra vaccination af højrisikogruppen til lavrisikogruppen ikke påvirker de epidemiske omkostninger væsentligt (elektronisk supplerende materiale, figur S11). Tidspunkterne for indførelsen af sygdommen i region B og C varierer meget fra simulationskørsel til simulationskørsel (elektronisk supplerende materiale, figur S2). Muligheden for yderligere skift i den rumlige tilnærmede model giver MPC-regulatoren større fleksibilitet til at reagere på denne variabilitet, og derfor viser rumlig MPC en betydelig forbedring i forhold til open-loop, som ikke kan tilpasse sig forstyrrelser. Styringens ydeevne er tæt forbundet med nøjagtigheden af den tilnærmede model. I vores eksempel er den rumlige dynamik klart vigtig på grund af timingen af spredningen mellem regioner, og derfor klarer de mere informerede styringer af den rumlige model sig bedre end de risikobaserede strategier.

Diskussion

Vores resultater viser, at valget af tilnærmet model påvirker både open-loop- og MPC-strategiernes ydeevne. Her har vi fundet en passende tilnærmet model på en ad hoc-måde, men en vigtig udfordring for fremtiden er at udvikle en mere formel metode til at vælge den mest hensigtsmæssige tilnærmede model. En mere nøjagtig model kan give bedre forudsigelser og dermed en styring, der ligger tættere på det sande optimum, men enklere modeller er ofte tilstrækkelige, og nøjagtigheden skal afvejes mod ekstra kompleksitet og optimeringsbegrænsninger. En af vanskelighederne ved at gøre dette er, at det ikke altid er klart, hvor grænsen for matematisk eller beregningsteknisk gennemførlighed går, og dermed hvor kompleks modellen kan gøres i praksis. Det er også vanskeligt at afgøre matematisk og systematisk, hvilke aspekter af dynamikken der er vigtige at indfange nøjagtigt. Dette centrale spørgsmål skal dog overvejes, da konsekvenserne vedrører direkte anvendelser i den virkelige verden.

Praktisk sygdomskontrol kræver undersøgelser af det virkelige system for at vurdere epidemiens tilstand. Både open-loop og MPC optimerer styringen ved hjælp af forudsigelser af den fremtidige dynamik, hvilket gør dem begge til feed-forward-regulatorer. Den tilnærmede model, der ligger til grund for disse rammer, gør det muligt at træffe mere velinformerede beslutninger mellem undersøgelserne, hvilket resulterer i en styring, der er tættere på det sande optimum. Med nøjagtige forudsigelser kan man undgå kontinuerlige eller meget hyppige undersøgelser, som kan være dyre eller logistisk udfordrende. Som tidligere omtalt forbedrer de gentagne opdateringer i MPC’s feedbackloop disse forudsigelser og dermed styringens ydeevne. Hver opdatering vil imidlertid kræve overvågning af det reelle system, så hyppigheden af opdateringerne skal vælges således, at der er balance mellem forbedret viden om systemet og eventuelle overvågningsbegrænsninger.

I denne artikel har vi fokuseret på en top-down-tilgang, hvor vi har fundet robuste, praktisk anvendelige strategier ved at gøre brug af OCT til optimering af simuleringsmodeller. Ligeledes anvender mange undersøgelser OCT uden simuleringsmodeller og overvejer sjældent den praktiske anvendelse af de resulterende optimale kontroller. Med denne bottom-up-tilgang er et system til at teste resultaterne på realistiske systemer afgørende for at sikre, at disse resultater er robuste i forhold til yderligere realisme. Anvendelse af en MPC-ramme som overvejet her kunne være en måde, hvorpå OCT-forskere kunne demonstrere den potentielle virkning af deres arbejde for et bredere publikum.

Udførlig afprøvning af alternative parameteriseringer af simuleringsmodeller ligger uden for rammerne af denne undersøgelse, men vi finder generelt, at rumlig MPC også klarer sig bedst på tværs af andre rimelige parametersæt (elektronisk supplerende materiale, S3). Vi har hele tiden antaget, at der kan opbygges en nøjagtig simuleringsmodel af det pågældende reelle system, og at der kan tilpasses et enkelt sæt parametre til den valgte deterministiske tilnærmede model. I virkeligheden kan der være betydelig usikkerhed om parametrene for simulatoren, så det kan være en udfordring at tilpasse en enkelt deterministisk model. Et spørgsmål til fremtidig undersøgelse vil være, hvordan man kan håndtere disse usikkerheder, måske også ved at indarbejde forbedret viden om parametre, efterhånden som simuleringen skrider frem .

De strategier, der findes ved hjælp af OCT, er stærkt afhængige af den nøjagtige form af målfunktionen, som vi her har valgt at være meget enkel. En udvidelse af målsætningen til at omfatte omkostninger i forbindelse med kontrol samt med hvert skift af strategi ville gøre det muligt at foretage en mere detaljeret vurdering af, om det er praktisk muligt at gennemføre disse komplekse strategier. Der er behov for mere forskning i, hvordan man kan kvantificere balancen mellem meget forskellige omkostninger, f.eks. behandlingsomkostninger og sygdomsbyrde . I forbindelse med sygdomme hos mennesker er omkostningseffektivitetsanalyser normalt baseret på kvalitetsjusterede leveår . Et lignende koncept kunne måske anvendes for plante- og dyresygdomme, herunder beregninger af udbyttetab samt virkninger på f.eks. velfærd, biodiversitet og turisme . De metoder, vi har beskrevet, er imidlertid ikke afhængige af kontrol- eller målfunktionens form. For en passende tilnærmet model sikrer tilbagekoblingen i MPC nøjagtige forudsigelser og bør derfor altid forbedre ydeevnen i forhold til åben sløjfe. De rammer, vi beskriver, kan bruges til at tilvejebringe et yderligere, uvildigt kontrolscenarie til den strategiprøvningsproces, der allerede er i almindelig brug.

I denne artikel har vi vist, at kobling af feedbackkontrol med simuleringsmodeller og OCT kan bidrage til at designe effektive og robuste interventionsstrategier til håndtering af patogener i menneske-, dyre- og plantepopulationer. Selv om disse teknikker kan være i stand til at overføre optimale kontrolresultater til mere realistiske simuleringer og dermed til praktisk anvendelse, rejser de fundne strategier spørgsmålet om resultaternes formidlelighed. Med komplekse feedbackstrategier mellem to modeller, hvoraf den ene er kompleks i sin struktur og den anden matematisk kompleks, er det samlede resultat ikke længere så enkelt at forklare. Den fremtidige forskning bør derfor fokusere på at forbedre simuleringsmodellernes nøjagtighed og analysere deres pålidelighed, således at simuleringer kan anvendes til at fastslå fordelene ved disse komplekse OLT-baserede strategier på en sikker måde.

Datatilgængelighed

Alle koder og animationer er tilgængelige på https://github.com/ehbussell/Bussell2018Model.

Autors bidrag

Konkurrerende interesser

Vi har ingen konkurrerende interesser.

Funding

E.H.B. takker Det Forenede Kongeriges Biotechnology and Biological Sciences Research Council of the United Kingdom (BBSRC) for støtte via et DTP-ph.d.-stipendium fra University of Cambridge.

Anerkendelser

Vi takker Andrew Craig, Eleftherios Avramidis og Hola Adrakey for nyttige diskussioner. Vi takker også to anonyme korrekturlæsere for deres nyttige og konstruktive kommentarer.

Fodnoter

Et bidrag af 16 til et temanummer “Modellering af udbrud af smitsomme sygdomme hos mennesker, dyr og planter: epidemisk forudsigelse og kontrol”.

Elektronisk supplerende materiale er tilgængeligt online på https://dx.doi.org/10.6084/m9.figshare.c.4462796.

Published by the Royal Society. Alle rettigheder forbeholdes.

Universe