Articles / november 15, 2021

Applying optimal control theory to complex epidemiological models to inform real-world disease management

Introductie

Mathematische modellering speelt een steeds belangrijkere rol bij het nemen van beleids- en beheersbeslissingen met betrekking tot binnendringende ziekten . Op modellen gebaseerde identificatie van effectieve en kostenefficiënte bestrijdingsmaatregelen kan echter moeilijk zijn, vooral wanneer de modellen zeer gedetailleerde representaties van ziekteoverdrachtsprocessen omvatten. Er bestaat een waaier van wiskundige hulpmiddelen voor het ontwerpen van optimale strategieën, maar geen standaard om de resultaten van wiskundig gemotiveerde vereenvoudigingen in de praktijk om te zetten. Een open vraag is hoe men voldoende realisme in een model kan inbouwen om nauwkeurige voorspellingen van het effect van bestrijdingsmaatregelen mogelijk te maken, terwijl men er toch voor kan zorgen dat de werkelijk optimale strategie kan worden geïdentificeerd. In dit artikel identificeren we de moeilijkheden – en mogelijke oplossingen – om tot een praktisch bruikbare optimale strategie te komen, waarbij we aan de hand van een eenvoudig voorbeeld de potentiële rol van open-lus en modelvoorspellende controle belichten.

(a) Realistische simulatiemodellen

De optimalisatie van het ziektebeheer houdt in dat de meest geschikte bestrijdingsmethode(n) moet(en) worden bepaald, bv. vaccinatie, quarantaine of roggen, en dat de beste strategie voor die methode of combinatie van methoden moet worden bepaald om de gevolgen van de ziekte tot een minimum te beperken. Dit minimaliseren kan moeilijk zijn wanneer de middelen beperkt zijn en er economische kosten verbonden zijn aan zowel bestrijdingsmaatregelen als de ziekte. Methoden die het verwachte verloop van een epidemie simuleren en de effecten van interventies expliciet modelleren, kunnen het potentiële effect van een bepaalde strategie snel kwantificeren. Deze simulatiemodellen geven de dynamiek van het reële systeem nauwkeurig weer en zijn dan ook belangrijke instrumenten geworden voor de beoordeling van beleidsbeslissingen in verband met onmiddellijke beheersmaatregelen en een grotere paraatheid voor toekomstige bedreigingen. Voorbeelden hiervan zijn het vaccinatiebeleid voor het humaan papillomavirus in het VK, het ruimen van vee en de optimalisatie van vaccinatie voor mond- en klauwzeer, en optimale gastheerverwijderingsstrategieën voor boomziekten van citrusvruchten en plotselinge eikensterfte.

Verschillende complexiteiten van de ziektedynamiek, bijvoorbeeld ruimtelijke heterogeniteiten en inherente individuele verschillen in vatbaarheid en ziekteverwekkersoverdracht (risicostructuur), zijn belangrijke determinanten gebleken van patronen en tempo’s van epidemische verspreiding. Om nauwkeurige epidemievoorspellingen te kunnen doen, moet met deze factoren rekening worden gehouden in simulatiemodellen die zijn ontworpen om de besluitvorming te ondersteunen. De integratie van deze heterogeniteiten resulteert echter meestal in zeer complexe modellen met vele mogelijke bestrijdingsmaatregelen, waardoor optimalisatie rekenkundig niet haalbaar is wanneer interventies kunnen worden gecombineerd, en vooral wanneer de bestrijdingsmaatregelen ook kunnen variëren in de tijd, in de ruimte of naar gelang van het ziekterisico . Voor de meeste simulatiemodellen bestaat de enige haalbare optie er dan in het model te gebruiken om een kleine subset van plausibele strategieën te evalueren die tijdens de epidemie onveranderd blijven, eventueel scannend op één enkele parameter zoals een ruimingsstraal. Wij zullen deze aanpak “strategietests” noemen. Deze aanpak maakt het moeilijk om veel vertrouwen te hebben in de best presterende strategie, aangezien de reeks te testen strategieën waarschijnlijk vertekend is, omdat er geen kader is om die te kiezen. Aangezien de te testen reeks niet de volledige ruimte van bestrijdingsopties kan omvatten, is het bovendien onwaarschijnlijk dat het ware optimum zal worden gevonden.

(b) Optimale beheersing van epidemiologische modellen

Er bestaan vele wiskundige technieken om de ware optimale beheersing van een ziekte te karakteriseren, zoals evenwichts- of eindgrootteanalyse, afhankelijk van het geanalyseerde systeem. Wij richten ons hier op het optimaliseren van tijdsvariërende controle van dynamische systemen, waarvoor optimale controletheorie (OCT) veel gebruikt wordt . Door een reeks vergelijkingen te analyseren die de ziektedynamica beschrijven, kan OCT de optimale inzetstrategie voor een bepaalde controlemethode wiskundig karakteriseren en inzicht verschaffen in de onderliggende dynamica, zonder de herhaalde simulatie die nodig is om simulatiemodellen te optimaliseren. Wegens de onderliggende wiskundige complexiteit kan met OCT echter weinig vooruitgang worden geboekt, tenzij de onderliggende modellen voor de verspreiding van de ziekte sterk vereenvoudigd zijn. De eerste werkzaamheden op het gebied van OCT waren gericht op optimale niveaus van vaccinatie en behandeling, terwijl later ook andere interventies, zoals quarantaine, screening en gezondheidsbevorderende campagnes, in aanmerking zijn genomen. Ziektemodellen kunnen ook worden gekoppeld aan economische effecten en binnen OCT is dit gebruikt om meerdere kosten tegen elkaar af te wegen, zoals bewaking en bestrijding, of profylactische versus reactieve behandeling.

De optimale strategieën die door OCT worden geïdentificeerd kunnen zeer complex zijn, waarbij vaak controles worden gespecificeerd die op specifieke momenten in het verloop van een epidemie van strategie veranderen. De toegevoegde complexiteit van deze omschakelingscontroles kan het ziektebeheer aanzienlijk verbeteren wanneer het wordt getest met een ruimtelijk expliciet model, maar kan tot slechte prestaties leiden als het exacte tijdstip van de omschakeling niet bekend is, bijvoorbeeld wanneer de onzekerheid van de parameters een breed scala van mogelijke omschakeltijden oplevert. Dit toont aan dat onzekerheden en bijkomende complexiteiten vaak verhinderen dat OCT rechtstreeks op de echte wereld kan worden toegepast. Het is ook onduidelijk hoe inzichten uit OCT alleen in praktisch advies kunnen worden omgezet. Om te komen tot robuuste strategieën die in de praktijk kunnen worden toegepast, is in recenter werk de nadruk gelegd op het opnemen van extra kenmerken en heterogeniteiten in de modellen die in OCT worden gebruikt, met name ruimtelijke dynamiek. Ruimte wordt gewoonlijk slechts in beperkte mate meegenomen, bijvoorbeeld door gebruik te maken van metapopulatiemodellen (b.v. ), of partiële differentiaalvergelijkingen (b.v. ) om ruimtelijke strategieën te optimaliseren, zodat het een open vraag blijft of de toegevoegde heterogeniteiten volstaan om robuuste en praktische controlestrategieën te identificeren.

(c) Op weg naar praktische controle

Ondanks het vinden van de mathematisch optimale controlestrategie zijn belangrijke vereenvoudigingen van het gemodelleerde systeem vereist om met behulp van OCT vooruitgang te kunnen boeken. Het is dan ook vaak onduidelijk hoe deze strategieën zouden presteren indien zij door beleidsmakers zouden worden aangenomen. Anderzijds zijn modellen die voldoende realistisch zijn om het beleid rechtstreeks te informeren, vaak onmogelijk volledig te optimaliseren. Daarom is een kader nodig om de optimalisatiemogelijkheden van OCT te combineren met de nauwkeurige voorspellingen van modellen van het simulatietype die bij de beleidsvorming vereist zijn. De vraag is dan hoe we OCT in de praktijk moeten gebruiken

In §2 beschrijven we twee methoden uit de regelsysteemtechniek om OCT-resultaten toe te passen, en vergelijken deze met Strategietesten aan de hand van een eenvoudig illustratief model in §3. We proberen een antwoord te geven op de vraag hoe, onder de huidige computationele beperkingen, resultaten van OCT kunnen worden toegepast met behoud van het realisme dat vereist is voor praktische toepassing.

Toepassing van optimale controle op realistische systemen

Naast de epidemiologie is OCT op grotere schaal toegepast op benaderende modellen van complexe systemen. In een recente studie wordt het gebruik van OCT voor agent-gebaseerde modellen (ABM’s) besproken, een type model dat het individuele gedrag van autonome agenten simuleert. An et al. stellen het gebruik voor van een model dat de dynamica van het ABM benadert en dat eenvoudig genoeg is om een mathematische analyse van de optimale controle mogelijk te maken. Een geschikt benaderingsmodel wordt gekozen en aangepast aan reële gegevens, of aan synthetische gegevens van het ABM. De LGO-resultaten van het benaderingsmodel worden vervolgens op het te testen ABM afgestemd: een proces dat “lifting” wordt genoemd en dat evengoed kan worden toegepast op de gedetailleerde epidemische simulatiemodellen die in dit document in beschouwing worden genomen. We beschrijven nu twee mogelijke raamwerken uit de besturingssysteemengineering om gebruik te maken van deze “control lifting”-aanpak.

(a) Open-loop controle

De eerste methode is de eenvoudigste toepassing van “control lifting”, en het raamwerk dat impliciet wordt voorgesteld door An et al. De besturing wordt eenmaal geoptimaliseerd op het benaderde model met gebruikmaking van de beginvoorwaarden van het simulatiemodel. De resulterende optimale regelstrategie wordt naar de simulator getild en toegepast gedurende de volledige simulatieruntijd (figuur 1). Herhaalde simulatie van de LGO-strategie op het simulatiemodel maakt beoordeling ten opzichte van andere mogelijke regelstrategieën mogelijk. De optimalisatie levert één enkele, tijdsafhankelijke strategie op voor alle simulaties, en bevat dus geen terugkoppeling. Daarom wordt deze strategie “open-loop”-besturing genoemd, aangezien zij volledig wordt bepaald door de beginvoorwaarden van de simulatie en het traject dat door het benaderde model wordt voorspeld. In de epidemiologie wordt deze methode niet vaak gebruikt, hoewel Clarke et al. gebruik maken van OCT in een benaderend model om optimale niveaus te vinden voor chlamydia-screening en contactopsporing, die vervolgens in kaart worden gebracht in een netwerksimulatie.

Figuur 1. Open-loop en modelvoorspellende controle (MPC). De modelhiërarchie wordt getoond, met geoptimaliseerde regelaars uit het benaderingsmodel die rechtstreeks naar het simulatiemodel worden getild. Het reële systeem is in groen, de modellen en aanpassingsprocessen zijn in blauw, en het regelkader is in oranje. Zonder de oranje gestippelde terugkoppellus is dit een open-lus regeling. MPC stelt de toestand van het benaderde model bij regelmatige updatestappen opnieuw in, alvorens het model opnieuw te optimaliseren en de controles tot de volgende updatetijd naar het simulatiemodel over te hevelen.

(b) Model predictive control

Open-loop controle vereist dat het benaderde model nauwkeurig blijft over de tijdschaal van de gehele epidemie. Omwille van de uitvoerbaarheid moet het benaderingsmodel echter vele in het simulatiemodel aanwezige heterogeniteiten, zoals ruimtelijke effecten en risicostructuur, noodzakelijkerwijs weglaten. Wanneer de uit de LGO resulterende strategieën vervolgens op het simulatiemodel of op het reële systeem worden toegepast, zal het ziekteverloop waarschijnlijk systematisch afwijken van het door het benaderingsmodel voorspelde traject. Model predictive control (MPC) is een optimalisatietechniek met systeemfeedback die met dergelijke perturbaties rekening kan houden. Op regelmatige update-tijden worden de waarden van de toestandsvariabelen in het benaderde model opnieuw ingesteld om overeen te komen met die in de simulatie op dat moment. De regeling wordt dan opnieuw geoptimaliseerd en de nieuwe regelstrategie wordt toegepast op de simulatie tot het volgende updatetijdstip. Het benaderingsmodel en het simulatiemodel worden daarom gelijktijdig uitgevoerd, met meerdere optimalisaties per realisatie, om ervoor te zorgen dat het benaderingsmodel en de regelstrategie nauw aansluiten bij elke afzonderlijke simulatierealisatie (figuur 1). Deze meervoudige optimalisaties zijn rekentechnisch kostbaar maar uitvoerbaar, in tegenstelling tot het uitvoeren van optimalisaties op het volledige simulatiemodel.

MPC heeft enige toepassing gevonden in de epidemiologische literatuur, waarvan het merendeel betrekking heeft op de beheersing van medicijntoepassingen voor afzonderlijke individuen en niet zozeer op de beheersing van epidemieën op populatieniveau. Voorbeelden hiervan zijn het vinden van beheersstrategieën voor HIV die bestand zijn tegen meetruis en modelleringsfouten , en beheersing van de insulinetoediening bij diabetespatiënten . Deze studies wijzen op de voordelen van MPC voor robuuste controle, d.w.z. controle die doeltreffend blijft ondanks verstoringen van het systeem. Slechts één studie concentreert zich echter op epidemiebeheersing , en die test de terugkoppelingscontrole niet expliciet op simulaties.

Optimalisatiestrategieën op een illustratief netwerkmodel

(a) Methoden

Om open-loop en MPC voor epidemiebeheersing aan te tonen, gebruiken we een stochastisch SIR-netwerkmodel met gastheerdemografie en risicostructuur. Het model is opzettelijk eenvoudig gehouden om te laten zien dat het onderliggende idee breed toepasbaar is op menselijke, dierlijke en plantaardige ziekten. Hoewel het model en zijn parameters arbitrair zijn en geen specifieke ziekte vertegenwoordigen, gebruiken wij het om een scenario voor te stellen waarin een simulatiemodel reeds is aangepast aan een echt ziektesysteem; het netwerkmodel wordt hier derhalve gebruikt als een benadering van een potentieel zeer gedetailleerd simulatiemodel.

(i) Simulatiemodel

In ons model verspreidt de infectie zich stochastisch over een netwerk van knooppunten die zijn geclusterd in drie verschillende regio’s (figuur 2a). Elk knooppunt bevat een gastheerpopulatie die gestratificeerd is in groepen met een hoog en laag risico. De infectie kan zich verspreiden tussen individuen binnen knooppunten en tussen onderling verbonden knooppunten. De netto-infectiesnelheid van risicogroep r in knooppunt i wordt gegeven door

Sir∑ jσij (ρrHI jH+ρrLI jL),3.1

waarbij S en I respectievelijk het aantal vatbare en geïnfecteerde gastheren zijn, de subscripts het knooppunt aanduiden en de superscripts de hoge (H) of lage (L) risicogroep. De som wordt berekend over alle verbonden knooppunten, met inbegrip van het centrale knooppunt zelf, waarbij de relatieve transmissiesterkte naar knooppunt i vanuit knooppunt j wordt gegeven door σij, en de risicostructuur door de 2 × 2-matrix ρ. De volledige details van het model worden gegeven in het elektronisch aanvullend materiaal, S1. Hoewel het model in vergelijking (3.1) niet beperkt is tot deze toepassingen, zou het ook kunnen worden gebruikt voor gewas- of veeziekten die zich verspreiden over boerderijen, of voor seksueel overdraagbare infecties die zich verspreiden over steden of landen.

Figuur 2. (a) Het netwerk dat is gebruikt voor het illustratieve simulatiemodel, inclusief regiolabels. De epidemie is gezaaid in het rode knooppunt in regio A, en kan zich verspreiden tussen verbonden knooppunten (grijze lijnen). In (b) wordt de besturingstoewijzing getoond voor een enkele MPC-run op basis van de ruimte, met de overeenkomstige open-lus toewijzing aangegeven door de zwarte stippellijn. (c) Het totale aantal besmette individuen bij één enkele run van ruimtegebaseerde open-lusregeling. De regeling is gebaseerd op de voorspelling van het benaderde model uitgaande van de beginvoorwaarden. (d) Het aantal besmette individuen in de simulatie en het op de ruimte gebaseerde benaderingsmodel dat overeenkomt met de in (b) uitgevoerde MPC-regeling. Hier wordt de voorspelling bij elke update-stap (0,5 tijdseenheden) opnieuw ingesteld om overeen te komen met de simulatie en wordt de regeling opnieuw geoptimaliseerd. Door herhaaldelijk te corrigeren voor verschillen tussen de modelvoorspellingen op korte termijn en de gerealiseerde aantallen besmette individuen – in plaats van te vertrouwen op een potentieel steeds onnauwkeuriger voorspelling op het begintijdstip – geeft MPC betere voorspellingen van de simulatietoestand en een betere regeling in vergelijking met open-loop (let op de verschillende y-as schalen). a.u., arbitrary units.

Massavaccinatie is de enige interventie die we overwegen, met de mogelijkheid om te richten op basis van zowel de risicogroep als de regio, maar gerandomiseerd op basis van de infectiestatus van de gastheer (d.w.z. het vaccin wordt aan alle gastheren toegediend, maar is alleen werkzaam bij gevoelige dieren). Met de logistieke en economische beperkingen wordt rekening gehouden door middel van een maximale totale vaccinatiegraad (ηmax) die over risicogroepen en regio’s kan worden verdeeld. Binnen elke groep worden vatbaren gevaccineerd met een snelheid: fηmaxS/N, waarbij f het deel van de controle is dat aan die groep wordt toegewezen, en N de totale groepspopulatie.

De optimale toewijzing van de vaccinatiemiddelen minimaliseert de epidemische kosten J, die de ziektelast van de epidemie voor alle besmette gastheren gedurende de simulatietijd (T) vertegenwoordigen: J=∫t=0TI(t) dt. In verband met de specifieke bestrijding die wij beschouwen en de risico- en ruimtelijke structuren is deze eenvoudige keuze van de doelfunctie alleen gemaakt om onze methoden te illustreren, maar het kader kan onmiddellijk worden gegeneraliseerd naar complexere omgevingen.

(ii) Benaderde modellen

Exhaustieve optimalisatie van de bestrijding met behulp van het simulatiemodel, over ruimte, risicogroep en tijd, is duidelijk zeer rekenintensief. Om na te gaan wat het beste niveau van benadering is, beschouwen wij twee verschillende deterministische benaderingsmodellen van de simulator. Het eerste model is zuiver risicogericht, waarbij alle ruimtelijke informatie buiten beschouwing wordt gelaten en er één bevolkingsgroep met een hoog risico en één met een laag risico overblijft. Dit model is deterministisch en gebaseerd op de veronderstelling dat alle knooppunten ruimtelijk goed met elkaar gemengd zijn. Het tweede benaderingsmodel is complexer, in die zin dat het eveneens deterministisch en risicogestructureerd is, maar daarnaast een eerste benadering van de ruimtelijke structuur van de gastheer omvat door de regionale informatie over de gastheer op te nemen. De ruimtelijke dynamiek wordt wel opgenomen tussen maar niet binnen de drie regio’s om voldoende eenvoud te behouden voor het verkrijgen van optimale controleresultaten, waarbij wordt aangenomen dat de knooppunten ruimtelijk goed gemengd zijn binnen elke regio. Dit zou bijvoorbeeld kunnen betekenen dat de controle op nationaal niveau wordt geoptimaliseerd, maar niet op regionaal niveau. Wij noemen dit model het ruimtelijk benaderingsmodel. Voor elk model wordt een enkele reeks parameters aangepast aan de gegevens van een ensemble van simulatiemodelruns. Vervolgens testen wij welk van de twee benaderingsmodellen het nuttigst is voor de optimalisering van de controle. Volledige details over de benaderingsmodellen, de aanpassings- en optimalisatieprocedures worden gegeven in het elektronisch aanvullend materiaal, S1 en S2.

(iii) Bestrijdingsscenario’s

Wij testen zes verschillende bestrijdingsscenario’s, waarin een vergelijking wordt gemaakt tussen strategiebeproeving van bestrijdingsmaatregelen die uitsluitend op het simulatiemodel zijn gebaseerd (scenario’s 1 en 2) en open-loop en MPC toegepast met gebruikmaking van onze beide benaderingsmodellen (scenario’s 3-6):

(1) ‘Hoog’: uitsluitend personen met een hoog risico vaccineren.
(2) ‘Split’: verdeling van bestrijdingsmiddelen tussen hoog- en laagrisicogroepen op basis van een vooraf uitgevoerde optimalisatie.
(3) ‘Risico-OL’: open-lus-bestrijding met behulp van het op risico gebaseerde benaderingsmodel.
(4) ‘Risico-MPC’: MPC met behulp van het op risico gebaseerde benaderingsmodel.
(5) ‘Space OL’: open-lusbesturing met behulp van het ruimtelijke benaderingsmodel.
(6) ‘Space MPC’: MPC met behulp van het ruimtelijk benaderingsmodel.

De optimale constante toewijzing voor de ‘Split’-strategie werd gevonden door veel simulatiemodelrealisaties uit te voeren voor elk van een reeks partitiewaarden, zoals in , en de waarde te kiezen die de laagste gemiddelde epidemiekosten opleverde (elektronisch aanvullend materiaal, figuur S8). De zes strategieën worden beoordeeld door het simulatiemodel bij elk controlescenario herhaaldelijk uit te voeren.

(b) Resultaten

De OCT-resultaten voor de optimalisatie van de vaccinatiestrategie in het op risico gebaseerde approximatieve model leiden tot de aanvankelijke vaccinatie van alleen personen met een hoog risico, waarna de prioriteiten worden verlegd en de meer bevolkte groep met een laag risico bijna uitsluitend wordt behandeld. De OCT-resultaten van het ruimtelijk benaderingsmodel laten dezelfde omschakeling zien (figuur 2b), maar er zijn ook een aantal ruimtelijke omschakelingen te zien, waardoor de controle de epidemie kan volgen terwijl deze zich door de drie regio’s ontwikkelt (elektronisch aanvullend materiaal, figuur S9). De ruimtelijke strategieën zijn dus veel complexer dan de op risico gebaseerde controles.

Toepassing van de controlescenario’s op het simulatiemodel en vergelijking van de epidemiekosten toont aan dat het inbouwen van meer realisme, zowel door een complexer benaderingsmodel als door het gebruik van MPC, een betere beheersing van de ziekte mogelijk maakt (figuur 3 en elektronisch aanvullend materiaal, figuur S10). Van de constante en louter op simulatie gebaseerde “door de gebruiker gedefinieerde” strategieën is het verdelen van de controle over risicogroepen iets doeltreffender dan alleen vaccinatie van de hoogrisicogroep. De optimale toewijzing aan de hoogrisicogroep in de “Split”-strategie is 63% van de vaccinatiemiddelen, waarbij de rest wordt gebruikt voor het vaccineren van personen met een laag risico, hoewel dit wel gebeurt in een breed minimum van epidemische kosten (elektronisch aanvullend materiaal, figuur S8). Toepassing van de optimalisaties van het op risico gebaseerde approximatieve model op het simulatiemodel geeft een verbetering ten opzichte van een van de “door de gebruiker gedefinieerde” strategieën, hoewel er weinig verschil in epidemische kosten is tussen het open-loop en het MPC-kader (zie hieronder). Door ruimte toe te voegen aan het benaderingsmodel wordt de besturing verder verbeterd, wat leidt tot de laagste epidemische kosten wanneer het ruimtelijke MPC-kader wordt gebruikt.

Figuur 3. Resultaten van verschillende besturingsoptimalisatieschema’s op het illustratieve simulatiemodel. Ruimtelijke MPC presteert het best en laat een verbetering zien ten opzichte van zowel open-loop (OL) als door de gebruiker gedefinieerde strategieën. a.u., arbitrary units.

Het illustratieve model toont de managementverbeteringen die kunnen worden bereikt door OCT te combineren met zowel open-loop als MPC. De belangrijkste resultaten van de OCT-analyses zijn de schakeltijden van de regeling. Het gebruik van de schakeltijden van beide benaderingsmodellen met open-loop besturing geeft lagere epidemiekosten dan de naïef gekozen “door de gebruiker gedefinieerde” strategieën. De terugkoppeling in de MPC-regelaars maakt een verdere verlaging van de epidemische kosten mogelijk. Door de timing van de schakelaars tijdens de epidemie opnieuw te evalueren en eventueel extra schakelaars op te nemen, kan de regeling beter reageren op het exacte traject van de huidige simulatierealisatie (figuur 2b-d). Dit levert een regeling op die robuuster is voor onzekerheid en systematische fouten in het benaderde model, en dus beter presteert op het complexe simulatiemodel.

In de op risico gebaseerde strategieën is er weinig verschil tussen open-loop en MPC. Dit komt doordat de precieze timing van de overschakeling van vaccinatie van de hoog- naar de laagrisicogroep geen significante invloed heeft op de kosten van de epidemie (elektronisch aanvullend materiaal, figuur S11). De tijdstippen waarop de ziekte in de regio’s B en C wordt geïntroduceerd, variëren sterk tussen de simulatieruns (elektronisch aanvullend materiaal, figuur S2). Het potentieel voor extra schakelaars in het ruimtelijk benaderingsmodel geeft de MPC-regelaar meer flexibiliteit om op deze variabiliteit te reageren, en dus vertoont ruimtelijk MPC een aanzienlijke verbetering ten opzichte van open-loop, dat zich niet aan verstoringen kan aanpassen. De prestaties van de regeling hangen nauw samen met de nauwkeurigheid van het benaderde model. In ons voorbeeld is de ruimtelijke dynamiek duidelijk van belang vanwege de timing van de verspreiding tussen regio’s, en dus presteren de beter geïnformeerde controles van het ruimtelijke model beter dan de op risico gebaseerde strategieën.

Discussie

Onze resultaten tonen aan dat de keuze van het benaderingsmodel van invloed is op de prestaties van zowel open-loop- als MPC-strategieën. Hier hebben wij op ad hoc wijze een geschikt benaderingsmodel gevonden, maar een belangrijke uitdaging voor de toekomst is het ontwikkelen van een meer formele methode voor het kiezen van het meest geschikte benaderingsmodel. Een nauwkeuriger model kan betere voorspellingen geven, en dus een regeling die dichter bij het ware optimum ligt, maar eenvoudigere modellen volstaan vaak en de nauwkeurigheid moet worden afgewogen tegen de toegevoegde complexiteit en de optimaliseringsbeperkingen. Een moeilijkheid hierbij is dat het niet altijd duidelijk is waar de grens van wiskundige of computationele haalbaarheid ligt, en dus hoe complex het model in de praktijk kan worden gemaakt. Het is ook moeilijk om op een systematische manier wiskundig vast te stellen welke aspecten van de dynamiek belangrijk zijn om nauwkeurig in beeld te brengen. Deze belangrijke kwestie moet echter worden overwogen, omdat de implicaties rechtstreeks verband houden met toepassingen in de echte wereld.

Praktische ziektebestrijding vereist overzichten van het reële systeem om de toestand van de epidemie te beoordelen. Zowel open-loop als MPC optimaliseren de besturing met behulp van voorspellingen van de toekomstige dynamiek, waardoor zij beide feed-forward controllers zijn. Het benaderende model dat aan deze raamwerken ten grondslag ligt, maakt beter geïnformeerde beslissingen tussen de onderzoeken mogelijk, hetgeen resulteert in een regeling die dichter bij het werkelijke optimum ligt. Nauwkeurige voorspellingen kunnen continue of zeer frequente onderzoeken vermijden, die duur of logistiek uitdagend kunnen zijn. Zoals eerder besproken verbeteren de herhaalde updates in de terugkoppellus van MPC deze voorspellingen en daarmee de prestaties van de regeling. Elke update vereist echter bewaking van het werkelijke systeem, zodat de frequentie van de updates zodanig moet worden gekozen dat een evenwicht wordt gevonden tussen verbeterde kennis van het systeem en eventuele bewakingsbeperkingen.

In dit artikel hebben wij ons geconcentreerd op een top-down benadering, waarbij robuuste, praktisch toepasbare strategieën worden gevonden door gebruik te maken van OCT voor het optimaliseren van simulatiemodellen. In veel studies wordt OCT gebruikt zonder simulatiemodellen en wordt zelden gekeken naar de praktische toepassing van de resulterende optimale controles. Bij deze bottom-up benadering is een systeem voor het testen van de resultaten op realistische systemen van vitaal belang om te verzekeren dat deze resultaten robuust zijn voor extra realisme. Het gebruik van een MPC-kader zoals hier overwogen, zou een manier kunnen zijn waarop OCT-onderzoekers de potentiële impact van hun werk aan een breder publiek kunnen laten zien.

Het uitputtend testen van alternatieve simulatiemodelparameterisaties valt buiten het bestek van deze studie, maar we vinden over het algemeen dat ruimtelijke MPC ook het best presteert bij andere redelijke parametersets (elektronisch aanvullend materiaal, S3). Wij zijn er steeds van uitgegaan dat een nauwkeurig simulatiemodel van het reële systeem in kwestie kan worden gebouwd, en dat een enkele reeks parameters kan worden aangepast voor het gekozen deterministische benaderingsmodel. In werkelijkheid kan er een aanzienlijke onzekerheid bestaan in de parameters voor de simulator, zodat het passen van een enkel deterministisch model een uitdaging kan zijn. Een vraag voor toekomstige studie zou zijn hoe om te gaan met deze onzekerheden, misschien ook het incorporeren van verbeterde kennis van parameters naarmate de simulatie vordert.

De strategieën gevonden door OCT zijn sterk afhankelijk van de exacte vorm van de doelfunctie, die we hier hebben gekozen om zeer eenvoudig te zijn. Uitbreiding van de doelstelling tot de kosten in verband met de controle en met elke verandering van strategie zou een meer gedetailleerde beoordeling van de uitvoerbaarheid van deze complexe strategieën mogelijk maken. Er is meer onderzoek nodig naar de wijze waarop de afweging van zeer verschillende kosten kan worden gekwantificeerd, bijvoorbeeld behandelingskosten en ziektelast. Bij ziekten bij de mens zijn kosten-batenanalyses meestal gebaseerd op voor kwaliteit gecorrigeerde levensjaren . Een soortgelijk concept kan misschien worden gebruikt voor planten- en dierenziekten, met inbegrip van berekeningen van opbrengstverliezen en effecten op bijvoorbeeld welzijn, biodiversiteit en toerisme . De door ons beschreven methoden zijn echter niet afhankelijk van de vorm van de controle- of doelfunctie. Voor een geschikt benaderingsmodel zorgt de terugkoppeling in MPC voor nauwkeurige voorspellingen en zou de prestatie dus altijd beter moeten zijn dan in open-loop. De kaders die we beschrijven kunnen worden gebruikt om een extra, onbevooroordeeld regelscenario te bieden aan het Strategie Testproces dat al algemeen in gebruik is.

In dit artikel hebben we laten zien dat het koppelen van terugkoppeling van controle met simulatiemodellen en LGO kan helpen bij het ontwerpen van effectieve en robuuste interventiestrategieën voor het beheer van ziekteverwekkers van menselijke, dierlijke en plantaardige populaties. Hoewel deze technieken in staat zijn om optimale controleresultaten over te brengen naar meer realistische simulaties en dus naar praktische toepassing, werpen de gevonden strategieën wel de vraag op naar de communiceerbaarheid van de resultaten. Met complexe terugkoppelingsstrategieën tussen twee modellen, waarvan het ene complex van structuur is en het andere wiskundig complex, is het totale resultaat niet langer eenvoudig uit te leggen. Toekomstig onderzoek moet zich daarom richten op het verbeteren van de nauwkeurigheid van simulatiemodellen, en het analyseren van hun betrouwbaarheid, zodat simulaties kunnen worden gebruikt om onomstotelijk het voordeel van deze complexe op OCT gebaseerde strategieën vast te stellen.

Toegankelijkheid van de gegevens

Alle code en animaties zijn beschikbaar op https://github.com/ehbussell/Bussell2018Model.

Bijdragen van de auteurs

Belangen

We hebben geen concurrerende belangen.

Financiering

E.H.B. erkent de Biotechnology and Biological Sciences Research Council of the United Kingdom (BBSRC) voor ondersteuning via een University of Cambridge DTP PhD studentship.

Acknowledgements

Wij danken Andrew Craig, Eleftherios Avramidis en Hola Adrakey voor nuttige discussies. We danken ook twee anonieme reviewers voor hun nuttige en constructieve commentaar.

Footnotes

Een bijdrage van 16 aan een themanummer ‘Modelling infectious disease outbreaks in humans, animals and plants: epidemic forecasting and control’.

Elektronisch aanvullend materiaal is online beschikbaar op https://dx.doi.org/10.6084/m9.figshare.c.4462796.

Universe