Anwendung der optimalen Kontrolltheorie auf komplexe epidemiologische Modelle zur Information über das Management von Krankheiten in der realen Welt

Einführung

Mathematische Modellierung spielt eine immer wichtigere Rolle bei der Information über politische und Managemententscheidungen in Bezug auf eindringende Krankheiten. Die modellgestützte Ermittlung wirksamer und kosteneffizienter Kontrollmaßnahmen kann jedoch schwierig sein, insbesondere wenn die Modelle sehr detaillierte Darstellungen von Krankheitsübertragungsprozessen enthalten. Es gibt eine Reihe von mathematischen Werkzeugen für die Entwicklung optimaler Strategien, aber keinen Standard für die Umsetzung der Ergebnisse aus mathematisch motivierten Vereinfachungen in die Praxis. Eine offene Frage ist, wie man ein Modell so realistisch gestalten kann, dass es genaue Vorhersagen über die Auswirkungen von Bekämpfungsmaßnahmen ermöglicht und gleichzeitig sicherstellt, dass die wirklich optimale Strategie ermittelt werden kann. In diesem Beitrag werden die Schwierigkeiten – sowie mögliche Lösungen – beim Erreichen einer praktisch nützlichen optimalen Strategie aufgezeigt, wobei die potenzielle Rolle der offenen Regelkreise und der modellprädiktiven Steuerung anhand eines einfachen Beispiels hervorgehoben wird.

(a) Realistische Simulationsmodelle

Die Optimierung des Seuchenmanagements beinhaltet die Bestimmung der am besten geeigneten Bekämpfungsmethode(n), z. B. Impfung, Quarantäne oder Schikanierung, und der besten Einsatzstrategie für diese Methode oder Kombination von Methoden, um die Auswirkungen der Seuche zu minimieren. Diese Minimierung kann schwierig sein, wenn die Ressourcen begrenzt sind und sowohl mit den Bekämpfungsmaßnahmen als auch mit der Krankheit wirtschaftliche Kosten verbunden sind. Methoden, die den erwarteten Verlauf einer Epidemie simulieren und die Auswirkungen von Maßnahmen explizit modellieren, können die potenziellen Auswirkungen einer bestimmten Strategie schnell quantifizieren. Diese Simulationsmodelle geben die Dynamik des realen Systems genau wieder und sind daher zu wichtigen Instrumenten für die Bewertung politischer Entscheidungen geworden, die sowohl Echtzeitmaßnahmen als auch eine bessere Vorbereitung auf künftige Bedrohungen betreffen. Zu den Beispielen gehören Impfstrategien für das humane Papillomavirus im Vereinigten Königreich, Strategien zur Keulung von Viehbeständen und zur Optimierung der Impfung gegen die Maul- und Klauenseuche sowie optimale Strategien zur Beseitigung von Wirten für die Baumkrankheiten Zitrusfrüchte und plötzlicher Eichentod.

Es hat sich gezeigt, dass verschiedene komplexe Aspekte der Krankheitsdynamik, z. B. räumliche Heterogenitäten und inhärente individuelle Unterschiede bei der Anfälligkeit und der Übertragung von Krankheitserregern (Risikostruktur), wichtige Determinanten der Muster und Raten der epidemischen Ausbreitung sind. Um genaue Epidemievorhersagen zu gewährleisten, müssen diese Faktoren in Simulationsmodelle einbezogen werden, die als Entscheidungshilfe dienen sollen. Die Einbeziehung dieser Heterogenitäten führt jedoch in der Regel zu hochkomplexen Modellen mit vielen möglichen Kontrollmaßnahmen, was eine Optimierung rechnerisch undurchführbar macht, wenn Interventionen kombiniert werden können und insbesondere, wenn Kontrollmaßnahmen auch zeitlich, räumlich oder je nach Krankheitsrisiko variieren können. Für die meisten Simulationsmodelle besteht die einzige praktikable Option darin, das Modell zur Bewertung einer kleinen Teilmenge plausibler Strategien zu verwenden, die während der Epidemie unverändert bleiben, wobei möglicherweise ein einzelner Parameter wie der Keulungsradius überprüft wird. Wir bezeichnen diesen Ansatz als „Strategieprüfung“. Bei diesem Ansatz ist es schwierig, ein hohes Maß an Vertrauen in die beste Strategie zu haben, da es keinen Rahmen für die Auswahl dieser Strategie gibt und die Menge der zu testenden Strategien wahrscheinlich verzerrt ist. Da die zu testende Menge nicht den gesamten Raum der Kontrollmöglichkeiten abdecken kann, ist es außerdem unwahrscheinlich, dass das wahre Optimum gefunden wird.

(b) Optimale Kontrolle epidemiologischer Modelle

Es gibt viele mathematische Techniken, um die wahre optimale Kontrolle für eine Krankheit zu charakterisieren, wie z.B. die Gleichgewichts- oder Endgrößenanalyse, je nach dem analysierten System. Wir konzentrieren uns hier auf die Optimierung der zeitvariablen Steuerung dynamischer Systeme, für die die optimale Kontrolltheorie (OCT) weit verbreitet ist. Durch die Analyse einer Reihe von Gleichungen, die die Krankheitsdynamik beschreiben, kann die OCT die optimale Einsatzstrategie für eine bestimmte Kontrollmethode mathematisch charakterisieren und einen Einblick in die zugrundeliegende Dynamik geben, ohne die wiederholte Simulation, die zur Optimierung von Simulationsmodellen erforderlich ist. Aufgrund der zugrundeliegenden mathematischen Komplexität können mit der OCT jedoch nur geringe Fortschritte erzielt werden, wenn die zugrundeliegenden Modelle für die Krankheitsausbreitung stark vereinfacht werden. Frühe Arbeiten im Bereich der OCT konzentrierten sich auf optimale Impf- und Behandlungsniveaus, wobei später Erweiterungen zur Berücksichtigung weiterer Interventionen wie Quarantäne, Screening und Gesundheitsförderungskampagnen hinzukamen. Krankheitsmodelle können auch mit ökonomischen Effekten gekoppelt werden, und im Rahmen der OCT wurde dies genutzt, um mehrere Kosten abzuwägen, z. B. Überwachung und Kontrolle oder prophylaktische gegenüber reaktiven Behandlungen.

Die von der OCT ermittelten optimalen Strategien können sehr komplex sein, da sie oft Kontrollen vorgeben, die zu bestimmten Zeitpunkten im Verlauf einer Epidemie die Strategien wechseln. Die zusätzliche Komplexität dieser Umschaltkontrollen kann das Krankheitsmanagement deutlich verbessern, wenn sie an einem räumlich expliziten Modell getestet werden, kann aber zu einer schlechten Leistung führen, wenn der genaue Zeitpunkt der Umschaltung nicht bekannt ist, z. B. wenn die Ungewissheit der Parameter eine große Bandbreite möglicher Umschaltzeitpunkte ergibt. Dies zeigt, dass die OCT aufgrund von Unsicherheiten und zusätzlicher Komplexität oft nicht direkt auf die reale Welt anwendbar ist. Es ist auch unklar, wie die Erkenntnisse der OCT allein in praktische Ratschläge umgesetzt werden können. Um zu robusten Strategien zu gelangen, die in der Praxis eingesetzt werden können, haben sich neuere Arbeiten darauf konzentriert, zusätzliche Merkmale und Heterogenitäten in die in der ÜLG verwendeten Modelle einzubeziehen, insbesondere die räumliche Dynamik. Der Raum wird in der Regel nur in begrenztem Umfang einbezogen, z. B. durch die Verwendung von Metapopulationsmodellen (z. B. ) oder partiellen Differentialgleichungen (z. B. ) zur Optimierung räumlicher Strategien, so dass die Frage offen bleibt, ob die hinzugefügten Heterogenitäten ausreichen, um robuste und praktische Kontrollstrategien zu ermitteln.

(c) Auf dem Weg zur praktischen Kontrolle

Trotz der Suche nach der mathematisch optimalen Kontrollstrategie sind erhebliche Vereinfachungen des modellierten Systems erforderlich, um mit der ÜLG Fortschritte zu erzielen. Es ist daher oft unklar, wie diese Strategien funktionieren würden, wenn sie von politischen Entscheidungsträgern übernommen würden. Andererseits lassen sich Modelle, die realistisch genug sind, um die Politik direkt zu informieren, oft nicht vollständig optimieren. Daher wird ein Rahmen benötigt, der die Optimierungsfähigkeiten der OCT mit den genauen Vorhersagen von Simulationsmodellen kombiniert, wie sie für die Politikgestaltung erforderlich sind. Die Frage ist also, wie wir die OCT in der Praxis nutzen können?

In §2 beschreiben wir zwei Methoden aus der Kontrollsystemtechnik für die Anwendung von OCT-Ergebnissen und vergleichen diese in §3 mit Strategietests anhand eines einfachen illustrativen Modells. Wir versuchen zu beantworten, wie die Ergebnisse der OCT unter den gegenwärtigen Rechenbeschränkungen angewendet werden können, ohne den für die praktische Anwendung erforderlichen Realismus zu verlieren.

Anwendung optimaler Steuerung auf realistische Systeme

Außerhalb der Epidemiologie hat die OCT eine breitere Anwendung auf approximative Modelle komplexer Systeme gefunden. Eine neuere Studie untersucht die Verwendung von OCT für agentenbasierte Modelle (ABM), eine Art von Modell, das das individuelle Verhalten autonomer Agenten simuliert. An et al. schlagen die Verwendung eines Modells vor, das die Dynamik des ABM annähert und so einfach gestaltet ist, dass eine mathematische Analyse der optimalen Steuerung möglich ist. Ein geeignetes Näherungsmodell wird ausgewählt und entweder an reale Daten oder an synthetische Daten aus der ABM angepasst. Die ÜLG-Ergebnisse des Näherungsmodells werden dann auf das zu prüfende ABM übertragen: ein Prozess, der als „Lifting“ bezeichnet wird und ebenso gut auf die in dieser Arbeit betrachteten detaillierten Epidemie-Simulationsmodelle angewendet werden könnte. Wir beschreiben nun zwei mögliche Rahmenwerke aus der Regelungstechnik für die Nutzung dieses Steuerungs-Lifting-Ansatzes.

(a) Steuerung mit offenem Regelkreis

Die erste Methode ist die einfachste Anwendung des Steuerungs-Lifting und das von An et al. implizit vorgeschlagene Rahmenwerk. Die Regelung wird am approximativen Modell einmal unter Verwendung der Anfangsbedingungen des Simulationsmodells optimiert. Die sich daraus ergebende optimale Steuerungsstrategie wird auf den Simulator übertragen und für die gesamte Simulationslaufzeit angewendet (Abbildung 1). Die wiederholte Simulation der OCT-Strategie auf dem Simulationsmodell ermöglicht eine Bewertung im Vergleich zu anderen möglichen Kontrollstrategien. Die Optimierung ergibt eine einzige, zeitabhängige Strategie für alle Simulationsrealisierungen und beinhaltet daher keine Rückkopplung. Sie wird daher als „Open-Loop“-Steuerung bezeichnet, da sie vollständig durch die Anfangsbedingungen der Simulation und die durch das Näherungsmodell vorhergesagte Trajektorie spezifiziert ist. Die Verwendung in der Epidemiologie ist unüblich, obwohl Clarke et al. OCT in einem Näherungsmodell verwenden, um optimale Niveaus für Chlamydien-Screening und Kontaktverfolgung zu finden, die dann auf eine Netzwerksimulation abgebildet werden.

Abbildung 1. Offener Regelkreis und modellprädiktive Steuerung (MPC). Dargestellt ist die Modellhierarchie, wobei optimierte Steuerungen aus dem Näherungsmodell direkt auf das Simulationsmodell übertragen werden. Das reale System ist grün, die Modelle und Anpassungsprozesse sind blau und der Regelungsrahmen ist orange dargestellt. Ohne die orange gestrichelte Rückkopplungsschleife handelt es sich um einen offenen Regelkreis. Bei der MPC wird der Zustand des approximativen Modells in regelmäßigen Aktualisierungsschritten zurückgesetzt, bevor eine erneute Optimierung erfolgt und die Steuerung bis zum nächsten Aktualisierungszeitpunkt auf das Simulationsmodell übertragen wird.

(b) Modellprädiktive Steuerung

Die Steuerung mit offenem Regelkreis erfordert, dass das approximative Modell über die gesamte Zeitskala der Epidemie hinweg genau bleibt. Aus Gründen der Nachvollziehbarkeit muss das Näherungsmodell jedoch notwendigerweise viele im Simulationsmodell vorhandene Heterogenitäten, wie räumliche Effekte und Risikostruktur, ausklammern. Wenn die aus der OCT resultierenden Strategien dann auf das Simulationsmodell oder das reale System angewandt werden, weicht der Krankheitsverlauf wahrscheinlich systematisch von der durch das approximative Modell vorhergesagten Trajektorie ab. Die modellprädiktive Steuerung (MPC) ist eine Optimierungstechnik mit Systemrückkopplung, die derartige Störungen berücksichtigen kann. Zu regelmäßigen Aktualisierungszeitpunkten werden die Werte der Zustandsvariablen im Näherungsmodell so zurückgesetzt, dass sie mit denen der Simulation zu diesem Zeitpunkt übereinstimmen. Die Regelung wird dann erneut optimiert, und die neue Regelstrategie wird bis zum nächsten Aktualisierungszeitpunkt auf die Simulation angewendet. Das Näherungsmodell und das Simulationsmodell werden daher gleichzeitig ausgeführt, mit mehreren Optimierungen pro Realisierung, um sicherzustellen, dass das Näherungsmodell und die Regelungsstrategie mit jeder einzelnen Simulationsrealisierung genau übereinstimmen (Abbildung 1). Diese mehrfachen Optimierungen sind rechenintensiv, aber überschaubar, im Gegensatz zur Optimierung des vollständigen Simulationsmodells.

MPC wurde in der epidemiologischen Literatur bereits in gewissem Umfang eingesetzt, wobei die meisten Anwendungen eher der Kontrolle von Arzneimittelanwendungen für einzelne Personen als der Kontrolle von Epidemien auf Bevölkerungsebene dienten. Beispiele hierfür sind die Suche nach Managementstrategien für HIV, die gegenüber Messrauschen und Modellierungsfehlern robust sind, und die Kontrolle der Insulinabgabe bei Diabetespatienten. Diese Studien verdeutlichen die Vorteile der MPC für eine robuste Steuerung, d. h. eine Steuerung, die trotz Störungen im System wirksam bleibt. Allerdings konzentriert sich nur eine Studie auf das Management von Epidemien, und in dieser Studie wird die Rückkopplungssteuerung nicht explizit anhand von Simulationen getestet.

Optimierungsstrategien an einem illustrativen Netzwerkmodell

(a) Methoden

Um Open-Loop und MPC für das Management von Epidemien zu demonstrieren, verwenden wir ein stochastisches SIR-Netzwerkmodell mit Wirtsdemographie und Risikostruktur. Das Modell ist absichtlich einfach gehalten, um zu zeigen, dass die zugrundeliegende Idee bei menschlichen, tierischen und pflanzlichen Krankheiten weithin anwendbar ist. Während das Modell und seine Parameter willkürlich sind und keine spezifische Krankheit darstellen, verwenden wir es, um ein Szenario darzustellen, in dem ein Simulationsmodell bereits an ein reales Krankheitssystem angepasst wurde; das Netzwerkmodell wird daher hier als Stellvertreter für ein potenziell sehr detailliertes Simulationsmodell verwendet.

(i) Simulationsmodell

In unserem Modell breitet sich die Infektion stochastisch über ein Netzwerk von Knotenpunkten aus, die in drei verschiedenen Regionen zusammengefasst sind (Abbildung 2a). Jeder Knoten enthält eine in Hoch- und Niedrigrisikogruppen geschichtete Wirtspopulation. Die Infektion kann sich zwischen Individuen innerhalb von Knoten und zwischen verbundenen Knoten ausbreiten. Die Netto-Infektionsrate der Risikogruppe r im Knoten i ist gegeben durch

Sir∑ jσij (ρrHI jH+ρrLI jL),3.1

wobei S und I die Anzahl der empfänglichen bzw. infizierten Wirte sind, die tiefgestellten Indizes den Knoten bezeichnen und die hochgestellten Indizes die Hoch- (H) oder Niedrigrisikogruppe (L) angeben. Die Summe bezieht sich auf alle angeschlossenen Knoten, einschließlich des Schwerpunktknotens selbst, wobei die relative Übertragungsstärke von Knoten i zu Knoten j durch σij und die Risikostruktur durch die 2 × 2-Matrix ρ gegeben ist. Alle Einzelheiten des Modells sind im elektronischen Zusatzmaterial S1 enthalten. Obwohl das Modell in Gleichung (3.1) nicht auf diese Anwendungen beschränkt ist, könnte es auch die Ausbreitung von Ernte- oder Viehkrankheiten in landwirtschaftlichen Betrieben oder die Ausbreitung von sexuell übertragbaren Infektionen in Städten oder Ländern darstellen.

Abbildung 2. (a) Das für das illustrative Simulationsmodell verwendete Netzwerk, einschließlich der Bezeichnungen der Regionen. Die Epidemie wird im roten Knoten in Region A gekeimt und kann sich zwischen verbundenen Knoten (graue Linien) ausbreiten. In (b) ist die Kontrollzuweisung für einen einzelnen raumbasierten MPC-Lauf dargestellt, wobei die entsprechende Open-Loop-Zuweisung durch die schwarze gepunktete Linie angezeigt wird. (c) Die Gesamtzahl der infizierten Individuen bei einem einzigen Durchlauf der raumbezogenen Steuerung. Die Steuerung basiert auf der Vorhersage des Näherungsmodells ausgehend von den Anfangsbedingungen. (d) Die Anzahl der infizierten Individuen in der Simulation und im raumbasierten Näherungsmodell entsprechend der in (b) durchgeführten MPC-Regelung. Hier wird die Vorhersage bei jedem Aktualisierungsschritt (0,5 Zeiteinheiten) auf die Simulation zurückgesetzt und die Steuerung erneut optimiert. Durch die wiederholte Korrektur von Unterschieden zwischen den kurzfristigen Modellvorhersagen und der tatsächlichen Anzahl infizierter Individuen – anstatt sich auf eine potenziell zunehmend ungenaue Vorhersage zum Anfangszeitpunkt zu verlassen – liefert MPC bessere Vorhersagen des Simulationszustands sowie eine verbesserte Steuerung im Vergleich zum offenen Regelkreis (beachten Sie die unterschiedlichen Skalen der y-Achse). a.u., beliebige Einheiten.

Die Massenimpfung ist die einzige Intervention, die wir in Betracht ziehen, mit dem Potenzial, sowohl nach Risikogruppe als auch nach Region zu zielen, aber randomisiert nach dem Infektionsstatus des Wirts (d. h. der Impfstoff wird allen Wirten verabreicht, ist aber nur bei empfänglichen Personen wirksam). Logistische und wirtschaftliche Beschränkungen werden durch eine maximale Gesamtimpfquote (ηmax) berücksichtigt, die auf Risikogruppen und Regionen aufgeteilt werden kann. Innerhalb jeder Gruppe werden die Anfälligen mit einer Rate von fηmaxS/N geimpft, wobei f der Anteil der dieser Gruppe zugewiesenen Kontrolle und N die Gesamtpopulation der Gruppe ist.

Die optimale Zuteilung der Impfressourcen minimiert die epidemischen Kosten J, die die Krankheitslast der Epidemie über alle infizierten Wirte während der Simulationszeit (T) darstellen: J=∫t=0TI(t) dt. Im Zusammenhang mit der von uns betrachteten Kontrolle und den Risiko- und Raumstrukturen wurde diese einfache Zielfunktion nur zur Veranschaulichung unserer Methoden gewählt, aber der Rahmen lässt sich sofort auf komplexere Bedingungen verallgemeinern.

(ii) Näherungsmodelle

Eine vollständige Optimierung der Kontrolle unter Verwendung des Simulationsmodells über Raum, Risikogruppe und Zeit ist eindeutig sehr rechenintensiv. Um den besten Grad der Annäherung zu ermitteln, betrachten wir zwei verschiedene deterministische Näherungsmodelle des Simulators. Das erste Modell ist rein risikostrukturiert, wobei alle räumlichen Informationen ausgeklammert werden und eine Bevölkerungsgruppe mit hohem und eine mit niedrigem Risiko übrig bleibt. Dieses Modell ist deterministisch und basiert auf der Annahme, dass alle Knotenpunkte räumlich gut miteinander vermischt sind. Das zweite Näherungsmodell ist insofern komplexer, als es ebenfalls deterministisch und risikostrukturiert ist, aber zusätzlich eine erste Annäherung an die räumliche Struktur der Wirte durch Einbeziehung der regionalen Wirtsinformationen enthält. Die räumliche Dynamik wird zwischen, aber nicht innerhalb der drei Regionen einbezogen, um eine ausreichende Einfachheit zu wahren und optimale Steuerungsergebnisse zu erzielen, wobei davon ausgegangen wird, dass die Knoten innerhalb jeder Region räumlich gut gemischt sind. Dies könnte z. B. bedeuten, dass die Kontrolle auf Landesebene, nicht aber auf regionaler Ebene optimiert wird. Wir bezeichnen dieses Modell als das räumliche Näherungsmodell. Für jedes Modell wird ein einziger Satz von Parametern an die Daten aus einem Ensemble von Simulationsmodellläufen angepasst. Anschließend wird getestet, welches der beiden approximativen Modelle für die Optimierung der Steuerung nützlicher ist. Alle Einzelheiten zu den Näherungsmodellen, der Anpassung und den Optimierungsverfahren sind im elektronischen Zusatzmaterial S1 und S2 enthalten.

(iii) Kontrollszenarien

Wir testen sechs verschiedene Kontrollszenarien, in denen wir die Strategieprüfung von Kontrollen auf der Grundlage des reinen Simulationsmodells (Szenarien 1 und 2) mit Open-Loop und MPC unter Verwendung unserer beiden approximativen Modelle (Szenarien 3-6) vergleichen:

  • (1) „Hoch“: ausschließlich Impfung von Hochrisikopersonen.

  • (2) ‚Split‘: Aufteilung der Kontrollressourcen zwischen Gruppen mit hohem und niedrigem Risiko auf der Grundlage einer im Voraus durchgeführten Optimierung.

  • (3) ‚Risiko OL‘: Steuerung mit dem risikobasierten Näherungsmodell.

  • (4) ‚Risiko MPC‘: MPC unter Verwendung des risikobasierten Näherungsmodells.

  • (5) ‚Space OL‘: Steuerung unter Verwendung des räumlichen Näherungsmodells.

  • (6) ‚Space MPC‘: MPC unter Verwendung des räumlichen Näherungsmodells.

Die optimale Konstantenzuweisung für die „Split“-Strategie wurde gefunden, indem viele Simulationsmodell-Realisierungen für jeden einer Reihe von Partitionswerten, wie in , durchgeführt wurden und der Wert ausgewählt wurde, der die niedrigsten durchschnittlichen Epidemiekosten ergab (elektronisches Zusatzmaterial, Abbildung S8). Die sechs Strategien werden durch wiederholte Ausführung des Simulationsmodells unter jedem Kontrollszenario bewertet.

(b) Ergebnisse

Die OCT-Ergebnisse für die Optimierung der Impfstrategie im risikobasierten Näherungsmodell führen dazu, dass zunächst nur Hochrisikopersonen geimpft werden, bevor die Prioritäten umgestellt werden und die bevölkerungsreichere Niedrigrisikogruppe fast ausschließlich behandelt wird. Die OCT-Ergebnisse des räumlichen Näherungsmodells zeigen dieselbe Umstellung (Abbildung 2b), aber es sind auch eine Reihe räumlicher Umstellungen zu sehen, die es ermöglichen, die Epidemie auf ihrem Weg durch die drei Regionen zu verfolgen (elektronisches Zusatzmaterial, Abbildung S9). Die räumlichen Strategien sind daher viel komplexer als die risikobasierten Kontrollen.

Die Anwendung der Kontrollszenarien auf das Simulationsmodell und der Vergleich der Epidemiekosten zeigt, dass die Einbeziehung eines größeren Realismus durch ein komplexeres Näherungsmodell sowie durch die Verwendung von MPC ein besseres Krankheitsmanagement ermöglicht (Abbildung 3 und elektronisches Zusatzmaterial, Abbildung S10). Von den konstanten und rein simulationsbasierten „benutzerdefinierten“ Strategien ist die Aufteilung der Kontrolle auf die Risikogruppen etwas effektiver als die Impfung der Hochrisikogruppe. Die optimale Zuteilung an die Hochrisikogruppe, die in der „Split“-Strategie verwendet wird, beläuft sich auf 63 % der Impfressourcen, während der Rest für die Impfung von Personen mit geringem Risiko verwendet wird, obwohl dies bei einem breiten Minimum an epidemischen Kosten geschieht (elektronisches Zusatzmaterial, Abbildung S8). Die Anwendung der Optimierungen aus dem risikobasierten Näherungsmodell auf das Simulationsmodell führt zu einer Verbesserung gegenüber den beiden „benutzerdefinierten“ Strategien, obwohl es bei den Epidemiekosten kaum einen Unterschied zwischen dem Open-Loop- und dem MPC-Modell gibt (siehe unten). Die Hinzufügung von Raum in das Näherungsmodell verbessert die Steuerung weiter und führt zu den geringsten epidemischen Kosten, wenn der räumliche MPC-Rahmen verwendet wird.

Abbildung 3. Ergebnisse der verschiedenen Optimierungsverfahren für die Steuerung im illustrativen Simulationsmodell. Spatial MPC schneidet am besten ab und zeigt eine Verbesserung sowohl gegenüber Open-Loop (OL) als auch gegenüber benutzerdefinierten Strategien. a.u., beliebige Einheiten.

Das illustrative Modell zeigt die Managementverbesserungen, die durch die Kombination von OCT mit sowohl Open-Loop als auch MPC erreicht werden können. Die wichtigsten Ergebnisse der OCT-Analysen sind die Schaltzeiten der Steuerung. Die Verwendung der Schaltsteuerungen aus einem der beiden Näherungsmodelle mit Steuerung führt zu niedrigeren Epidemiekosten als die naiv gewählten „benutzerdefinierten“ Strategien. Die in den MPC-Reglern vorhandene Rückkopplung ermöglicht eine weitere Senkung der Epidemiekosten. Durch die Neubewertung des Zeitpunkts der Umschaltungen während der Epidemie und die mögliche Einbeziehung zusätzlicher Umschaltungen kann die Steuerung genauer auf die genaue Trajektorie der aktuellen Simulationsrealisierung reagieren (Abbildung 2b-d). Dies führt zu einer Steuerung, die robuster gegenüber Unsicherheiten und systematischen Fehlern im Näherungsmodell ist und daher bei dem komplexen Simulationsmodell besser funktioniert.

Bei den risikobasierten Strategien gibt es kaum einen Unterschied zwischen Open-Loop und MPC. Dies liegt daran, dass der genaue Zeitpunkt des Wechsels von der Impfung der Hoch- zur Niedrigrisikogruppe die Epidemiekosten nicht wesentlich beeinflusst (elektronisches Zusatzmaterial, Abbildung S11). Die Zeitpunkte der Krankheitseinschleppung in die Regionen B und C sind zwischen den Simulationsläufen sehr variabel (elektronisches Zusatzmaterial, Abbildung S2). Das Potenzial für zusätzliche Schalter im räumlichen Näherungsmodell gibt dem MPC-Regler mehr Flexibilität, um auf diese Variabilität zu reagieren, und so zeigt die räumliche MPC eine deutliche Verbesserung gegenüber der offenen Schleife, die sich nicht an Störungen anpassen kann. Die Leistung der Steuerung ist eng mit der Genauigkeit des Näherungsmodells verbunden. In unserem Beispiel ist die räumliche Dynamik wegen des Zeitpunkts der Ausbreitung zwischen den Regionen eindeutig von Bedeutung, so dass die besser informierten Kontrollen des räumlichen Modells die risikobasierten Strategien übertreffen.

Diskussion

Unsere Ergebnisse zeigen, dass die Wahl des Näherungsmodells die Leistung sowohl der Open-Loop- als auch der MPC-Strategien beeinflusst. Hier haben wir ad hoc ein geeignetes Näherungsmodell gefunden, aber eine wichtige Herausforderung für die Zukunft ist die Entwicklung einer formaleren Methode für die Auswahl des am besten geeigneten Näherungsmodells. Ein genaueres Modell kann zu besseren Vorhersagen und damit zu einer Steuerung führen, die näher am wahren Optimum liegt, aber einfachere Modelle sind oft ausreichend, und die Genauigkeit muss mit der zusätzlichen Komplexität und den Optimierungseinschränkungen in Einklang gebracht werden. Eine Schwierigkeit dabei ist, dass nicht immer klar ist, wo die Grenze der mathematischen oder rechnerischen Machbarkeit liegt und wie komplex das Modell in der Praxis werden kann. Es ist auch schwierig, mathematisch und systematisch zu bestimmen, welche Aspekte der Dynamik wichtig sind, um sie genau zu erfassen. Diese Schlüsselfrage muss jedoch berücksichtigt werden, da sich die Auswirkungen direkt auf Anwendungen in der realen Welt beziehen.

Die praktische Krankheitsbekämpfung erfordert Erhebungen des realen Systems, um den Zustand der Epidemie zu bewerten. Sowohl Open-Loop als auch MPC optimieren die Steuerung anhand von Vorhersagen über die künftige Dynamik, so dass sie beide Feed-Forward-Controller sind. Das diesen Rahmenwerken zugrunde liegende Näherungsmodell ermöglicht fundiertere Entscheidungen zwischen den Erhebungen, was zu einer Steuerung führt, die näher am wahren Optimum liegt. Durch genaue Vorhersagen können kontinuierliche oder sehr häufige Erhebungen, die teuer oder logistisch schwierig sein können, vermieden werden. Wie bereits erwähnt, verbessern die wiederholten Aktualisierungen in der Rückkopplungsschleife der MPC diese Vorhersagen und damit die Leistung der Steuerung. Jede Aktualisierung erfordert jedoch eine Überwachung des realen Systems, so dass die Häufigkeit der Aktualisierungen so gewählt werden muss, dass ein Gleichgewicht zwischen der verbesserten Kenntnis des Systems und etwaigen Überwachungseinschränkungen hergestellt wird.

In dieser Arbeit haben wir uns auf einen Top-Down-Ansatz konzentriert und robuste, praktisch anwendbare Strategien gefunden, indem wir OCT zur Optimierung von Simulationsmodellen eingesetzt haben. Ebenso verwenden viele Studien OCT ohne Simulationsmodelle und berücksichtigen nur selten die praktische Anwendung der daraus resultierenden optimalen Kontrollen. Bei diesem Bottom-up-Ansatz ist ein System zum Testen der Ergebnisse an realistischen Systemen von entscheidender Bedeutung, um sicherzustellen, dass diese Ergebnisse robust und realitätsnah sind. Die Verwendung eines MPC-Rahmens, wie er hier in Betracht gezogen wird, könnte eine Möglichkeit sein, mit der ÜLG-Forscher die potenziellen Auswirkungen ihrer Arbeit einem breiteren Publikum demonstrieren könnten.

Eine umfassende Prüfung alternativer Simulationsmodell-Parametrisierungen würde den Rahmen dieser Studie sprengen, aber wir stellen allgemein fest, dass die räumliche MPC auch bei anderen vernünftigen Parametersätzen am besten abschneidet (elektronisches Zusatzmaterial, S3). Wir haben durchgehend angenommen, dass ein genaues Simulationsmodell des betreffenden realen Systems erstellt werden kann und dass ein einziger Parametersatz für das gewählte deterministische Näherungsmodell angepasst werden kann. In der Realität können die Parameter des Simulators mit erheblichen Unsicherheiten behaftet sein, so dass die Anpassung eines einzigen deterministischen Modells eine Herausforderung darstellen kann. Eine Frage für zukünftige Studien wäre, wie man mit diesen Unsicherheiten umgehen kann, vielleicht auch unter Einbeziehung einer verbesserten Kenntnis der Parameter im Laufe der Simulation.

Die von OCT gefundenen Strategien hängen stark von der genauen Form der Zielfunktion ab, die wir hier sehr einfach gewählt haben. Eine Erweiterung der Zielfunktion um die Kosten, die mit der Kontrolle sowie mit jedem Strategiewechsel verbunden sind, würde eine detailliertere Bewertung der Praktikabilität der Umsetzung dieser komplexen Strategien ermöglichen. Es muss noch weiter erforscht werden, wie die Ausgewogenheit der sehr unterschiedlichen Kosten, z. B. der Behandlungskosten und der Krankheitslast, quantifiziert werden kann. Bei menschlichen Krankheiten basieren Kostenwirksamkeitsanalysen in der Regel auf qualitätsbereinigten Lebensjahren. Ein ähnliches Konzept könnte vielleicht auch für Pflanzen- und Tierkrankheiten verwendet werden, einschließlich Berechnungen der Ertragsverluste sowie der Auswirkungen auf das Wohlergehen, die biologische Vielfalt und den Tourismus, zum Beispiel. Die von uns beschriebenen Methoden sind jedoch nicht von der Form der Kontroll- oder Zielfunktion abhängig. Für ein geeignetes Näherungsmodell gewährleistet die Rückkopplung in der MPC genaue Vorhersagen und sollte daher immer die Leistung gegenüber dem offenen Regelkreis verbessern. Das von uns beschriebene Rahmenwerk kann verwendet werden, um ein zusätzliches, unvoreingenommenes Kontrollszenario zu dem bereits gebräuchlichen Strategietestverfahren bereitzustellen.

In diesem Beitrag haben wir gezeigt, dass die Kopplung der Rückkopplungssteuerung mit Simulationsmodellen und OCT dazu beitragen kann, wirksame und robuste Interventionsstrategien für das Management von Krankheitserregern in menschlichen, tierischen und pflanzlichen Populationen zu entwickeln. Während diese Techniken in der Lage sein können, optimale Steuerungsergebnisse auf realistischere Simulationen und damit auf die praktische Anwendung zu übertragen, werfen die gefundenen Strategien die Frage der Übertragbarkeit der Ergebnisse auf. Bei komplexen Rückkopplungsstrategien zwischen zwei Modellen, von denen eines strukturell und das andere mathematisch komplex ist, ist das Gesamtergebnis nicht mehr einfach zu erklären. Zukünftige Forschungen müssen sich daher darauf konzentrieren, die Genauigkeit der Simulationsmodelle zu verbessern und ihre Zuverlässigkeit zu analysieren, um mit Hilfe von Simulationen den Nutzen dieser komplexen OCT-basierten Strategien schlüssig nachweisen zu können.

Zugänglichkeit der Daten

Alle Codes und Animationen sind verfügbar unter https://github.com/ehbussell/Bussell2018Model.

Beiträge der Autoren

Konkurrierende Interessen

Wir haben keine konkurrierenden Interessen.

Finanzierung

E.H.B. dankt dem Biotechnology and Biological Sciences Research Council of the United Kingdom (BBSRC) für die Unterstützung durch ein DTP-Promotionsstipendium der Universität Cambridge.

Danksagung

Wir danken Andrew Craig, Eleftherios Avramidis und Hola Adrakey für hilfreiche Diskussionen. Wir danken auch zwei anonymen Gutachtern für ihre hilfreichen und konstruktiven Kommentare.

Fußnoten

Ein Beitrag von 16 zu einem Themenheft „Modelling infectious disease outbreaks in humans, animals and plants: epidemic forecasting and control“.

Elektronisches Zusatzmaterial ist online verfügbar unter https://dx.doi.org/10.6084/m9.figshare.c.4462796.

© 2019 The Author(s)

Published by the Royal Society. Alle Rechte vorbehalten.

Leave a Reply