Appliquer la théorie du contrôle optimal aux modèles épidémiologiques complexes pour informer la gestion des maladies dans le monde réel

Introduction

La modélisation mathématique joue un rôle de plus en plus important dans l’information des décisions politiques et de gestion concernant les maladies envahissantes . Cependant, l’identification par modélisation de contrôles efficaces et rentables peut être difficile, en particulier lorsque les modèles incluent des représentations très détaillées des processus de transmission des maladies. Il existe une variété d’outils mathématiques pour concevoir des stratégies optimales, mais aucune norme pour mettre en pratique les résultats des simplifications motivées mathématiquement. Une question ouverte est de savoir comment incorporer suffisamment de réalisme dans un modèle pour permettre des prédictions précises de l’impact des mesures de contrôle, tout en s’assurant que la stratégie réellement optimale peut toujours être identifiée . Dans cet article, nous identifions les difficultés – ainsi que les solutions potentielles – dans l’obtention d’une stratégie optimale utile en pratique, en soulignant les rôles potentiels de la commande en boucle ouverte et de la commande prédictive par modèle à l’aide d’un exemple simple.

(a) Modèles de simulation réalistes

L’optimisation de la gestion des maladies implique de déterminer la ou les méthodes de contrôle les plus appropriées, par exemple la vaccination, la quarantaine ou le roguing, et la meilleure stratégie de déploiement pour cette méthode ou cette combinaison de méthodes afin de minimiser les impacts de la maladie. Cette minimisation peut être difficile lorsque les ressources sont limitées et qu’il existe des coûts économiques associés à la fois aux mesures de contrôle et à la maladie. Les méthodes qui simulent le cours attendu d’une épidémie et modélisent explicitement les effets des interventions peuvent rapidement quantifier l’impact potentiel d’une stratégie donnée . Ces modèles de simulation rendent compte avec précision de la dynamique du système réel et sont donc devenus des outils importants pour évaluer les décisions politiques relatives aux réponses de gestion en temps réel ainsi qu’à une préparation accrue aux menaces futures. Les exemples incluent les politiques de vaccination contre le papillomavirus humain au Royaume-Uni , les politiques d’abattage du bétail et l’optimisation de la vaccination contre la fièvre aphteuse, et les stratégies optimales de retrait des hôtes pour les maladies des arbres des agrumes et la mort subite du chêne .

Diverses complexités de la dynamique des maladies, par exemple les hétérogénéités spatiales et les différences individuelles inhérentes à la sensibilité et à la transmission des agents pathogènes (structure du risque), se sont avérées être des déterminants importants des modèles et des taux de propagation épidémique . Pour garantir des prédictions épidémiques précises, ces facteurs doivent être inclus dans les modèles de simulation conçus pour aider à la prise de décision. Cependant, l’inclusion de ces hétérogénéités donne généralement lieu à des modèles très complexes comportant de nombreuses mesures de contrôle possibles, ce qui rend l’optimisation infaisable sur le plan informatique lorsque les interventions peuvent être combinées, et surtout lorsque les mesures de contrôle peuvent également varier dans le temps, dans l’espace ou en fonction du risque de maladie . Pour la plupart des modèles de simulation, la seule option viable est alors d’utiliser le modèle pour évaluer un petit sous-ensemble de stratégies plausibles qui restent fixes pendant l’épidémie, en balayant potentiellement un seul paramètre tel qu’un rayon d’abattage. Nous appellerons cette approche le « test de stratégie ». En utilisant cette approche, il est difficile d’avoir une grande confiance dans la stratégie la plus performante, car sans cadre pour la choisir, l’ensemble des stratégies testées est susceptible d’être biaisé. De plus, comme l’ensemble à tester ne peut pas couvrir tout l’espace des options de contrôle, il est peu probable que le véritable optimum soit trouvé.

(b) Contrôle optimal des modèles épidémiologiques

De nombreuses techniques mathématiques existent pour caractériser le véritable contrôle optimal d’une maladie, comme l’analyse de l’équilibre ou de la taille finale, selon le système analysé . Nous nous concentrons ici sur l’optimisation du contrôle variable dans le temps des systèmes dynamiques, pour lesquels la théorie du contrôle optimal (TCO) est largement utilisée . En analysant un ensemble d’équations décrivant la dynamique de la maladie, la TCO peut caractériser mathématiquement la stratégie de déploiement optimale pour une méthode de contrôle donnée et fournir un aperçu de la dynamique sous-jacente, sans la simulation répétée requise pour optimiser les modèles de simulation. Cependant, en raison de la complexité mathématique sous-jacente, peu de progrès peuvent être réalisés avec l’OCT à moins que les modèles sous-jacents de la propagation de la maladie ne soient fortement simplifiés. Les premiers travaux en matière d’OCT se sont concentrés sur les niveaux optimaux de vaccination et de traitement, des extensions permettant d’envisager d’autres interventions, notamment la quarantaine, le dépistage et les campagnes de promotion de la santé, étant apparues plus tard. Les modèles de maladie peuvent également être couplés à des effets économiques , et dans le cadre d’OCT, cela a été utilisé pour équilibrer des coûts multiples, tels que la surveillance et le contrôle , ou le traitement prophylactique par rapport au traitement réactif .

Les stratégies optimales identifiées par OCT peuvent être très complexes, spécifiant souvent des contrôles qui changent de stratégie à des moments spécifiques au cours d’une épidémie. La complexité supplémentaire de ces contrôles de commutation peut améliorer de manière significative la gestion de la maladie lorsqu’elle est testée sur un modèle spatialement explicite, mais peut conduire à de mauvaises performances si le moment exact de la commutation n’est pas connu , par exemple, lorsque l’incertitude des paramètres donne une large gamme de moments de commutation possibles. Cela montre que les incertitudes et les complexités supplémentaires empêchent souvent l’OCT d’être directement applicable au monde réel. On ne sait pas non plus comment les connaissances acquises par l’OCT peuvent être traduites en conseils pratiques. Pour évoluer vers des stratégies robustes pouvant être utilisées dans la pratique, des travaux plus récents se sont concentrés sur l’inclusion de caractéristiques et d’hétérogénéités supplémentaires dans les modèles utilisés dans l’OCT, en particulier la dynamique spatiale. L’espace n’est généralement inclus que dans une mesure limitée, par exemple, en utilisant des modèles de métapopulation (par exemple ), ou des équations différentielles partielles (par exemple ) pour optimiser les stratégies spatiales, de sorte que si les hétérogénéités ajoutées sont suffisantes pour identifier des stratégies de contrôle robustes et pratiques reste une question ouverte.

(c) Aller vers un contrôle pratique

Malgré la découverte de la stratégie de contrôle mathématiquement optimale, des simplifications majeures du système tel que modélisé sont nécessaires pour permettre de progresser en utilisant l’OCT. Il est donc souvent difficile de savoir comment ces stratégies se comporteraient si elles étaient adoptées par les décideurs. D’autre part, il est souvent impossible d’optimiser complètement des modèles suffisamment réalistes pour informer directement les politiques. Par conséquent, un cadre est nécessaire pour combiner les capacités d’optimisation de l’OCT avec les prédictions précises des modèles de type simulation, comme l’exige l’élaboration des politiques. La question est donc de savoir comment faire un usage pratique de l’OCT ?

Dans le §2, nous décrivons deux méthodes issues de l’ingénierie des systèmes de contrôle pour appliquer les résultats de l’OCT, et nous les comparons aux tests de stratégie en utilisant un modèle illustratif simple dans le §3. Nous cherchons à répondre à la question de savoir comment, sous les contraintes de calcul actuelles, les résultats de l’OCT peuvent être appliqués tout en maintenant le réalisme requis pour une application pratique.

Application du contrôle optimal à des systèmes réalistes

En dehors de l’épidémiologie, l’OCT a eu une utilisation plus large sur des modèles approximatifs de systèmes complexes. Une étude récente examine l’utilisation de l’OCT pour les modèles à base d’agents (ABM) , un type de modèle qui simule le comportement individuel d’agents autonomes. An et al. suggèrent l’utilisation d’un modèle approximatif de la dynamique du GAB, conçu pour être suffisamment simple pour permettre l’analyse mathématique du contrôle optimal. Un modèle approximatif approprié est choisi et ajusté soit à des données réelles, soit à des données synthétiques provenant du GAB. Les résultats de l’OCT du modèle approximatif sont ensuite appliqués au GAB à tester : un processus appelé « lifting », qui pourrait également s’appliquer aux modèles détaillés de simulation d’épidémies considérés dans cet article. Nous décrivons maintenant deux cadres possibles issus de l’ingénierie des systèmes de contrôle pour faire usage de cette approche de levage de contrôle.

(a) Contrôle en boucle ouverte

La première méthode est l’application la plus simple du levage de contrôle, et le cadre implicitement suggéré par An et al . Le contrôle est optimisé sur le modèle approximatif une fois en utilisant les conditions initiales du modèle de simulation. La stratégie de contrôle optimale qui en résulte est transférée au simulateur et appliquée pendant toute la durée de la simulation (figure 1). La simulation répétée de la stratégie OCT sur le modèle de simulation permet de l’évaluer par rapport à d’autres stratégies de contrôle possibles. L’optimisation donne une stratégie unique, dépendant du temps, pour toutes les réalisations de la simulation, et n’intègre donc aucune rétroaction. Elle est donc qualifiée de contrôle en boucle ouverte, car elle est entièrement spécifiée par les conditions initiales de la simulation et la trajectoire prédite par le modèle approximatif. Son utilisation en épidémiologie est peu courante, bien que Clarke et al. utilisent l’OCT dans un modèle approximatif pour trouver les niveaux optimaux de dépistage de la chlamydia et de recherche des contacts, qui sont ensuite cartographiés sur une simulation de réseau.

Figure 1. Boucle ouverte et contrôle prédictif de modèle (MPC). La hiérarchie des modèles est représentée, avec les commandes optimisées du modèle approximatif directement levées sur le modèle de simulation. Le système réel est en vert, les modèles et les processus d’ajustement sont en bleu, et le cadre de contrôle est en orange. Sans la boucle de retour en pointillés orange, il s’agit d’une commande en boucle ouverte. MPC réinitialise l’état du modèle approximatif à des étapes de mise à jour régulières, avant de ré-optimiser et de lever les contrôles sur le modèle de simulation jusqu’au prochain moment de mise à jour.

(b) Contrôle prédictif de modèle

Le contrôle en boucle ouverte exige que le modèle approximatif reste précis sur l’échelle de temps de l’épidémie entière. Cependant, pour des raisons de tractabilité, le modèle approximatif doit nécessairement omettre de nombreuses hétérogénéités présentes dans le modèle de simulation, comme les effets spatiaux et la structure du risque. Lorsque les stratégies résultant de l’OCT sont ensuite appliquées au modèle de simulation ou au système réel, la progression de la maladie est susceptible de dévier systématiquement de la trajectoire prédite par le modèle approximatif. Le contrôle prédictif du modèle (MPC) est une technique d’optimisation intégrant le retour d’information du système qui peut prendre en compte de telles perturbations. À des moments réguliers de mise à jour, les valeurs des variables d’état dans le modèle approximatif sont réinitialisées pour correspondre à celles de la simulation à ce moment-là. La commande est alors réoptimisée et la nouvelle stratégie de commande est appliquée à la simulation jusqu’au prochain moment de mise à jour. Les modèles approximatif et de simulation sont donc exécutés simultanément, avec plusieurs optimisations par réalisation, afin de s’assurer que le modèle approximatif et la stratégie de contrôle correspondent étroitement à chaque réalisation de simulation individuelle (figure 1). Ces optimisations multiples sont coûteuses en calcul mais traitables, contrairement à l’exécution de l’optimisation sur le modèle de simulation complet.

La CPM a eu une certaine utilisation dans la littérature épidémiologique, la majorité étant pour le contrôle des applications de médicaments pour des individus uniques plutôt que pour le contrôle des épidémies au niveau de la population. Les exemples incluent la recherche de stratégies de gestion du VIH qui sont robustes au bruit de mesure et aux erreurs de modélisation, et le contrôle de l’administration d’insuline chez les patients atteints de diabète. Ces études soulignent les avantages du MPC pour un contrôle robuste, c’est-à-dire un contrôle qui reste efficace malgré les perturbations du système. Cependant, une seule étude se concentre sur la gestion des épidémies , et qui ne teste pas explicitement le contrôle par rétroaction sur des simulations.

Stratégies d’optimisation sur un modèle de réseau illustratif

(a) Méthodes

Pour démontrer la boucle ouverte et le MPC pour la gestion des épidémies, nous utilisons un modèle de réseau stochastique SIR incluant la démographie des hôtes et la structure du risque. Le modèle est délibérément maintenu simple pour montrer comment l’idée sous-jacente est largement applicable à travers les maladies humaines, animales et végétales. Bien que le modèle et ses paramètres soient arbitraires et ne représentent pas une maladie spécifique, nous l’utilisons pour représenter un scénario dans lequel un modèle de simulation a déjà été ajusté à un système de maladie réel ; le modèle de réseau est donc utilisé ici comme un proxy pour un modèle de simulation potentiellement très détaillé.

(i) Modèle de simulation

Dans notre modèle, l’infection se propage de manière stochastique à travers un réseau de nœuds qui sont regroupés en trois régions distinctes (figure 2a). Chaque nœud contient une population hôte stratifiée en groupes à haut et bas risque. L’infection peut se propager entre les individus au sein des nœuds et entre les nœuds connectés. Le taux net d’infection du groupe à risque r dans le nœud i est donné par

Sir∑ jσij (ρrHI jH+ρrLI jL),3.1

où S et I sont les nombres d’hôtes sensibles et infectés, respectivement, les indices identifient le nœud, et les exposants spécifient le groupe à risque élevé (H) ou faible (L). La somme porte sur tous les nœuds connectés, y compris le nœud focal lui-même, la force de transmission relative dans le nœud i à partir du nœud j étant donnée par σij, et la structure du risque étant donnée par la matrice 2 × 2 ρ. Tous les détails du modèle sont donnés dans le matériel électronique supplémentaire, S1. Bien qu’il ne soit pas limité à ces applications, le modèle de l’équation (3.1) pourrait représenter les maladies des cultures ou du bétail se propageant dans les fermes, ou les infections sexuellement transmissibles se propageant dans les villes ou les pays.

Figure 2. (a) Le réseau utilisé pour le modèle de simulation illustratif, y compris les étiquettes des régions. L’épidémie est semée dans le nœud rouge de la région A, et peut se propager entre les nœuds connectés (lignes grises). Dans (b), l’allocation de contrôle est montrée pour une seule exécution MPC basée sur l’espace, avec l’allocation correspondante en boucle ouverte indiquée par la ligne pointillée noire. (c) Le nombre total d’individus infectés dans le cadre d’une seule exécution du contrôle en boucle ouverte basé sur l’espace. Le contrôle est basé sur la prédiction du modèle approximatif à partir des conditions initiales. (d) Le nombre d’individus infectés dans la simulation et le modèle approximatif basé sur l’espace correspondant au contrôle MPC effectué en (b). Ici, la prédiction est réinitialisée pour correspondre à la simulation à chaque étape de mise à jour (0,5 unité de temps) et le contrôle est ré-optimisé. En corrigeant de manière répétée les différences entre les prédictions du modèle à court terme et les nombres réalisés d’individus infectés – plutôt que de s’appuyer sur une prédiction potentiellement de plus en plus inexacte faite au moment initial – le MPC donne de meilleures prédictions de l’état de la simulation ainsi qu’un contrôle amélioré par rapport à la boucle ouverte (notez les différentes échelles de l’axe des y). a.u., unités arbitraires.

La vaccination de masse est la seule intervention que nous considérons, avec la possibilité de cibler en fonction à la fois du groupe à risque et de la région, mais de manière aléatoire en fonction du statut d’infection de l’hôte (c’est-à-dire. le vaccin est administré à tous les hôtes mais n’est efficace que sur les sujets sensibles). Les contraintes logistiques et économiques sont prises en compte par le biais d’un taux de vaccination total maximum (ηmax) qui peut être réparti entre les groupes et les régions à risque. Au sein de chaque groupe, les personnes susceptibles sont vaccinées à un taux : fηmaxS/N, où f est la proportion de contrôle allouée à ce groupe, et N est la population totale du groupe.

L’allocation optimale des ressources de vaccination minimise un coût épidémique J représentant la charge de morbidité de l’épidémie à travers tous les hôtes infectés pendant le temps de simulation (T) : J=∫t=0TI(t) dt. En commun avec le contrôle particulier que nous considérons et les structures de risque et spatiale, ce choix simple de la fonction objectif a été fait simplement pour illustrer nos méthodes, mais le cadre se généralise immédiatement à des paramètres plus complexes.

(ii) Modèles approximatifs

L’optimisation exhaustive du contrôle à l’aide du modèle de simulation, à travers l’espace, le groupe de risque et le temps, est clairement très coûteuse en termes de calcul. Pour évaluer le meilleur niveau d’approximation, nous considérons deux modèles approximatifs déterministes différents du simulateur. Le premier modèle est purement structuré en fonction du risque, éliminant toutes les informations spatiales et laissant un groupe de population à haut risque et un autre à faible risque. Ce modèle est déterministe et repose sur l’hypothèse que tous les nœuds sont spatialement bien mélangés les uns aux autres. Le second modèle approximatif est plus complexe, dans la mesure où il est également déterministe et structuré en fonction du risque, mais inclut en plus une première approximation de la structure spatiale de l’hôte en incluant les informations régionales sur l’hôte. La dynamique spatiale est incluse entre les trois régions mais pas à l’intérieur de celles-ci afin de maintenir une simplicité suffisante pour obtenir des résultats de contrôle optimal, ce qui suppose que les nœuds sont spatialement bien mélangés à l’intérieur de chaque région. Cela pourrait représenter, par exemple, l’optimisation du contrôle au niveau du pays, mais pas au niveau régional. Nous appelons ce modèle le modèle spatial approximatif. Un seul ensemble de paramètres est ajusté pour chaque modèle aux données provenant d’un ensemble de simulations de modèles. Nous testons ensuite lequel des deux modèles approximatifs est le plus utile pour l’optimisation du contrôle. Tous les détails des modèles approximatifs, des procédures d’ajustement et d’optimisation sont donnés dans le matériel supplémentaire électronique, S1 et S2.

(iii) Scénarios de contrôle

Nous testons six scénarios de contrôle différents, qui comparent la stratégie Test des contrôles basés purement sur le modèle de simulation (scénarios 1 et 2) avec la boucle ouverte et la MPC appliquée à l’aide de nos deux modèles approximatifs (scénarios 3-6) :

  • (1) ‘Haut’ : vacciner exclusivement les individus à haut risque.

  • (2) ‘Split’ : partitionner les ressources de contrôle entre les groupes à haut et à faible risque sur la base d’une optimisation réalisée à l’avance.

  • (3) ‘Risk OL’ : contrôle en boucle ouverte à l’aide du modèle approximatif basé sur le risque.

  • (4) ‘Risk MPC’ : MPC utilisant le modèle approximatif basé sur le risque.

  • (5) ‘Space OL’ : commande en boucle ouverte utilisant le modèle approximatif spatial.

  • (6) ‘Space MPC’ : MPC utilisant le modèle spatial approximatif.

L’allocation constante optimale pour la stratégie ‘Split’ a été trouvée en exécutant de nombreuses réalisations du modèle de simulation pour chacune d’une gamme de valeurs de partition, comme dans , et en sélectionnant la valeur qui donne le coût épidémique moyen le plus bas (matériel électronique supplémentaire, figure S8). Les six stratégies sont évaluées en exécutant à plusieurs reprises le modèle de simulation dans le cadre de chaque scénario de contrôle.

(b) Résultats

Les résultats de l’OCT pour l’optimisation de la stratégie de vaccination dans le modèle approximatif basé sur le risque conduisent à une vaccination initiale des individus à haut risque uniquement, avant de changer de priorité et de traiter presque exclusivement le groupe à faible risque plus peuplé. Les résultats OCT du modèle spatial approximatif montrent ce même changement (figure 2b), mais un certain nombre de changements spatiaux sont également observés, permettant de suivre l’épidémie au fur et à mesure de sa progression dans les trois régions (matériel électronique supplémentaire, figure S9). Les stratégies spatiales sont donc beaucoup plus complexes que les contrôles basés sur le risque.

L’application des scénarios de contrôle au modèle de simulation et la comparaison des coûts de l’épidémie montrent que l’incorporation d’un plus grand réalisme, par le biais d’un modèle approximatif plus complexe ainsi que par l’utilisation du MPC, permet d’améliorer la gestion de la maladie (figure 3 et matériel électronique supplémentaire, figure S10). Parmi les stratégies « définies par l’utilisateur » constantes et purement basées sur la simulation, la répartition du contrôle entre les groupes à risque est légèrement plus efficace que la simple vaccination du groupe à haut risque. L’allocation optimale au groupe à haut risque utilisée dans la stratégie « fractionnée » représente 63 % des ressources de vaccination, le reste étant utilisé pour vacciner les individus à faible risque, bien que cela se produise dans un large minimum de coût épidémique (matériel supplémentaire électronique, figure S8). L’application des optimisations du modèle approximatif basé sur le risque au modèle de simulation donne une amélioration par rapport à l’une ou l’autre des stratégies  » définies par l’utilisateur « , bien qu’il y ait peu de différence dans le coût épidémique entre les cadres en boucle ouverte et MPC (voir ci-dessous). L’ajout d’espace dans le modèle approximatif améliore encore le contrôle, conduisant aux coûts épidémiques les plus faibles lorsque le cadre MPC spatial est utilisé.

Figure 3. Résultats des différents schémas d’optimisation du contrôle sur le modèle de simulation illustratif. Le MPC spatial est le plus performant, montrant une amélioration par rapport aux stratégies en boucle ouverte (OL) et définies par l’utilisateur. a.u., unités arbitraires.

Le modèle illustratif démontre les améliorations de gestion qui peuvent être obtenues en combinant l’OCT avec la boucle ouverte et le MPC. Les résultats clés des analyses OCT sont les temps de commutation des commandes. L’utilisation des commandes de commutation de l’un ou l’autre modèle approximatif avec une commande en boucle ouverte donne des coûts épidémiques plus faibles que les stratégies naïvement choisies « définies par l’utilisateur ». La rétroaction présente dans les contrôleurs MPC permet de réduire davantage le coût épidémique. En réévaluant le moment des commutations pendant l’épidémie, et en incluant éventuellement des commutations supplémentaires, le contrôle peut répondre plus étroitement à la trajectoire exacte de la réalisation actuelle de la simulation (figure 2b-d). Cela donne un contrôle plus robuste à l’incertitude et aux erreurs systématiques dans le modèle approximatif, et donc de meilleures performances sur le modèle de simulation complexe.

Dans les stratégies basées sur le risque, il y a peu de différence entre la boucle ouverte et le MPC. Cela s’explique par le fait que le moment précis du passage de la vaccination des groupes à haut risque à celle des groupes à faible risque n’affecte pas de manière significative le coût de l’épidémie (matériel supplémentaire électronique, figure S11). Le moment de l’introduction de la maladie dans les régions B et C est très variable d’une simulation à l’autre (matériel électronique supplémentaire, figure S2). Le potentiel de commutations supplémentaires dans le modèle spatial approximatif donne plus de flexibilité au contrôleur MPC pour répondre à cette variabilité, et ainsi le MPC spatial montre une amélioration significative par rapport à la boucle ouverte, qui ne peut pas s’adapter aux perturbations. Les performances du contrôle sont étroitement liées à la précision du modèle approximatif. Dans notre exemple, la dynamique spatiale est clairement importante en raison du moment de la propagation entre les régions, et donc les contrôles plus informés du modèle spatial surpassent les stratégies basées sur le risque.

Discussion

Nos résultats montrent que le choix du modèle approximatif affecte la performance des stratégies en boucle ouverte et MPC. Ici, nous avons trouvé un modèle approximatif approprié de manière ad hoc, mais un défi clé pour l’avenir est de développer une méthode plus formelle pour choisir le modèle approximatif le plus approprié. Un modèle plus précis peut donner de meilleures prédictions, et donc un contrôle plus proche du véritable optimum, mais des modèles plus simples sont souvent suffisants et la précision doit être équilibrée avec la complexité ajoutée et les contraintes d’optimisation. L’une des difficultés réside dans le fait qu’il n’est pas toujours évident de déterminer la limite de la faisabilité mathématique ou informatique et, par conséquent, la complexité du modèle dans la pratique. Il est également difficile de déterminer mathématiquement, de manière systématique, les aspects de la dynamique qu’il est important de saisir avec précision. Cette question clé doit être considérée cependant, car les implications se rapportent directement aux applications dans le monde réel.

Le contrôle pratique des maladies nécessite des enquêtes sur le système réel pour évaluer l’état de l’épidémie. La boucle ouverte et le MPC optimisent tous deux le contrôle en utilisant des prédictions de la dynamique future, ce qui en fait des contrôleurs à action directe. Le modèle approximatif qui sous-tend ces cadres permet de prendre des décisions plus éclairées entre les enquêtes, ce qui se traduit par un contrôle plus proche du véritable optimum. Des prédictions précises permettent d’éviter des relevés continus ou très fréquents qui peuvent être coûteux ou difficiles sur le plan logistique. Comme nous l’avons vu précédemment, les mises à jour répétées dans la boucle de rétroaction de la MPC améliorent ces prédictions et donc les performances de la commande. Cependant, chaque mise à jour nécessitera une surveillance du système réel, de sorte que la fréquence des mises à jour doit être choisie de manière à équilibrer l’amélioration de la connaissance du système avec les éventuelles contraintes de surveillance.

Dans cet article, nous nous sommes concentrés sur une approche descendante, en trouvant des stratégies robustes et applicables en pratique en utilisant l’OCT pour optimiser les modèles de simulation. De même, de nombreuses études utilisent l’OCT sans modèles de simulation, en envisageant rarement l’application pratique des contrôles optimaux qui en résultent. Avec cette approche ascendante, un système permettant de tester les résultats sur des systèmes réalistes est vital pour garantir que ces résultats sont robustes à un réalisme supplémentaire. L’utilisation d’un cadre MPC tel qu’il est considéré ici pourrait être un moyen pour les chercheurs de l’OCT de démontrer l’impact potentiel de leur travail à un public plus large.

Les tests exhaustifs des paramétrages alternatifs des modèles de simulation dépassent le cadre de cette étude, mais nous constatons généralement que le MPC spatial donne également les meilleurs résultats parmi d’autres ensembles de paramètres raisonnables (matériel supplémentaire électronique, S3). Nous avons supposé tout au long de cette étude qu’un modèle de simulation précis du système réel en question pouvait être construit et qu’un seul ensemble de paramètres pouvait être ajusté pour le modèle déterministe approximatif choisi. En réalité, il peut y avoir une incertitude considérable dans les paramètres du simulateur, de sorte que l’ajustement d’un modèle déterministe unique peut être difficile. Une question pour une étude future serait de savoir comment gérer ces incertitudes, peut-être aussi en incorporant une meilleure connaissance des paramètres au fur et à mesure de la simulation .

Les stratégies trouvées par OCT dépendent fortement de la forme exacte de la fonction objectif, que nous avons choisie ici pour être très simple. L’extension de l’objectif pour inclure les coûts associés au contrôle ainsi qu’à chaque changement de stratégie permettrait une évaluation plus détaillée de l’aspect pratique de la mise en œuvre de ces stratégies complexes. Des recherches supplémentaires sont nécessaires pour déterminer comment quantifier l’équilibre entre des coûts très différents, par exemple les coûts de traitement et la charge de morbidité. Dans le cas des maladies humaines, les analyses coût-efficacité sont généralement basées sur les années de vie ajustées à la qualité. Un concept similaire pourrait peut-être être utilisé pour les maladies végétales et animales, y compris le calcul des pertes de rendement ainsi que des effets sur le bien-être, la biodiversité et le tourisme, par exemple . Les méthodes que nous avons décrites ne dépendent toutefois pas de la forme de la fonction de contrôle ou d’objectif. Pour un modèle approximatif approprié, la rétroaction dans le MPC assure des prédictions précises et devrait donc toujours améliorer les performances par rapport à la boucle ouverte. Les cadres que nous décrivons peuvent être utilisés pour fournir un scénario de contrôle supplémentaire et non biaisé au processus de test de stratégie qui est déjà couramment utilisé.

Dans cet article, nous avons montré que le couplage du contrôle par rétroaction avec des modèles de simulation et des OCT peut aider à concevoir des stratégies d’intervention efficaces et robustes pour gérer les agents pathogènes des populations humaines, animales et végétales. Si ces techniques peuvent permettre de transférer des résultats de contrôle optimal vers des simulations plus réalistes et donc vers une application pratique, les stratégies trouvées posent toutefois le problème de la communicabilité des résultats. Avec des stratégies de rétroaction complexes entre deux modèles, l’un de structure complexe et l’autre mathématiquement complexe, le résultat global n’est plus simple à expliquer. Les recherches futures doivent donc se concentrer sur l’amélioration de la précision des modèles de simulation, et sur l’analyse de leur fiabilité, afin que les simulations puissent être utilisées pour établir de manière concluante le bénéfice de ces stratégies complexes basées sur l’OCT.

Accessibilité des données

Tous les codes et animations sont disponibles à https://github.com/ehbussell/Bussell2018Model.

Contributions des auteurs

Intérêts concurrents

Nous n’avons pas d’intérêts concurrents.

Funding

E.H.B. remercie le Biotechnology and Biological Sciences Research Council du Royaume-Uni (BBSRC) pour son soutien via une bourse d’études doctorales DTP de l’Université de Cambridge.

Acknowledgements

Nous remercions Andrew Craig, Eleftherios Avramidis et Hola Adrakey pour des discussions utiles. Nous remercions également deux réviseurs anonymes pour leurs commentaires utiles et constructifs.

Notes de bas de page

Une contribution de 16 à un numéro thématique « Modélisation des épidémies de maladies infectieuses chez les humains, les animaux et les plantes : prévision et contrôle des épidémies ».

Le matériel électronique supplémentaire est disponible en ligne à https://dx.doi.org/10.6084/m9.figshare.c.4462796.

© 2019 The Author(s)

Publié par la Royal Society. Tous droits réservés.

.

Leave a Reply