Aplicación de la teoría de control óptimo a modelos epidemiológicos complejos para informar sobre la gestión de enfermedades en el mundo real

Introducción

La modelización matemática desempeña un papel cada vez más importante a la hora de informar sobre las decisiones políticas y de gestión relativas a las enfermedades invasoras . Sin embargo, la identificación basada en modelos de controles eficaces y rentables puede ser difícil, especialmente cuando los modelos incluyen representaciones muy detalladas de los procesos de transmisión de la enfermedad. Existen diversas herramientas matemáticas para diseñar estrategias óptimas, pero no hay ninguna norma para poner en práctica los resultados de las simplificaciones motivadas por las matemáticas. Una cuestión abierta es cómo incorporar suficiente realismo a un modelo para permitir predicciones precisas del impacto de las medidas de control, asegurando al mismo tiempo que se pueda identificar la estrategia verdaderamente óptima . En este artículo, identificamos las dificultades -así como las posibles soluciones- para lograr una estrategia óptima útil en la práctica, destacando las posibles funciones del control predictivo de bucle abierto y del modelo mediante un ejemplo sencillo.

(a) Modelos de simulación realistas

La optimización de la gestión de la enfermedad implica determinar el método o métodos de control más apropiados, por ejemplo, la vacunación, la cuarentena o el roguing, y la mejor estrategia de despliegue para ese método o combinación de métodos para minimizar los impactos de la enfermedad. Esta minimización puede ser difícil cuando los recursos son limitados y hay costes económicos asociados tanto a las medidas de control como a la enfermedad. Los métodos que simulan el curso esperado de una epidemia y modelan explícitamente los efectos de las intervenciones pueden cuantificar rápidamente el impacto potencial de una estrategia determinada . Estos modelos de simulación captan con exactitud la dinámica del sistema real, por lo que se han convertido en herramientas importantes para evaluar las decisiones políticas relativas a las respuestas de gestión en tiempo real, así como para aumentar la preparación ante futuras amenazas. Algunos ejemplos son las políticas de vacunación contra el virus del papiloma humano en el Reino Unido, las políticas de sacrificio de ganado y la optimización de la vacunación contra la fiebre aftosa, y las estrategias óptimas de eliminación de huéspedes para las enfermedades arbóreas de los cítricos y la muerte súbita del roble.

Se ha demostrado que diversas complejidades de la dinámica de las enfermedades, por ejemplo las heterogeneidades espaciales y las diferencias individuales inherentes a la susceptibilidad y la transmisión de patógenos (estructura de riesgo), son determinantes importantes de los patrones y las tasas de propagación de las epidemias. Para garantizar la precisión de las predicciones epidémicas, estos factores deben incluirse en los modelos de simulación diseñados para ayudar a la toma de decisiones. Sin embargo, la inclusión de estas heterogeneidades suele dar lugar a modelos muy complejos con muchas medidas de control posibles, lo que hace que la optimización sea inviable desde el punto de vista computacional cuando las intervenciones pueden combinarse y, sobre todo, cuando las medidas de control también pueden variar en el tiempo, en el espacio o según el riesgo de la enfermedad . Para la mayoría de los modelos de simulación, la única opción viable es entonces utilizar el modelo para evaluar un pequeño subconjunto de estrategias plausibles que permanezcan fijas durante la epidemia, potencialmente explorando sobre un único parámetro, como un radio de sacrificio. Nos referiremos a este enfoque como «prueba de estrategias». El uso de este enfoque hace difícil tener una alta confianza en la estrategia de mejor rendimiento, ya que al no haber un marco para elegirla, es probable que el conjunto de estrategias bajo prueba esté sesgado. Además, como el conjunto a probar no puede abarcar todo el espacio de opciones de control, es poco probable que se encuentre el verdadero óptimo.

(b) Control óptimo de modelos epidemiológicos

Existen muchas técnicas matemáticas para caracterizar el verdadero control óptimo de una enfermedad, como el equilibrio o el análisis del tamaño final, dependiendo del sistema que se analice . Aquí nos centramos en la optimización del control variable en el tiempo de los sistemas dinámicos, para los que la teoría de control óptimo (TCO) se utiliza ampliamente . Al analizar un conjunto de ecuaciones que describen la dinámica de la enfermedad, la TCO puede caracterizar matemáticamente la estrategia de despliegue óptima para un determinado método de control y proporcionar una visión de la dinámica subyacente, sin la simulación repetida necesaria para optimizar los modelos de simulación. Sin embargo, debido a la complejidad matemática subyacente, se puede avanzar poco con la OCT a menos que los modelos subyacentes de propagación de la enfermedad estén muy simplificados. Los primeros trabajos sobre TCO se centraron en los niveles óptimos de vacunación y tratamiento, y posteriormente se ampliaron para considerar otras intervenciones como la cuarentena, el cribado y las campañas de promoción de la salud. Los modelos de enfermedad también pueden ir acompañados de efectos económicos, y dentro de la TCO se han utilizado para equilibrar múltiples costes, como la vigilancia y el control, o el tratamiento profiláctico frente al reactivo.

Las estrategias óptimas identificadas por la TCO pueden ser muy complejas, a menudo especificando controles que cambian de estrategia en momentos específicos durante el curso de una epidemia. La complejidad añadida de estos controles de cambio puede mejorar significativamente la gestión de la enfermedad cuando se prueba en un modelo espacialmente explícito, pero puede conducir a un rendimiento pobre si no se conoce el momento exacto del cambio , por ejemplo, cuando la incertidumbre de los parámetros da una amplia gama de posibles tiempos de cambio. Esto demuestra que las incertidumbres y complejidades adicionales a menudo impiden que la TCO sea directamente aplicable al mundo real. Tampoco está claro cómo puede traducirse la visión de la TCO en consejos prácticos. Para avanzar hacia estrategias sólidas que puedan utilizarse en la práctica, los trabajos más recientes se han centrado en incluir características y heterogeneidades adicionales en los modelos utilizados en la TCO, en particular la dinámica espacial. El espacio suele incluirse sólo de forma limitada, por ejemplo, mediante el uso de modelos de metapoblación (por ejemplo, ), o de ecuaciones diferenciales parciales (por ejemplo, ) para optimizar las estrategias espaciales, por lo que sigue siendo una cuestión abierta si las heterogeneidades añadidas son suficientes para identificar estrategias de control robustas y prácticas.

(c) Avanzar hacia el control práctico

A pesar de encontrar la estrategia de control matemáticamente óptima, se requieren importantes simplificaciones del sistema tal y como se ha modelado para poder avanzar utilizando la TCO. Por lo tanto, a menudo no está claro cómo se comportarían estas estrategias si fueran adoptadas por los responsables políticos. Por otra parte, los modelos con suficiente realismo para informar directamente a los responsables políticos suelen ser imposibles de optimizar en su totalidad. Por lo tanto, se necesita un marco que combine las capacidades de optimización de los TCO con las predicciones precisas de los modelos de tipo simulación, tal y como se requiere en la elaboración de políticas. En el apartado 2 describimos dos métodos de la ingeniería de sistemas de control para aplicar los resultados de las TCO y los comparamos con las pruebas de estrategia mediante un modelo ilustrativo sencillo en el apartado 3. Intentamos responder a cómo, bajo las restricciones computacionales actuales, pueden aplicarse los resultados de la OCT manteniendo el realismo necesario para la aplicación práctica.

Aplicación del control óptimo a sistemas realistas

Fuera de la epidemiología, la OCT ha tenido un uso más amplio en modelos aproximados de sistemas complejos. Un estudio reciente revisa el uso de la TCO para los modelos basados en agentes (ABM), un tipo de modelo que simula el comportamiento individual de agentes autónomos. An et al. sugieren el uso de un modelo que aproxime la dinámica del ABM, diseñado para ser lo suficientemente simple como para permitir el análisis matemático del control óptimo. Se elige un modelo aproximado adecuado y se ajusta a los datos reales o a los datos sintéticos de la ABM. Los resultados de la TCO del modelo aproximado se trasladan entonces a la GPA que se va a probar: un proceso denominado «elevación», que podría aplicarse igualmente a los modelos detallados de simulación de epidemias considerados en este documento. Ahora describimos dos posibles marcos de la ingeniería de sistemas de control para hacer uso de este enfoque de elevación de control.

(a) Control de bucle abierto

El primer método es la aplicación más sencilla de la elevación de control, y el marco sugerido implícitamente por An et al. . El control se optimiza en el modelo aproximado una vez utilizando las condiciones iniciales del modelo de simulación. La estrategia de control óptima resultante se eleva al simulador y se aplica durante todo el tiempo de ejecución de la simulación (figura 1). La simulación repetida de la estrategia OCT en el modelo de simulación permite la evaluación frente a otras posibles estrategias de control. La optimización proporciona una estrategia única, dependiente del tiempo, para todas las realizaciones de la simulación, por lo que no incorpora ninguna retroalimentación. Por lo tanto, se denomina control «en bucle abierto», ya que está totalmente especificado por las condiciones iniciales de la simulación y la trayectoria predicha por el modelo aproximado. Su uso en epidemiología es poco frecuente, aunque Clarke et al. utilizan el TCO en un modelo aproximado para encontrar los niveles óptimos de cribado de clamidia y de rastreo de contactos, que luego se mapean en una simulación de red.

Figura 1. Control de bucle abierto y control predictivo del modelo (MPC). Se muestra la jerarquía del modelo, con los controles optimizados del modelo aproximado elevados directamente al modelo de simulación. El sistema real está en verde, los modelos y procesos de ajuste están en azul, y el marco de control está en naranja. Sin el bucle de retroalimentación punteado en naranja, se trata de un control de bucle abierto. El MPC restablece el estado del modelo aproximado en pasos regulares de actualización, antes de volver a optimizar y elevar los controles al modelo de simulación hasta el siguiente tiempo de actualización.

(b) Control predictivo del modelo

El control de lazo abierto requiere que el modelo aproximado siga siendo preciso a lo largo de la escala de tiempo de toda la epidemia. Sin embargo, por razones de trazabilidad, el modelo aproximado debe omitir necesariamente muchas heterogeneidades presentes en el modelo de simulación, como los efectos espaciales y la estructura de riesgo. Cuando las estrategias resultantes del TCO se aplican al modelo de simulación o al sistema real, es probable que el progreso de la enfermedad se desvíe sistemáticamente de la trayectoria predicha por el modelo aproximado. El control predictivo del modelo (CPM) es una técnica de optimización que incorpora la retroalimentación del sistema y que puede tener en cuenta estas perturbaciones. En momentos regulares de actualización, los valores de las variables de estado del modelo aproximado se reajustan para que coincidan con los de la simulación en ese momento. El control se vuelve a optimizar y la nueva estrategia de control se aplica a la simulación hasta el siguiente momento de actualización. Por lo tanto, los modelos aproximado y de simulación se ejecutan simultáneamente, con múltiples optimizaciones por realización, para garantizar que el modelo aproximado y la estrategia de control se ajusten estrechamente a cada realización individual de la simulación (figura 1). Estas optimizaciones múltiples son costosas desde el punto de vista computacional pero manejables, a diferencia de la realización de la optimización en el modelo de simulación completo.

El MPC ha tenido algún uso dentro de la literatura epidemiológica, siendo la mayoría para el control de aplicaciones de medicamentos para individuos individuales más que para el control de epidemias a nivel de población. Los ejemplos incluyen la búsqueda de estrategias de gestión para el VIH que sean robustas al ruido de medición y a los errores de modelización , y el control de la administración de insulina en pacientes con diabetes . Estos estudios ponen de manifiesto las ventajas de la MPC para un control robusto, es decir, un control que sigue siendo eficaz a pesar de las perturbaciones del sistema. Sin embargo, sólo un estudio se concentra en la gestión de epidemias , y que no prueba explícitamente el control de retroalimentación en las simulaciones.

Estrategias de optimización en un modelo de red ilustrativo

(a) Métodos

Para demostrar la gestión de epidemias en bucle abierto y MPC, utilizamos un modelo de red SIR estocástico que incluye la demografía del huésped y la estructura de riesgo. El modelo se mantiene deliberadamente simple para mostrar cómo la idea subyacente es ampliamente aplicable a través de enfermedades humanas, animales y vegetales. Aunque el modelo y sus parámetros son arbitrarios y no representan una enfermedad específica, lo utilizamos para representar un escenario en el que un modelo de simulación ya se ha ajustado a un sistema de enfermedad real; por lo tanto, el modelo de red se utiliza aquí como un sustituto de un modelo de simulación potencialmente muy detallado.

(i) Modelo de simulación

En nuestro modelo, la infección se propaga estocásticamente a través de una red de nodos que se agrupan en tres regiones distintas (figura 2a). Cada nodo contiene una población de huéspedes estratificada en grupos de alto y bajo riesgo. La infección puede propagarse entre individuos dentro de los nodos y entre nodos conectados. La tasa neta de infección del grupo de riesgo r en el nodo i viene dada por

Sir∑ jσij (ρrHI jH+ρrLI jL),3.1

donde S e I son números de huéspedes susceptibles e infectados, respectivamente, los subíndices identifican el nodo, y los superíndices especifican el grupo de alto (H) o bajo (L) riesgo. La suma es sobre todos los nodos conectados, incluyendo el propio nodo focal, con la fuerza de transmisión relativa en el nodo i desde el nodo j dada por σij, y la estructura de riesgo dada por la matriz 2 × 2 ρ. Los detalles completos del modelo se dan en el material suplementario electrónico, S1. Aunque no se limita a estas aplicaciones, el modelo de la ecuación (3.1) podría representar enfermedades de las cosechas o del ganado que se propagan por las granjas, o infecciones de transmisión sexual que se propagan por pueblos, ciudades o países.

Figura 2. (a) La red utilizada para el modelo de simulación ilustrativo, incluyendo las etiquetas de las regiones. La epidemia se siembra en el nodo rojo de la región A, y puede propagarse entre los nodos conectados (líneas grises). En (b), se muestra la asignación de control para una sola ejecución de MPC basada en el espacio, con la correspondiente asignación de bucle abierto indicada por la línea negra de puntos. (c) El número total de individuos infectados en una sola ejecución de control de bucle abierto basado en el espacio. El control se basa en la predicción del modelo aproximado a partir de las condiciones iniciales. (d) El número de individuos infectados en la simulación y el modelo aproximado basado en el espacio correspondiente al control MPC realizado en (b). Aquí la predicción se reajusta para que coincida con la simulación en cada paso de actualización (0,5 unidades de tiempo) y el control se vuelve a optimizar. Al corregir repetidamente las diferencias entre las predicciones del modelo a corto plazo y el número de individuos infectados realizado -en lugar de confiar en una predicción potencialmente cada vez más inexacta realizada en el momento inicial- el MPC ofrece mejores predicciones del estado de la simulación, así como un mejor control en comparación con el lazo abierto (nótese las diferentes escalas del eje y). a.u., unidades arbitrarias.

La vacunación masiva es la única intervención que consideramos, con el potencial de dirigirse tanto al grupo de riesgo como a la región, pero aleatorizada según el estado de infección del huésped (es decir la vacuna se administra a todos los huéspedes pero sólo es eficaz en los susceptibles). Las limitaciones logísticas y económicas se incluyen a través de una tasa de vacunación total máxima (ηmax) que puede dividirse entre los grupos de riesgo y las regiones. Dentro de cada grupo, los susceptibles se vacunan a una tasa: fηmaxS/N, donde f es la proporción de control asignada a ese grupo, y N es la población total del grupo.

La asignación óptima de los recursos de vacunación minimiza un coste epidémico J que representa la carga de enfermedad de la epidemia en todos los huéspedes infectados durante el tiempo de simulación (T): J=∫t=0TI(t) dt. En común con el control particular que consideramos y las estructuras de riesgo y espaciales, esta simple elección de la función objetivo se hizo simplemente para ilustrar nuestros métodos, pero el marco se generaliza inmediatamente a entornos más complejos.

(ii) Modelos aproximados

La optimización exhaustiva del control utilizando el modelo de simulación, a través del espacio, el grupo de riesgo y el tiempo, es claramente muy costosa computacionalmente. Para evaluar el mejor nivel de aproximación, consideramos dos modelos aproximados deterministas diferentes del simulador. El primer modelo está puramente estructurado en función del riesgo, eliminando toda la información espacial y dejando un grupo de población de alto riesgo y otro de bajo riesgo. Este modelo es determinista y se basa en el supuesto de que todos los nodos están bien mezclados espacialmente entre sí. El segundo modelo aproximado es más complejo, en la medida en que también es determinista y está estructurado en función del riesgo, pero además incluye una primera aproximación a la estructura espacial del huésped al incluir la información regional del mismo. Se incluye la dinámica espacial entre las tres regiones, pero no dentro de ellas, para mantener la suficiente simplicidad para obtener resultados de control óptimos, asumiendo así que los nodos están bien mezclados espacialmente dentro de cada región. Esto podría representar, por ejemplo, la optimización del control a nivel de país, pero no a nivel regional. Nos referimos a este modelo como el modelo espacial aproximado. Se ajusta un único conjunto de parámetros para cada modelo a los datos de un conjunto de ejecuciones del modelo de simulación. A continuación, comprobamos cuál de los dos modelos aproximados es más útil para la optimización del control. Los detalles completos de los modelos aproximados, los procedimientos de ajuste y optimización se dan en el material suplementario electrónico, S1 y S2.

(iii) Escenarios de control

Ponemos a prueba seis escenarios de control diferentes, que comparan la estrategia de prueba de los controles basada puramente en el modelo de simulación (escenarios 1 y 2) con el bucle abierto y el MPC aplicado utilizando nuestros dos modelos aproximados (escenarios 3-6):

  • (1) «Alto»: vacunar exclusivamente a los individuos de alto riesgo.

  • (2) ‘Split’: repartir los recursos de control entre los grupos de alto y bajo riesgo en base a una optimización realizada de antemano.

  • (3) ‘Risk OL’: control en bucle abierto utilizando el modelo aproximado basado en el riesgo.

  • (4) ‘Risk MPC’: MPC utilizando el modelo aproximado basado en el riesgo.

  • (5) ‘Space OL’: control de bucle abierto utilizando el modelo aproximado espacial.

  • (6) ‘Space MPC’: MPC usando el modelo aproximado espacial.

La asignación constante óptima para la estrategia ‘Split’ se encontró ejecutando muchas realizaciones del modelo de simulación para cada uno de un rango de valores de partición, como en , y seleccionando el valor que daba el menor coste epidémico medio (material suplementario electrónico, figura S8). Las seis estrategias se evalúan ejecutando repetidamente el modelo de simulación bajo cada escenario de control.

(b) Resultados

Los resultados de la OCT para optimizar la estrategia de vacunación en el modelo aproximado basado en el riesgo conducen a la vacunación inicial sólo de los individuos de alto riesgo, antes de cambiar las prioridades y tratar el grupo de bajo riesgo más poblado casi exclusivamente. Los resultados de la OCT del modelo aproximado espacial muestran este mismo cambio (figura 2b), pero también se observan varios cambios espaciales, lo que permite controlar el seguimiento de la epidemia a medida que avanza por las tres regiones (material suplementario electrónico, figura S9). Las estrategias espaciales son, por tanto, mucho más complejas que los controles basados en el riesgo.

La aplicación de los escenarios de control al modelo de simulación y la comparación de los costes de la epidemia muestran que la incorporación de un mayor realismo, a través de un modelo aproximado más complejo, así como mediante el uso de MPC, permite mejorar la gestión de la enfermedad (figura 3 y material suplementario electrónico, figura S10). De las estrategias constantes y puramente basadas en la simulación «definidas por el usuario», la división del control entre los grupos de riesgo es ligeramente más eficaz que la simple vacunación del grupo de alto riesgo. La asignación óptima al grupo de alto riesgo utilizada en la estrategia ‘Dividir’ es del 63% de los recursos de vacunación, y el resto se utiliza para vacunar a los individuos de bajo riesgo, aunque esto ocurre en un amplio mínimo de coste epidémico (material suplementario electrónico, figura S8). La aplicación de las optimizaciones del modelo aproximado basado en el riesgo al modelo de simulación ofrece una mejora con respecto a cualquiera de las estrategias «definidas por el usuario», aunque hay poca diferencia en el coste de la epidemia entre los marcos de bucle abierto y MPC (véase más adelante). La adición de espacio en el modelo aproximado mejora aún más el control, dando lugar a los menores costes epidémicos cuando se utiliza el marco MPC espacial.

Figura 3. Resultados de diferentes esquemas de optimización del control en el modelo de simulación ilustrativo. El MPC espacial es el que mejor se comporta, mostrando una mejora con respecto a las estrategias de bucle abierto (OL) y las definidas por el usuario. a.u., unidades arbitrarias.

El modelo ilustrativo demuestra las mejoras de gestión que pueden conseguirse combinando el OCT con el bucle abierto y el MPC. Los resultados clave de los análisis OCT son los tiempos de conmutación de los controles. El uso de los controles de conmutación de cualquiera de los dos modelos aproximados con el control de bucle abierto ofrece unos costes de epidemia más bajos que las estrategias «definidas por el usuario» elegidas ingenuamente. La retroalimentación presente en los controladores MPC permite reducir aún más el coste epidémico. Al reevaluar el tiempo de los interruptores durante la epidemia, y al incluir potencialmente interruptores adicionales, el control puede responder más estrechamente a la trayectoria exacta de la realización de la simulación actual (figura 2b-d). Esto proporciona un control más robusto a la incertidumbre y a los errores sistemáticos en el modelo aproximado, y por lo tanto se desempeña mejor en el modelo de simulación complejo.

En las estrategias basadas en el riesgo, hay poca diferencia entre el lazo abierto y el MPC. Esto se debe a que el momento preciso del cambio de la vacunación de los grupos de alto a los de bajo riesgo no afecta significativamente al coste de la epidemia (material suplementario electrónico, figura S11). Los tiempos de introducción de la enfermedad en las regiones B y C son muy variables entre las ejecuciones de la simulación (material suplementario electrónico, figura S2). El potencial de interruptores adicionales en el modelo aproximado espacial da más flexibilidad al controlador MPC para responder a esta variabilidad, por lo que el MPC espacial muestra una mejora significativa sobre el lazo abierto, que no puede adaptarse a las perturbaciones. El rendimiento del control está estrechamente relacionado con la precisión del modelo aproximado. En nuestro ejemplo, la dinámica espacial es claramente importante debido al momento de propagación entre regiones, y por ello los controles más informados del modelo espacial superan a las estrategias basadas en el riesgo.

Discusión

Nuestros resultados muestran que la elección del modelo aproximado afecta al rendimiento tanto de las estrategias de bucle abierto como del MPC. Aquí hemos encontrado un modelo aproximado adecuado de forma ad hoc, pero un reto clave para el futuro es desarrollar un método más formal para elegir el modelo aproximado más apropiado. Un modelo más preciso puede dar mejores predicciones y, por tanto, un control más cercano al verdadero óptimo, pero los modelos más sencillos suelen ser suficientes y la precisión debe equilibrarse con la complejidad añadida y las restricciones de optimización. Una de las dificultades es que no siempre está claro dónde está el límite de la viabilidad matemática o computacional y, por tanto, la complejidad del modelo en la práctica. También es difícil determinar matemáticamente, de forma sistemática, qué aspectos de la dinámica es importante captar con precisión. Sin embargo, hay que tener en cuenta esta cuestión clave, ya que las implicaciones se relacionan directamente con las aplicaciones en el mundo real.

El control práctico de enfermedades requiere estudios del sistema real para evaluar el estado de la epidemia. Tanto el lazo abierto como el MPC optimizan el control utilizando predicciones de la dinámica futura, por lo que ambos son controladores feed-forward. El modelo aproximado en el que se basan estos marcos permite tomar decisiones más informadas entre los estudios, lo que da lugar a un control más cercano al verdadero óptimo. Las predicciones precisas pueden evitar la realización de sondeos continuos o muy frecuentes, que pueden resultar caros o difíciles desde el punto de vista logístico. Como se ha comentado anteriormente, las actualizaciones repetidas en el bucle de retroalimentación del MPC mejoran estas predicciones y, por tanto, el rendimiento del control. Sin embargo, cada actualización requerirá la vigilancia del sistema real, por lo que la frecuencia de las actualizaciones debe elegirse de forma que se equilibre la mejora del conocimiento del sistema con cualquier restricción de vigilancia.

En este trabajo, nos hemos centrado en un enfoque descendente, encontrando estrategias robustas y aplicables en la práctica haciendo uso de la OCT para optimizar los modelos de simulación. Igualmente, muchos estudios utilizan la TCO sin modelos de simulación, y rara vez consideran la aplicación práctica de los controles óptimos resultantes. Con este enfoque ascendente, un sistema para probar los resultados en sistemas realistas es vital para asegurar que estos resultados son robustos con un realismo adicional. El uso de un marco de MPC como el que se considera aquí podría ser una forma en la que los investigadores de OCT podrían demostrar el impacto potencial de su trabajo a un público más amplio.

La prueba exhaustiva de parametrizaciones de modelos de simulación alternativos está más allá del alcance de este estudio, pero en general encontramos que el MPC espacial también se desempeña mejor a través de otros conjuntos de parámetros razonables (material suplementario electrónico, S3). Hemos asumido en todo momento que se puede construir un modelo de simulación preciso del sistema real en cuestión y que se puede ajustar un único conjunto de parámetros para el modelo aproximado determinista elegido. En realidad, puede haber una incertidumbre considerable en los parámetros del simulador, por lo que ajustar un único modelo determinista puede ser un reto. Una cuestión a estudiar en el futuro sería cómo manejar estas incertidumbres, quizás incorporando también un mejor conocimiento de los parámetros a medida que avanza la simulación.

Las estrategias encontradas por OCT dependen en gran medida de la forma exacta de la función objetivo, que aquí hemos elegido que sea muy simple. La ampliación del objetivo para incluir los costes asociados al control, así como a cada cambio de estrategia, permitiría una evaluación más detallada de la viabilidad de la aplicación de estas complejas estrategias. Es necesario investigar más sobre cómo cuantificar el equilibrio de costes muy diferentes aunque, por ejemplo, los costes del tratamiento y la carga de la enfermedad . En las enfermedades humanas, los análisis de rentabilidad suelen basarse en los años de vida ajustados a la calidad. Un concepto similar podría utilizarse para las enfermedades de las plantas y los animales, incluyendo el cálculo de las pérdidas de rendimiento, así como los efectos sobre el bienestar, la biodiversidad y el turismo, por ejemplo. Sin embargo, los métodos que hemos descrito no dependen de la forma de la función de control u objetivo. Para un modelo aproximado adecuado, la retroalimentación en el MPC garantiza la precisión de las predicciones y, por tanto, debería mejorar siempre el rendimiento con respecto al lazo abierto. Los marcos que describimos pueden utilizarse para proporcionar un escenario de control insesgado adicional al proceso de comprobación de estrategias que ya es de uso común.

En este trabajo, hemos demostrado que el acoplamiento del control de retroalimentación con los modelos de simulación y el TCO puede ayudar a diseñar estrategias de intervención eficaces y robustas para la gestión de patógenos de poblaciones humanas, animales y vegetales. Si bien estas técnicas pueden trasladar los resultados del control óptimo a simulaciones más realistas y, por tanto, a la aplicación práctica, las estrategias encontradas plantean el problema de la comunicabilidad de los resultados. Con estrategias de retroalimentación complejas entre dos modelos, uno de estructura compleja y el otro de complejidad matemática, el resultado global ya no es sencillo de explicar. Por lo tanto, la investigación futura debe centrarse en mejorar la precisión de los modelos de simulación y analizar su fiabilidad, de modo que las simulaciones puedan utilizarse para establecer de forma concluyente el beneficio de estas complejas estrategias basadas en la TCO.

Accesibilidad a los datos

Todo el código y las animaciones están disponibles en https://github.com/ehbussell/Bussell2018Model.

Contribuciones de los autores

Intereses en competencia

No tenemos intereses en competencia.

Financiación

E.H.B. agradece al Consejo de Investigación en Biotecnología y Ciencias Biológicas del Reino Unido (BBSRC) su apoyo a través de una beca de doctorado de la Universidad de Cambridge.

Agradecimientos

Damos las gracias a Andrew Craig, Eleftherios Avramidis y Hola Adrakey por sus útiles discusiones. También agradecemos a dos revisores anónimos sus útiles y constructivos comentarios.

Notas a pie de página

Una contribución de 16 a un número temático «Modelización de brotes de enfermedades infecciosas en humanos, animales y plantas: previsión y control de epidemias».

El material complementario electrónico está disponible en línea en https://dx.doi.org/10.6084/m9.figshare.c.4462796.

© 2019 The Author(s)

Published by the Royal Society. Todos los derechos reservados.

Leave a Reply