Función de la corteza frontal derivada de la codificación predictiva jerárquica
Aquí mostramos cómo el modelo HER puede simular y dar cuenta de una variedad de hallazgos empíricos publicados en el dlPFC y el mPFC. Los resultados que se presentan a continuación no son en absoluto exhaustivos. Sirven para enfatizar el punto principal de que el modelo HER del CPF, como una instancia de las formulaciones de codificación predictiva, es capaz de aprender de forma autónoma tareas complejas de una manera que reproduce los patrones de comportamiento, los efectos neuropsicológicos y la actividad neural medida por fMRI, EEG, neurofisiología de unidad única observada en la investigación empírica. Los detalles de las simulaciones se pueden encontrar en el material suplementario, junto con una descripción de las ecuaciones que definen el modelo HER. El material suplementario también incluye otras simulaciones que demuestran más del poder explicativo del modelo HER.
Simulación 1: Contexto, Memoria de Trabajo, & Control
El papel del dlPFC en la memoria de trabajo y la representación de la estructura de la tarea sigue siendo una preocupación de investigación en curso. En las últimas dos décadas, numerosos estudios de fMRI han investigado la estructura y la función del dlPFC bajo varias tareas jerárquicas y demandas de memoria de trabajo. En Koechlin et al.24, los autores investigaron la función del dlPFC en dos tareas mientras manipulaban la cantidad de información transmitida por los estímulos relevantes para la tarea. En su condición motora, se observó que la actividad en todo el dlPFC -desde las áreas etiquetadas como PMd (corteza premotora dorsal) hasta el dlPFC rostral- aumentaba monotónicamente a medida que aumentaba el contenido de información de una pista contextual (Fig. 2B). Sólo se observó un aumento adicional de la actividad en la PMd cuando se pidió a los sujetos que dieran dos respuestas en lugar de una sola. En la Simulación 1 (Fig. 2A,C), el modelo HER explica la tendencia general de aumento de la actividad en el dlPFC a medida que aumenta la fuerza de las representaciones de predicción de error aprendidas por el modelo – más información significa más errores potenciales que deben ser contabilizados. El resumen de la actividad del modelo para cada condición se correlaciona con el cambio de la señal BOLD observado en los datos de los humanos tanto para la condición motora (r = 0,70, p < 0,001) como para la condición de tarea (r = 0,75, p < 0,001). Esta cuenta complementa el modelo de cascada de información24 basado en las formulaciones de la teoría de la información; en la teoría de la información, la información es la cantidad en la que la incertidumbre sobre una variable aleatoria disminuye dada otra variable. Las predicciones de error aprendidas por el modelo HER se utilizan para modular las predicciones de resultados con el fin de apoyar el comportamiento correcto, es decir, su función es reducir la incertidumbre sobre los resultados probables de las acciones. El modelo HER explica el aumento adicional de la actividad observado en PMd a través de la actualización transitoria de las representaciones (ver material suplementario) en el nivel más bajo del modelo cuando los estímulos sucesivos exigen respuestas diferentes, mientras que las condiciones en las que sólo se requiere una única respuesta no implican una actualización adicional (Fig. 2A, abajo).
Simulación 2: Representación aprendida
Aunque el modelo HER es capaz de capturar una serie de resultados relacionados con la actividad de conjuntos de neuronas reflejados por la señal BOLD (véase el material suplementario), también postula un esquema de representación particular desplegado en el dlPFC. A saber, las unidades individuales en el modelo HER dlPFC codifican cada una un componente de una predicción de error multidimensional. Además de capturar los datos relacionados con la fuerza de la actividad observada en el dlPFC, el modelo HER también debería ser capaz de dar cuenta de los datos relacionados con la actividad de las neuronas individuales, así como de las técnicas diseñadas para decodificar la actividad neuronal, como el MVPA.
Para investigar si las representaciones de predicción de errores aprendidas por el modelo HER son consistentes con las observadas en sujetos humanos, registramos la actividad del modelo mientras realizaba la tarea de rendimiento continuo 1-2AX (Simulación 2, Fig. 3A). Posteriormente, clasificamos las representaciones activas en el modelo durante los periodos de la tarea en los que se habían mostrado al modelo variables de contexto de alto y bajo nivel (véase Métodos en línea), pero antes de que se mostrara una posible señal de objetivo. Este enfoque es similar a los análisis de patrones multivoxel reportados por Nee & Brown11. La clasificación de las representaciones del modelo es consistente con la observada en sujetos humanos (Fig. 3A): en el nivel jerárquico más bajo, las secuencias que pueden culminar en una respuesta objetivo (1 A/2B) y las que seguramente no culminarán en una respuesta objetivo (1B/2 A) están representadas de forma distinta (Fig. 3A, abajo). Sin embargo, las representaciones también se solapan parcialmente, de forma que las secuencias 1 A se clasifican parcialmente como secuencias 2B, mientras que las secuencias 1B se clasifican parcialmente como secuencias 2 A. En el nivel 2 del modelo HER, la clasificación de cada secuencia es más decisiva, y cada secuencia única (1 A/1B/2 A/2B) se decodifica sin ambigüedad (Fig. 3A, Medio). Este resultado es similar a los datos humanos, en los que una región en la parte media del CPD muestra una tendencia hacia una mayor evidencia de codificación de secuencias únicas. Finalmente, en el tercer nivel jerárquico (Fig. 3A, Superior), las secuencias que comienzan con 1 o 2 están cada una colapsada (es decir, igual evidencia para 1 A y 1B), reflejando el papel de la dlPFC rostral en la codificación de variables de contexto de alto nivel. El modelo HER explica la confusión de una secuencia objetivo con otra (1 A/2B) y de una secuencia no objetivo con otra (1B/2 A) en el nivel jerárquico más bajo como consecuencia de la mayor activación de una respuesta predicha común a ambos tipos de secuencias: una respuesta objetivo en la primera condición, y una respuesta no objetivo en la segunda.
Simulación 3: Neurofisiología de una sola unidad
El esquema de representación propuesto por el modelo HER sugiere que las neuronas individuales en la CPFl deberían codificar los componentes de una representación de error distribuida, con unidades individuales que señalan la identidad y la probabilidad de observar un error particular. El modelo sugiere además que estas señales deberían evolucionar a lo largo de un ensayo a medida que la probabilidad de observar tipos específicos de errores aumenta o disminuye. Registramos la actividad del modelo mientras realizaba una tarea de emparejamiento retrasado de la muestra (Simulación 3). En consonancia con los tipos de unidades observadas registradas en monos macacos34 , se identificaron unidades en el modelo HER con una mayor actividad tras la aparición de una sonda objetivo que coincidía con la muestra (aumento de la coincidencia; Fig. 3B), mientras que se identificaron unidades distintas cuya actividad disminuía tras un objetivo coincidente (supresión de la coincidencia; Fig. 3B). El modelo HER explica estos dos tipos de neuronas como la modulación de las predicciones con respecto a las posibles respuestas tras la presentación de un objetivo. Cuando se presenta un objetivo coincidente, la actividad de las unidades que predicen una respuesta «coincidente» aumenta (aumento) mientras que la actividad de las unidades que predicen una respuesta «no coincidente» disminuye (supresión). El modelo HER sugiere además, a priori, que deberían observarse tipos adicionales de neuronas en el CPFl, a saber, neuronas de potenciación y supresión de la falta de coincidencia, es decir, neuronas cuya actividad refleja el aumento y la disminución de la probabilidad de dar una respuesta de no coincidencia y de coincidencia, respectivamente.
Simulación 4: Selectividad mixta
Una prueba más del esquema de representación del error postulado por el modelo HER es examinar si las representaciones del error aprendidas por el modelo pueden explicar la diversidad de tipos de neuronas comúnmente observadas en estudios neurofisiológicos de una sola unidad. Las neuronas individuales en el CPF muestran habitualmente una selectividad mixta35 , respondiendo de forma heterogénea a combinaciones de estímulos relevantes para la tarea. Para investigar si las unidades del modelo HER muestran una selectividad mixta, simulamos el modelo en una variación de la tarea DMTS36 en la que las sondas de muestra y objetivo iban precedidas de una regla que indicaba si el modelo debía dar una respuesta de objetivo a las combinaciones de muestra/objetivo ADECUADAS (como en el DMTS habitual), o si el modelo debía dar una respuesta de objetivo a las combinaciones de muestra/objetivo NO ADECUADAS. La actividad del modelo registrada en el nivel 2 de la jerarquía HER revela un grupo de 6 unidades cuya actividad se asoció de forma fiable con el rendimiento de la tarea (Fig. 4). Dos de estas unidades respondieron exclusivamente a la señal de la regla: una unidad estuvo activa tras las señales de COINCIDENCIA, y silenciosa para las señales de NO COINCIDENCIA, mientras que la otra mostró el patrón opuesto. Las unidades restantes mostraron patrones complejos de actividad a través de la regla, la modalidad y las condiciones de identidad de la imagen, consistentes con los tipos de neuronas observados en el CPF de los primates.
Simulación 5: Las bases neurales del comportamiento en el córtex prefrontal
Además de reproducir los efectos de los datos de fMRI en humanos y de los estudios de neurofisiología de una sola unidad en mono respecto a la naturaleza de las representaciones en el PFC, el modelo HER también sugiere cómo estas representaciones pueden influir en los patrones de comportamiento. Para investigar la influencia de las representaciones organizadas jerárquicamente en el curso temporal de los comportamientos aprendidos, simulamos el modelo (Simulación 5, Fig. 5) en una tarea de estimación de probabilidad ternaria37 en la que se pedía a los sujetos que estimaran la probabilidad de que un estímulo compuesto, que variaba a lo largo de dos dimensiones de características, perteneciera a cada una de las tres categorías. Nuestras simulaciones difieren de la tarea original en que, en el experimento con humanos, se permitía a los sujetos elegir muestras de un espacio de problemas bidimensional, mientras que en nuestras simulaciones se mostraban al modelo muestras seleccionadas al azar. No obstante, el comportamiento objetivo tanto del experimento como de nuestras simulaciones era el mismo, es decir, los juicios de probabilidad de las categorías. Los sujetos humanos adoptaron tres estrategias diferentes en sus juicios de probabilidad correspondientes a su comportamiento de muestreo (Fig. 5, fila inferior): un grupo (Least Certain, LC, izquierda) asignó sistemáticamente probabilidades casi iguales para cada categoría, un segundo grupo (Label Margin, LM, centro) asignó una probabilidad baja a una categoría y probabilidades aproximadamente iguales a las otras dos, mientras que el grupo final (Most Certain, MC, derecha) asignó una probabilidad alta a una categoría y probabilidades bajas a las otras. Se observaron patrones de comportamiento similares en el modelo HER durante los experimentos simulados en los que se manipuló la tasa de aprendizaje de la siguiente manera (Fig. 5, fila superior). En las simulaciones en las que se desactivó todo el aprendizaje, las estimaciones de probabilidad del modelo correspondieron al grupo LC. Cuando se habilitó el aprendizaje sólo para el nivel jerárquico más bajo, el comportamiento del modelo corresponde al grupo LM, reflejando representaciones aprendidas que permiten al modelo descartar una de las tres categorías pero que carecen de la información de orden superior necesaria para distinguir entre las dos restantes. Por último, cuando se habilita el aprendizaje para todos los niveles, el modelo aprende rápidamente toda la tarea, lo que corresponde al comportamiento del grupo MC. En el modelo HER, estos comportamientos están íntimamente ligados a las predicciones de error aprendidas: el modelo descompone una tarea seleccionando, en cada nivel jerárquico, la característica del estímulo que mejor reduce la incertidumbre de la respuesta. En este último caso, el comportamiento del modelo progresa rápidamente a través de los comportamientos asociados a la desactivación del aprendizaje en etapas sucesivas: inicialmente el comportamiento del modelo corresponde al grupo LC, seguido de LM, antes de converger en una solución al problema de estimación ternaria, lo que sugiere cómo el aprendizaje realista puede requerir la adquisición de asociaciones de bajo nivel antes del desarrollo de representaciones de nivel superior. El modelo HER proporciona, por tanto, una explicación de cómo las representaciones neuronales adquiridas durante el aprendizaje podrían contribuir a los patrones de comportamiento: la incapacidad de formar representaciones de orden superior no sólo influye en los juicios de probabilidad, sino que además puede informar sobre el muestreo autodirigido de información.
Simulación 6 & 7: Interacción del CPM y el CPD
El modelo HER, al ser una extensión del modelo de respuesta-resultado predicho (PRO) del CAC/ CPM, ya captura una amplia gama de efectos observados dentro del CAC7,25. El modelo HER va más allá del modelo PRO en dos aspectos fundamentales: en primer lugar, especifica cómo la CPM y la CPDL pueden interactuar para apoyar comportamientos sofisticados y, en segundo lugar, sugiere una organización jerárquica paralela de la CPM en la que las sucesivas regiones jerárquicas informan de señales de error cada vez más abstractas. Esta organización de la CPM se ha propuesto anteriormente38,39 y, de hecho, se han encontrado pruebas que apoyan el papel de la CPM en el procesamiento de errores jerárquicos27. El modelo HER es capaz de capturar el patrón de actividad observado por Kim et al.26 (Simulación 6) para distintas regiones tanto de la CPM como de la CPDL (Fig. 6A, columna central). El modelo HER interpreta la actividad en las regiones jerárquicamente organizadas de la CPM como la discrepancia entre los resultados cada vez más abstractos predichos y los observados, lo que es coherente con el papel de la CPM en el cálculo de errores propuesto por el modelo PRO7,25, y complementa la interpretación de Kim et al. Sin embargo, mientras que su noción de señales de error de orden superior se especifica cualitativamente, los errores sucesivamente más abstractos en el modelo HER son producto de predicciones cuantitativas a niveles inferiores que son insuficientes para explicar las observaciones de un sujeto, en línea con el marco de codificación predictiva que informa la estructura del modelo HER.
La evidencia adicional con respecto a la interacción del CPDL y el CPMm proviene de estudios de pacientes con lesiones del CPDL40. En una tarea de emparejamiento retardado con una muestra, se observa una Negatividad Relacionada con el Error (ERN) en sujetos con lesiones en el dlPFC tanto para los ensayos correctos como para los incorrectos (Fig. 6B, columna izquierda). El modelo HER (Simulación 7, Fig. 6B) explica esto como la incapacidad de mantener información relevante a través de un periodo de retraso para modular las predicciones sobre los resultados probables (Fig. 6B, columna derecha). Sin esta información contextual adicional disponible en el modelo, tanto los resultados correctos como los incorrectos son sorprendentes, lo que resulta en un aumento de la actividad del CPM en una versión lesionada del modelo HER en ambos tipos de ensayos.
Leave a Reply