Frontal cortex function as derived from hierarchical predictive coding
Here we show how the HER model can simulate and account for a variety of published empirical findings in the dlPFC and mPFC. Przedstawione poniżej wyniki nie są bynajmniej wyczerpujące. Służą one podkreśleniu głównego punktu, że model HER PFC, jako instancja formuł kodowania predykcyjnego, jest w stanie autonomicznie uczyć się złożonych zadań w sposób, który odtwarza wzorce zachowania, efekty neuropsychologiczne i aktywność neuronalną mierzoną przez fMRI, EEG i neurofizjologię pojedynczych jednostek obserwowaną w badaniach empirycznych. Szczegóły symulacji można znaleźć w materiale dodatkowym, wraz z opisem równań definiujących model HER. Materiał uzupełniający zawiera również dalsze symulacje, które pokazują większą moc wyjaśniającą modelu HER.
Symulacja 1: Kontekst, pamięć robocza, &kontrola
Rola dlPFC w pamięci roboczej i reprezentacji struktury zadania pozostaje przedmiotem ciągłych badań. W ciągu ostatnich dwóch dekad w licznych badaniach fMRI badano strukturę i funkcję dlPFC przy różnych hierarchicznych zadaniach i wymaganiach pamięci roboczej. W pracy Koechlin i wsp.24 autorzy badali funkcję dlPFC w dwóch zadaniach, manipulując jednocześnie ilością informacji przekazywanych przez bodźce istotne dla zadania. W ich Motor Condition zaobserwowano, że aktywność w całej dlPFC – od obszarów oznaczonych jako PMd (dorsal premotor cortex) do rostralnej dlPFC – wzrastała monotonicznie wraz ze wzrostem zawartości informacyjnej wskazówki kontekstowej (ryc. 2B). Dodatkowy wzrost aktywności obserwowano tylko w PMd, gdy od badanych wymagano dwóch odpowiedzi zamiast jednej. W Symulacji 1 (Rys. 2A,C), model HER odpowiada za ogólny trend wzrostu aktywności w dlPFC jako rosnącą siłę reprezentacji przewidywania błędów wyuczonych przez model – więcej informacji oznacza więcej potencjalnych błędów, które muszą być uwzględnione. Sumaryczna aktywność modelu dla każdego warunku koreluje ze zmianą sygnału BOLD obserwowaną w danych ludzkich zarówno dla warunku motorycznego (r = 0,70, p < 0,001) jak i warunku zadaniowego (r = 0,75, p < 0,001). Ten rachunek uzupełnia model kaskady informacyjnej24 oparty na sformułowaniach teorii informacji; w teorii informacji, informacja jest wielkością, o jaką zmniejsza się niepewność dotycząca zmiennej losowej, biorąc pod uwagę inną zmienną. Przewidywania błędów wyuczone przez model HER są używane do modulowania przewidywań wyników w celu wspierania poprawnego zachowania – to znaczy, ich rolą jest redukcja niepewności dotyczącej prawdopodobnych wyników działań. Model HER odpowiada za dodatkowy wzrost aktywności obserwowany w PMd poprzez przejściową aktualizację reprezentacji (patrz materiał uzupełniający) na najniższym poziomie modelu, gdy kolejne bodźce nakazują różne odpowiedzi, podczas gdy warunki, w których wymagana jest tylko pojedyncza odpowiedź, nie pociągają za sobą dodatkowej aktualizacji (ryc. 2A u dołu). 2A, dół).
Symulacja 2: Wyuczona Reprezentacja
Pomimo, że model HER jest w stanie uchwycić szereg wyników związanych z aktywnością zespołów neuronów odzwierciedloną przez sygnał BOLD (patrz materiał uzupełniający), zakłada on również szczególny schemat reprezentacji wdrożony w dlPFC. Mianowicie, pojedyncze jednostki w modelu HER dlPFC kodują składową wielowymiarowej predykcji błędu. Oprócz przechwytywania danych związanych z siłą aktywności obserwowanej w dlPFC, model HER powinien również być w stanie uwzględnić dane związane z aktywnością poszczególnych neuronów, jak również techniki zaprojektowane do dekodowania aktywności neuronalnej, takie jak MVPA.
Aby zbadać, czy reprezentacje przewidywania błędów wyuczone przez model HER są zgodne z tymi obserwowanymi u ludzi, zarejestrowaliśmy aktywność modelu podczas wykonywania zadania 1-2AX ciągłej wydajności (Symulacja 2, Ryc. 3A). Następnie sklasyfikowaliśmy aktywne reprezentacje w modelu podczas okresów zadania, w których modelowi pokazywano zmienne kontekstowe wysokiego i niskiego poziomu (patrz Metody Online), ale przed wyświetleniem potencjalnej wskazówki docelowej. Podejście to jest podobne do analizy wzorca wielu wokseli opisanej przez Nee & Brown11. Klasyfikacja reprezentacji modelu jest zgodna z tą obserwowaną u ludzi (ryc. 3A): na najniższym poziomie hierarchicznym sekwencje, które mogą zakończyć się reakcją docelową (1 A/2B) i te, które z pewnością nie zakończą się reakcją docelową (1B/2 A) są reprezentowane w odrębny sposób (ryc. 3A, dół). Jednakże, reprezentacje te również częściowo się pokrywają, tak że sekwencje 1 A są częściowo skategoryzowane jako sekwencje 2B, podczas gdy sekwencje 1B są częściowo skategoryzowane jako sekwencje 2 A. Na poziomie 2 modelu HER, klasyfikacja każdej sekwencji jest bardziej decydująca, przy czym każda unikalna sekwencja (1 A/1B/2 A/2B) jest jednoznacznie dekodowana (Rys. 3A, Middle). Wynik ten jest podobny do danych uzyskanych u ludzi, w których region w środkowej części dolnej części mózgu wykazuje tendencję do zwiększania dowodów na kodowanie unikalnych sekwencji. Wreszcie, na trzecim poziomie hierarchii (ryc. 3A, góra), sekwencje zaczynające się od 1 lub 2 są kolapsowane (tj. jednakowe dowody dla 1 A i 1B), co odzwierciedla rolę rostralnej dlPFC w kodowaniu zmiennych kontekstowych wysokiego poziomu. Model HER wyjaśnia mylenie jednej sekwencji docelowej z inną (1 A/2B) i jednej sekwencji nie-celowej z inną (1B/2 A) na najniższym poziomie hierarchii jako konsekwencję zwiększonej aktywacji przewidywanej reakcji wspólnej dla obu typów sekwencji – reakcji docelowej w pierwszym warunku i reakcji nie-celowej w drugim.
Symulacja 3: Neurofizjologia pojedynczych jednostek
Schemat reprezentacji zaproponowany przez model HER sugeruje, że pojedyncze neurony w lPFC powinny kodować komponenty rozproszonej reprezentacji błędu, z pojedynczymi jednostkami sygnalizującymi tożsamość i prawdopodobieństwo zaobserwowania konkretnego błędu. Model sugeruje ponadto, że sygnały te powinny ewoluować w trakcie trwania próby, w miarę jak prawdopodobieństwo zaobserwowania określonych typów błędów wzrasta lub maleje. Zarejestrowaliśmy aktywność w modelu podczas wykonywania przez niego zadania opóźnionego dopasowania do próbki (DMTS) (Symulacja 3). Zgodnie z typami jednostek zaobserwowanymi u małp makaków34, w modelu HER zidentyfikowano jednostki o zwiększonej aktywności po pojawieniu się sondy docelowej, która pasowała do próbki (wzmocnienie dopasowania; ryc. 3B), podczas gdy zidentyfikowano odrębne jednostki, których aktywność spadła po pojawieniu się dopasowanego celu (tłumienie dopasowania; ryc. 3B). Model HER ujmuje te dwa typy neuronów jako modulację przewidywań dotyczących możliwych odpowiedzi po prezentacji wskazówki docelowej. Gdy prezentowany jest pasujący cel, aktywność jednostek przewidujących odpowiedź „pasującą” wzrasta (wzmocnienie), podczas gdy aktywność jednostek przewidujących odpowiedź „niedopasowaną” spada (tłumienie). Model HER sugeruje ponadto a priori, że w lPFC powinny być obserwowane dodatkowe typy neuronów, a mianowicie neurony wzmacniające i tłumiące niedopasowanie – neurony, których aktywność odzwierciedla zwiększone i zmniejszone prawdopodobieństwo wykonania odpowiednio odpowiedzi niedopasowanej i dopasowanej.
Symulacja 4: Mieszana selektywność
Kolejnym testem schematu reprezentacji błędów postulowanego przez model HER jest zbadanie, czy reprezentacje błędów wyuczone przez model mogą wyjaśnić różnorodność typów neuronów powszechnie obserwowanych w badaniach neurofizjologicznych pojedynczych jednostek. Pojedyncze neurony w PFC rutynowo wykazują mieszaną selektywność35 , reagując w heterogeniczny sposób na kombinacje bodźców istotnych dla zadania. Aby zbadać, czy jednostki w modelu HER wykazują selektywność mieszaną, przeprowadziliśmy symulację modelu na wariacji zadania DMTS36 , w którym próbki i sondy docelowe były poprzedzone wskazówką regułową wskazującą, czy model powinien zareagować na kombinacje pasujących próbek i celów (jak w zwykłym DMTS), czy też powinien zareagować na kombinacje NIE pasujących próbek i celów. Aktywność modelu zarejestrowana z poziomu 2 hierarchii HER ujawnia skupisko 6 jednostek, których aktywność była wiarygodnie związana z wykonaniem zadania (Rys. 4). Dwie z tych jednostek reagowały wyłącznie na podpowiedź reguły – jedna z nich była aktywna przy podpowiedzi MATCHING, a milcząca przy podpowiedzi NON-MATCHING, podczas gdy druga wykazywała odwrotny wzorzec. Pozostałe jednostki wykazywały złożone wzorce aktywności w warunkach reguły, modalności i tożsamości obrazu, zgodne z typami neuronów obserwowanymi w PFC naczelnych.
Symulacja 5: Neuronalne podstawy zachowania w korze przedczołowej
Oprócz odtworzenia efektów danych z ludzkiego fMRI i badań neurofizjologicznych pojedynczych jednostek u małp, dotyczących natury reprezentacji w PFC, model HER sugeruje również, jak te reprezentacje mogą wpływać na wzorce zachowania. W celu zbadania wpływu hierarchicznie zorganizowanych reprezentacji na przebieg czasowy wyuczonych zachowań, przeprowadziliśmy symulację modelu (Symulacja 5, Rys. 5) na trójskładnikowym zadaniu szacowania prawdopodobieństwa37 , w którym badani mieli oszacować prawdopodobieństwo, że bodziec złożony, różniący się na dwóch wymiarach cech, należy do każdej z trzech kategorii. Nasze symulacje różnią się od oryginalnego zadania tym, że w eksperymencie na ludziach, badani mogli wybierać próbki z dwuwymiarowej przestrzeni problemowej, podczas gdy w naszych symulacjach, modelowi pokazywano losowo wybrane próbki. Niemniej jednak, docelowe zachowanie zarówno w eksperymencie, jak i w naszych symulacjach było takie samo, mianowicie sądy o prawdopodobieństwie kategorii. Stwierdzono, że ludzie przyjmują trzy różne strategie w swoich sądach o prawdopodobieństwie, odpowiadające ich zachowaniom związanym z próbkowaniem (Rys. 5, dolny rząd): jedna grupa (Least Certain, LC, po lewej) konsekwentnie przypisywała niemal równe prawdopodobieństwa każdej kategorii, druga grupa (Label Margin, LM, pośrodku) przypisywała niskie prawdopodobieństwo jednej kategorii i w przybliżeniu równe prawdopodobieństwa dwóm pozostałym, podczas gdy ostatnia grupa (Most Certain, MC, po prawej) przypisywała wysokie prawdopodobieństwo jednej kategorii i niskie pozostałym. Podobne wzorce zachowań zaobserwowano w modelu HER podczas symulowanych eksperymentów, w których manipulowano szybkością uczenia się w następujący sposób (ryc. 5, górny rząd). W symulacjach, w których uczenie się było wyłączone, oszacowania prawdopodobieństwa modelu odpowiadały grupie LC. Gdy uczenie było włączone tylko dla najniższego poziomu hierarchii, zachowanie modelu odpowiada grupie LM, odzwierciedlając wyuczone reprezentacje, które pozwalają modelowi wykluczyć jedną z trzech kategorii, ale brakuje mu informacji wyższego rzędu, potrzebnej do rozróżnienia pozostałych dwóch. Wreszcie, gdy uczenie jest włączone dla wszystkich poziomów, model szybko uczy się całego zadania, co odpowiada zachowaniu grupy MC. W modelu HER zachowania te są ściśle związane z przewidywaniem wyuczonych błędów: model rozkłada zadanie, wybierając na każdym poziomie hierarchii cechę bodźca, która najlepiej zmniejsza niepewność odpowiedzi. W tym ostatnim przypadku zachowanie modelu szybko przechodzi przez zachowania związane z wyłączaniem uczenia się na kolejnych etapach: początkowo zachowanie modelu odpowiada grupie LC, a następnie LM, zanim zbiegnie się do rozwiązania problemu estymacji trójskładnikowej, co sugeruje, jak realistyczne uczenie się może wymagać nabycia niskopoziomowych skojarzeń przed rozwojem reprezentacji wyższego poziomu. Model HER dostarcza zatem wyjaśnienia, w jaki sposób reprezentacje neuronalne nabyte podczas uczenia się mogą przyczyniać się do wzorców zachowania – niezdolność do tworzenia reprezentacji wyższego rzędu nie tylko wpływa na oceny prawdopodobieństwa, ale może dodatkowo informować o samoukierunkowanym próbkowaniu informacji.
Symulacja 6 & 7: Interakcja mPFC i dlPFC
Model HER, będący rozszerzeniem modelu przewidywanej odpowiedzi-dochodu (PRO) ACC/mPFC, już teraz ujmuje szeroki wachlarz efektów obserwowanych w obrębie ACC7,25. Model HER wykracza poza model PRO na dwa kluczowe sposoby: po pierwsze, określa, w jaki sposób mPFC i dlPFC mogą współdziałać w celu wspierania wyrafinowanych zachowań, a po drugie, sugeruje równoległą hierarchiczną organizację mPFC, w której kolejne hierarchiczne regiony zgłaszają coraz bardziej abstrakcyjne sygnały o błędach. Taka organizacja mPFC została zaproponowana już wcześniej38,39 i rzeczywiście, znaleziono dowody, które wspierają rolę mPFC w przetwarzaniu hierarchicznych błędów27. Model HER jest w stanie uchwycić wzorzec aktywności zaobserwowany przez Kim i wsp.26 (symulacja 6) dla odrębnych regionów zarówno mPFC, jak i dlPFC (ryc. 6A, środkowa kolumna). Model HER interpretuje aktywność w hierarchicznie zorganizowanych regionach mPFC jako rozbieżność między coraz bardziej abstrakcyjnymi przewidywanymi i obserwowanymi wynikami, co jest zgodne z rolą mPFC w obliczaniu błędów zaproponowaną przez model PRO7,25 i uzupełnia interpretację Kim i wsp. Jednakże, podczas gdy ich pojęcie sygnałów błędów wyższego rzędu jest określone jakościowo, kolejno bardziej abstrakcyjne błędy w modelu HER są produktem ilościowych przewidywań na niższych poziomach, które są niewystarczające do wyjaśnienia obserwacji podmiotu, zgodnie z ramami kodowania predykcyjnego, które informują strukturę modelu HER.
Dodatkowe dowody dotyczące interakcji mPFC i dlPFC pochodzą z badań pacjentów z uszkodzeniami dlPFC40. W zadaniu opóźnionego dopasowania do próbki u osób z uszkodzeniem dlPFC obserwuje się negatywność związaną z błędem (Error Related Negativity, ERN) zarówno dla prób prawidłowych, jak i nieprawidłowych (ryc. 6B, lewa kolumna). Model HER (symulacja 7, ryc. 6B) wyjaśnia to jako niezdolność do zachowania istotnych informacji w okresie opóźnienia w celu modulowania przewidywań dotyczących prawdopodobnych wyników (ryc. 6B, prawa kolumna). Bez tej dodatkowej informacji kontekstowej dostępnej w modelu, zarówno prawidłowe, jak i nieprawidłowe wyniki są zaskakujące, co skutkuje zwiększoną aktywnością mPFC w uszkodzonej wersji modelu HER na obu rodzajach prób.
.
Leave a Reply