Fiabilitatea chestionarului de sănătate generală cu douăsprezece itemi (GHQ-12) sub ipoteze realiste
Chestionarul de sănătate generală cu douăsprezece itemi (GHQ-12) este destinat depistării morbidității psihiatrice generale (non-psihotice). Acesta a fost utilizat pe scară largă și, ca urmare, a fost tradus în multe limbi și validat pe scară largă în populațiile generale și clinice din întreaga lume . Procesul de validare a fost în principal de natură psihometrică, concentrându-se asupra fiabilității și validității datelor generate, un sprijin suplimentar provenind din studiile privind sensibilitatea și specificitatea măsurătorii . În ciuda acestui fapt, utilitatea utilizării măsurilor de auto-evaluare, cum ar fi GHQ-12, a fost pusă sub semnul întrebării, o analiză recentă concluzionând că medicii pot considera că valoarea predictivă pozitivă scăzută a acestei metode nu este convingătoare ca ajutor de diagnosticare . Acest lucru ridică întrebarea dacă doar validarea psihometrică este o bază suficientă pentru adoptarea GHQ-12 ca instrument de screening în practica clinică. În practica clinică, o valoare predictivă pozitivă slabă înseamnă că mulți dintre cei cu screening pozitiv nu suferă de o tulburare psihiatrică, dar se poate considera că merită investigații suplimentare; într-un context de cercetare, aceasta înseamnă că mulți participanți vor fi clasificați greșit, o formă de eroare de măsurare care va distorsiona analizele ulterioare .
În teoria clasică a testelor, un test sau un chestionar este evaluat pentru dimensionalitate, fiabilitate și validitate . Dimensionalitatea este evaluată cu ajutorul analizei factoriale, o metodă bazată pe modelul de corelații între scorurile itemilor chestionarului. Dacă toți itemii împărtășesc corelații moderate sau puternice, acest lucru produce un singur „factor” și sugerează că scala măsoară o singură dimensiune. Mai multe grupuri de astfel de itemi produc mai mulți factori, ceea ce sugerează că sunt măsurate mai multe dimensiuni. Deoarece metoda depinde de corelațiile dintre itemi, orice lucru care produce itemi corelați va fi interpretat ca un factor și, prin urmare, trebuie să se dea dovadă de prudență atunci când se interpretează structurile factoriale ca dimensiuni substanțiale . Fiabilitatea este o estimare a gradului de eroare de măsurare implicată în măsurarea unei singure dimensiuni prin mai mulți itemi. Dacă un chestionar măsoară mai multe dimensiuni, atunci fiecare dintre acestea necesită o estimare a fiabilității. Mai multe metode sunt utilizate în mod obișnuit pentru a estima fiabilitatea (de exemplu, Alfa lui Cronbach sau corelațiile test-retest), dar toate se bazează pe corelația dintre itemi (Alfa) sau scorurile scalei (test-retest). În plus, interpretarea coeficientului de fiabilitate rezultat depinde de îndeplinirea unor ipoteze puternice: mai ales în contextul studiului actual, există ipoteza că eroarea de măsurare a fiecărui item este aleatorie (adică necorelată cu orice altceva). În cele din urmă, validitatea se referă la măsura în care testul sau chestionarul măsoară ceea ce ar trebui să măsoare. Aceasta este în mod obișnuit evaluată în raport cu un criteriu extern, dar ar trebui să fie clar că un chestionar destinat să măsoare o singură dimensiune nu poate fi valid dacă măsoară mai multe dimensiuni sau dacă produce date cu o proporție mare de erori de măsurare. Prin urmare, analiza factorială și estimările de fiabilitate contribuie la suficiența unei măsuri, dar nu o garantează.
În timp ce evaluarea psihometrică a GHQ-12 sugerează că este o măsură validă a morbidității psihiatrice (adică măsoară ceea ce își propune să măsoare) și, de asemenea, o măsură fiabilă (adică eroarea de măsurare este scăzută), examinarea structurii factoriale a condus în mod repetat la concluzia că GHQ-12 măsoară morbiditatea psihiatrică în mai mult de un domeniu . Aceste rezultate au fost interpretate ca dovezi că GHQ-12 măsoară mai mult de o dimensiune a morbidității psihiatrice, deși, de obicei, fiecare dimensiune s-a dovedit a fi fiabilă, iar eroarea de măsurare pentru fiecare dimensiune acceptabilă. În prezent, consensul pare a fi că GHQ-12 măsoară disfuncția psihiatrică în trei domenii, disfuncția socială, anxietatea și pierderea încrederii , deși, fiind derivat exclusiv din analiza factorială, atât utilitatea cât și ontologia clinică a acestor domenii rămâne neclară .
O altă interpretare a acestor dovezi de analiză factorială este că natura aparent multidimensională a GHQ-12 este pur și simplu un artefact al metodei de analiză, mai degrabă decât un aspect al GHQ-12 în sine . Studiile care au raportat că GHQ-12 este multidimensional au utilizat fie analiza factorială exploratorie (EFA), fie analiza factorială confirmatorie prin modelarea ecuațiilor structurale (SEM), și se știe de mult timp că aceste metode pot produce dimensiuni false chiar și atunci când măsura în cauză este unidimensională dacă chestionarul cuprinde un amestec de itemi cu formulare pozitivă și itemi cu formulare negativă . De exemplu, Scala de stimă de sine Rosenberg a fost considerată multidimensională pe baza analizelor factoriale repetate , dar analiza efectelor metodei a arătat că „factorii” au împărțit scala în itemi cu formulare pozitivă și negativă și că datele erau mai compatibile cu o măsură unidimensională, cu distorsiuni de răspuns la itemii cu formulare negativă. În plus, înlocuirea itemilor cu fraze negative cu aceleași concepte exprimate în fraze pozitive a dus la o structură unidimensională . În mod similar, scala aparent bidimensională Consideration of Future Consequences Scale (CFC) s-a dovedit a fi unidimensională atunci când a fost luată în considerare distorsiunea de răspuns la itemii cu formulare inversă .
Dimensiunile identificate pentru GHQ-12 au împărțit în esență chestionarul în itemi cu formulare pozitivă și negativă, iar analiza efectelor metodei într-un eșantion mare de populație generală a confirmat că datele sunt mai consistente cu o măsură unidimensională, deși cu o distorsiune de răspuns substanțială la itemii cu formulare negativă . Tendința de răspuns astfel identificată a fost atribuită formulării ambigue a răspunsurilor la itemii cu formulare negativă , unde opțiunile de răspuns la afirmații precum „Se simte în mod constant sub presiune” sunt: „Nu mai mult decât de obicei”, „Deloc”, „Mai mult decât de obicei” și „Mult mai mult decât de obicei”. Primele două opțiuni se aplică la fel de bine respondenților care doresc să indice absența unei stări de spirit negative. Cu toate acestea, această explicație depinde în mod esențial de sistemul de notare aplicat la GHQ-12. GHQ-12 are două metode de punctare recomandate: o scală de răspuns în patru puncte („metoda Likert”) sau o scală de răspuns în două puncte („metoda GHQ”), iar această ambiguitate nu se poate aplica decât primei metode; pentru cea de-a doua, ambele răspunsuri sunt comasate în aceeași categorie de răspuns (absent), iar distincția dispare. În plus, o altă metodă de punctare (metoda „C-GHQ”) a fost concepută în mod expres pentru a elimina ambiguitatea răspunsurilor la itemii cu formulare negativă , ca urmare a observației că o persoană care indică faptul că „Se simte în mod constant sub presiune”, „Nu mai mult decât de obicei”, indică probabil prezența acestei stări de spirit negative. S-a constatat că variația metodei de notare afectează sensibilitatea , discriminarea și dimensionalitatea aparentă a GHQ-12 . De asemenea, după cum s-a argumentat mai sus, poate afecta gradul de părtinire a răspunsului și, eventual, îl poate elimina cu totul.
În concluzie, valoarea predictivă slabă a GHQ-12 se poate datora naturii multidimensionale a chestionarului sau părtinirii răspunsului la itemii cu formulare negativă: acestea sunt ipoteze concurente, deoarece părtinirea răspunsului este, de asemenea, responsabilă de apariția multidimensionalității, iar modelele multidimensionale presupun, la rândul lor, că nu există părtinire a răspunsului. Dacă GHQ-12 este multidimensional, atunci va avea performanțe slabe ca screening pentru morbiditatea psihiatrică nespecifică; dacă are un grad substanțial de distorsiune de răspuns, atunci problema este exacerbată, deoarece indicii convenționali de fiabilitate, cum ar fi Alfa lui Cronbach, pot subestima gradul de eroare de măsurare . Doar două studii au abordat această problemă într-un mod sistematic. Primul dintre acestea a evaluat adecvarea relativă a mai multor modele concurente unidimensionale, bidimensionale și tridimensionale utilizând cele trei metode diferite de notare, dar nu a modelat distorsiunea răspunsului. Al doilea a evaluat adecvarea modelelor dimensionale concurente, inclusiv a unuia cu distorsiuni de răspuns, dar nu a examinat efectele metodei de notare. Prin urmare, acest studiu și-a propus să evalueze GHQ-12 în ceea ce privește cele trei metode de scorare aplicate la trei modele: modelul unidimensional original, „cel mai bun” model tridimensional și un model unidimensional care încorporează prejudecata de răspuns. După ce s-a determinat cel mai bun model pentru date, al doilea obiectiv a fost acela de a estima fiabilitatea GHQ-12 în cadrul ipotezelor mai realiste pe care le presupune modelul.
.
Leave a Reply