Persönlichkeitsforschung mit der Stoppuhr
Zögern dient sozusagen als "Lügendetektor", wenn Manfred Amelang in Reaktionszeitanalysen und Selbsteinschätzungen etwas über die Persönlichkeit seiner Probanden herausfinden will. Ohne daß seine Versuchspersonen am Psychologischen Institut es wissen, stoppt er die Zeit, die sie brauchen, um eine Frage zu beantworten. Dabei stellt sich heraus, daß es länger dauert, Fragen nach Charakterzügen zu beantworten als Fragen, die sich auf den momentanen Zustand beziehen, und stark ausgeprägte Eigenschaften bedürfen wiederum weniger Überlegung als schwach ausgeprägte. Das Gehirn sucht nach früheren Situationen und fällt sein Urteil auch nach sozialer Erwünschtheit einer Eigenschaft. Anhand der Reaktionszeit gewinnen Psychologen aus den Fragen der Persönlichkeitstests zusätzliche Informationen.
"Ich habe gern viele Leute um mich herum." "Ich fühle mich oft angespannt und nervös." "Sind für Sie philosophische Diskussionen langweilig?" Solche und ähnliche Aussagen oder Fragen finden sich in herkömmlichen Persönlichkeitstests. Die Antworten in Form von "Ja"/ "Nein"/"Weiß nicht", "Stimmt"/ "Stimmt nicht"/"Sowohl als auch" geben Aufschluß über die relative Ausprägung von Merkmalen wie Extraversion, Neurotizismus oder Intellekt - dafür stehen die obigen Beispiele - bei der befragten Person. Derartige Informationen sind nicht nur für die persönlichkeitspsychologische Grundlagenforschung wichtig, sondern vielfach unentbehrlich bei zahlreichen Problemen praktisch-psychologischer Arbeit wie der Beratung von Probanden oder der Therapie. Die so gewonnenen Daten geben allerdings keinerlei Hinweise auf die psychischen Vorgänge, die der Beantwortung der Fragen vorausgehen. Obwohl inzwischen unüberschaubare "Heere" von Probanden in den verschiedensten Untersuchungen Abermillionen von Antworten der obigen Art geliefert haben, liegen bisher nur sehr wenige Arbeiten zu den Prozessen vor, die diesen Produkten zugrundeliegen. Deshalb wissen wir nur vergleichsweise wenig darüber, was in Personen vorgeht, wenn sie sich zu Fragen oder Feststellungen ("Items") der oben angegebenen Art äußern sollen.
Mehrere Faktoren stehen einer empirischen Analyse zunächst entgegen: Die fraglichen Prozesse laufen sehr rasch ab, begünstigt in der Regel durch die Instruktion, die Person möge bei der Beantwortung nicht lange nachdenken und die Antwort geben, die ihr als erste in den Sinn kommt. Außerdem stehen nur wenige andere Indikatoren, etwa psychophysiologischer oder ausdruckspsychologischer Art zur Verfügung, aus denen halbwegs verläßliche Rückschlüsse auf innerliche Verarbeitungsprozesse abgeleitet werden könnten. Eine Methode, etwas über die kognitiven Schritte bei der Entscheidungsfindung für die Antwort auf Fragebogen-Items in Erfahrung zu bringen, stellt das "laute Denken" dar. Dabei werden die Probanden aufgefordert auszusprechen, was für ihre Antwort maßgeblich ist. Verwandt damit ist die Technik, Assoziationen nennen zu lassen. Die damit gewonnenen Protokolle weisen auf eine große Vielfalt von Abläufen, Ereignissen und Problemen während des Beantwortungsvorganges hin. Allerdings treten bei der Intro- und Retrospektion von komplexen kognitiven Prozessen zahlreiche Verzerrungen und Fehler auf. Zudem sind dem direkten Zugang über Befragungen doch enge Grenzen gesetzt durch den Umstand, daß es sprachunabhängige Prozesse der Informationsverarbeitung gibt, die dem Bewußtsein nicht zugänglich sind und sich dadurch jeder Befragung entziehen.
Aus diesem Grunde kommt anderen Ansätzen große Bedeutung zu. Einer davon beruht auf der Messung der Zeit, die zwischen der Exposition eines Items und seiner Beantwortung vergeht. Diese Technik haben wir in unseren Experimenten im Heidelberger Psychologischen Institut eingesetzt, über die hier berichtet wird. Dabei bestand das Ziel unter anderem darin, die Unterschiede in den Bearbeitungszeiten für Items aufzuklären, wenn die Probanden Antworten geben sollten, die entweder etwas über ihre augenblickliche Befindlichkeit, also den momentanen Zustand, oder über beständige Persönlichkeitseigenschaften, Dispositionen, Auskunft geben sollten. Für die Gestaltung dieser experimentell variierten Bedingungen waren theoretische Vorstellungen über die kognitiven Abläufe während der Entscheidungsfindung zugunsten einer Antwort maßgeblich. Sofern die Bearbeitungszeiten den aus dem theoretischen Modell abgeleiteten Vorhersagen oder Hypothesen entsprächen, würde das im Sinne naturwissenschaftlichen Arbeitens als Beleg für die Haltbarkeit oder gar Angemessenheit der theoretischen Modellvorstellungen gewertet werden können.
T. B. Rogers hat 1978 ein Modell konzipiert, das innerhalb eines informationsverarbeitenden Prozesses vier gesonderte Komponenten oder vier Stufen vorsieht. Unterschiede zwischen den Probanden schlagen auf jeder Stufe zu Buche. Von besonderem Interesse für unsere Untersuchungen ist jedoch der Entscheidungspunkt drei (Item-Referenz-Vergleich). Hier wird der Output von Stufe zwei mit Gedächtnis-Inhalten verglichen, die das Selbst repräsentieren. Das heißt, in Gestalt der gespeicherten Information kommt das Selbst-Konzept, Selbst-Schema oder Selbst-Bild zum Tragen, über das der Persönlichkeitstest mit seinen Items in erster Linie Aufschluß liefern soll. In bezug darauf kann als gesichert gelten, daß Probanden Item-Inhalte, die ihrem Selbst-Konzept entsprechen, schneller beantworten als wenn dies nicht der Fall ist. Resultate in diesem Sinne konnten beispielsweise für maskuline, feminine und neutrale Adjektive, vorgegeben an Probanden mit eher maskulinem, femininem oder androgynem Selbst-Schema, ermittelt werden. Mit einer prinzipiell gleichartigen Anordnung wurden entsprechende Ergebnisse zum Konstrukt des Typ A- und Typ-B-Verhaltens erzielt, also der Trias von wettbewerbigem Leistungsstreben, chronischem Gehetztsein und ausgeprägter Feindseligkeit.
Demnach sind also immer dann rasche Beantwortungen wahrscheinlich, wenn Selbstbild und Item-Inhalt gut zueinander passen. Überträgt man das auf den Fall einer kontinuierlich abgestuften Konturierung des Selbst, so ist die erste Hypothese, daß für extreme Urteile, die für ein klares Selbstbild stehen in dem Sinne, daß jemand eine Eigenschaft "hat" oder sie nicht "hat", kürzere Bearbeitungszeiten zu erwarten sind als für mittlere Urteile.
Daneben interessierte uns ein weiterer Aspekt der auf das Selbst bezogenen Kognitionen, nämlich die Frage, wie sich die Beurteilung des momentanen Zustands gegenüber derjenigen von Charaktereigenschaften auf die Bearbeitungszeit auswirkt. Dafür wurden folgende Überlegungen angestellt: Soll eine Person Auskunft über ihren augenblicklichen Zustand oder momentane Eigenschaften (States) geben, so wird unter Ausrichtung des Suchbereichs durch den Item-Inhalt eine Art Indikatoren-Sampling anlaufen, das heißt, die aktuellen internen Vorgänge werden zum Item in Beziehung gesetzt, und es wird nach Maßgabe von Stärke, Häufigkeit und Konsistenz der Indikatoren ein Urteil abgeleitet. Dieses Urteil gilt, der Vorgabe entsprechend, nur dem Verhalten und Erleben in der jetzt gegebenen oder einer unmittelbar zurückliegenden Situation. Die Erstellung des Urteils benötigt relativ wenig Zeit, wenn die Indikatoren entweder stark, häufig und konsistent oder aber schwach und selten sind, hingegen vergeht mehr Zeit, wenn die Beurteilungsdimensionen uneindeutigen Aufschluß liefern.
Anders dagegen bei den überdauernden oder "eigentlichen" Eigenschaften (den Traits): Weil deren Struktur zeitliche und situative Vergleiche verlangt, muß das Indikatoren-Sampling für mehrere Situationen vorgenommen werden, das heißt, der Gedächtnis-Speicher danach überprüft werden, auf welche Weise man in der Vergangenheit in unterschiedlichen Situationen reagiert hat, um sich ein Urteil bilden zu können (situatives Sampling). Wegen der größeren Zahl von Situationen, die in Betracht zu ziehen sind, so Hypothese zwei, sind unter Trait-Instruktion längere Bearbeitungszeiten zu erwarten als unter State-Anweisung. Die Frage "Wie sehr treffen (nachfolgend zu nennende) Eigenschaften auf Ihr generelles Wesen zu, das heißt, wie beurteilen Sie sich im allgemeinen bezüglich einzelner Eigenschaften?" benötigt mehr Zeit als die Frage "Wie sehr treffen in diesem Augenblick (nachfolgend zu nennende) Eigenschaften auf Sie zu, das heißt, wie beurteilen Sie sich im Augenblick bezüglich einzelner Eigenschaften?". Da Eigenschaftswörter als Items wie "Sind Sie: aktiv?, ... dominant?, ... freundlich?" sehr viel kürzere Lesezeiten erfordern und von der Länge her eher vergleichbar sind als Fragen oder Feststellungen des eingangs vorgestellten Typs, haben wir sie in allen nachfolgend geschilderten Versuchsreihen verwendet.
In einem Experiment wurden 34 Adjektive am Computermonitor vorgegeben, und die Probanden sollten durch Drücken ausgewählter Tasten des Keyboards reagieren. Dabei war ihnen der Umstand nicht bekannt, daß auch die Bearbeitungszeit gemessen wurde. Die 44 Personen beiderlei Geschlechts zeigten sowohl die erwartete umgekehrte U-Funktion der mittleren Beantwortungszeiten, gemäß Hypothese eins, als auch die Mittelwertsdifferenz zugunsten der "State"-im Vergleich zur "Trait"-Instruktion, gemäß Hypothese zwei.
Darüber hinaus wollten wir den Einfluß der Item-Beschaffenheit überprüfen: Dabei interessierte uns weniger die Länge der Wörter als mehr deren Eignung, Befindlichkeiten oder Charaktereigenschaften zu beschreiben. Generell muß davon ausgegangen werden, daß immer dann die Beantwortungszeiten eher lang ausfallen, wenn die Instruktion "State" oder "Trait" nicht der üblichen Verwendung des Wortes entspricht. Das wäre der Fall, wenn ein State-Wort unter Trait-Instruktion oder ein Begriff, der eher eine Eigenschaft beschreibt, unter State-Instruktion beantwortet werden muß. Für eine präzisere Überprüfung der zweiten Hypothese kamen deshalb nur Adjektive in Betracht, die sich gleichermaßen zur Beschreibung von "States" und "Traits" eignen, also indifferent oder neutral gegenüber der State/Trait-Unterscheidung sind. Im Hinblick darauf haben wir in Vorversuchen Adjektive entsprechend klassifiziert. Dafür kamen nur Wörter in Betracht, die geläufig sind und zentrale Aspekte des Selbst beschreiben. In diesen Einschätzungen erwiesen sich Begriffe wie "aggressiv" oder "gesellig" als neutral. Demgegenüber kennzeichnen Adjektive wie "gereizt" oder "lebhaft" nach Meinung der Befragten eher Befindlichkeiten, Begriffe wie "dominant" oder "geizig" hingegen eher Charakterzüge.
In einem Versuch mit 31 solcher Adjektive wiesen 58 Versuchspersonen beiderlei Geschlechts die folgenden mittleren Reaktionszeiten auf: (s. Tabelle 1 Seite 48).
Wie ersichtlich liegen alle Effekte, die zudem in anderen Versuchsreihen repliziert werden konnten, in Richtung der Vorhersagen, womit das Modell soweit bestätigt wurde. Eine Annahme des Modells lautet, daß eine Selbsteinstufung auf Eigenschaftsdimensionen erst erfolgt, nachdem das hypothetische Indikatoren-Sampling für mehrere Situationen vorgenommen und der Gedächtnisspeicher danach durchforstet wurde, wie man sich in der Vergangenheit in unterschiedlichem Kontext verhalten hat. Das würde bedeuten, daß Begriffe, die relativ "breite" Eigenschaften beschreiben, längere Bearbeitungszeiten nach sich ziehen als relativ "schmale". In Vorversuchen hatten Probanden beispielsweise Eigenschaften wie "selbstsicher" und "intelligent" als relativ breit, hingegen "schüchtern" oder "treu" als schmal bezeichnet. In einem Versuch mit 87 Personen bestätigte sich auch diese Hypothese: signifikant längere Bearbeitungszeiten bei breiten Eigenschaften.
Darüber hinaus war davon auszugehen, daß die soziale Erwünschtheit der von einem Begriff beschriebenen Eigenschaft einen wesentlichen Einfluß auf die Reaktionszeiten haben würde. Von früher Kindheit an werden wir ermutigt, positive Dinge über uns zu sagen, und diese Tendenz hält während des Erwachsenenalters an. Selbst-Beschreibungen anhand von Wörtern mit hohem sozialem Erwünschtheitsgehalt wie "kritisch" oder "hilfsbereit" sind somit hochgeübt durch lebenslange Wiederholung; sie werden deshalb vermutlich nach kürzeren Reaktionszeiten erfolgen als Urteile auf neutrale Begriffe wie "nachgiebig" oder "kühl". Auch hier bestätigten die Ergebnisse eines Versuchs mit 80 Probanden und 48 Wörtern unsere Annahmen (s. Tabelle 2 Seite 48).
Zudem waren unter differentialpsychologischer Perspektive Einflüsse von seiten solcher Faktoren zu erwarten, die mit der habituellen Aufmerksamkeit gegenüber der eigenen Person, deren Steuerung und Darstellung nach außen zu tun haben. Die betreffenden Verhaltenstendenzen wurden mit Hilfe von Persönlichkeitstests erfaßt. Probanden mit verschiedenen Testwerten in diesen Dimensionen unterschieden sich auch in bezug auf ihre mittleren Reaktionszeiten voneinander. Mit zunehmender Selbstaufmerksamkeit werden die Bearbeitungszeiten länger; hingegen gehen mit hohen Persönlichkeitswerten in Impulsivität, sozialer Erwünschtheit und Eindruckssteuerung kurze Bearbeitungszeiten einher. In anderen Versuchen zeigten - erwartungsgemäß - Personen mit höherer Intelligenz kürzere Bearbeitungszeiten. Auch geschlechtsspezifische Unterschiede lassen sich an der Bearbeitungszeit ablesen. Frauen, die ganz allgemein mehr am zwischenmenschlichen und familiären Geschehen orientiert sind als Männer und sich stärker mit ihrem Erleben und Verhalten beschäftigen, sollten darüber auch rascher Auskunft geben können. In der Tat beantworteten sie Fragen nach überdauernden Persönlichkeitseigenschaften im Mittel in 5,68 Sekunden, während Männer dafür 6,85 Sekunden benötigten.
Ein weiteres Experiment stellt die Verbindung zu einem zentralen Thema der aktuellen Forschung zur Persönlichkeitspsychologie her: der Konsistenz-Problematik, also der Frage, inwieweit wir uns zum Beispiel mehr oder weniger freundlich, hilfsbereit, geizig in allen Situationen verhalten. Die Versuchspersonen wurden danach gefragt, ob sie sich in bezug auf jede der zu beurteilenden Eigenschaften eher in allen Situationen gleich, also konsistent, oder eher variabel, also inkonsistent, verhalten würden. Für die erste Gruppe wäre das herkömmliche Eigenschaftsmodell relativ angemessen, für die letztere relativ unangemessen. Personen, die sich mehr im Sinne des herkömmlichen Eigenschaftsmodells verhalten, bezeichnet die Fachsprache als "Trait-like"-Personen. Sie müßten aus Persönlichkeits-Merkmalen gut prognostizierbar sein. Individuen mit einem variableren, also situationsspezifischen Verhalten, die zum Beispiel nur gegenüber Vorgesetzten freundlich sind, hingegen abweisend zu Untergebenen, sogenannte "Trait-free"-Personen, müßten eher aus Kontext-Merkmalen vorhersagbar sein. Wir untersuchten dies mit unserem Reaktionszeitexperiment und fanden, daß Personen, die sich selbst als eher gleichbleibend oder konsistent einstuften, im Mittel aller Eigenschafts-Dimensionen kürzere Bearbeitungszeiten benötigten als Personen, die sich in verschiedenen Situationen als eher variabel oder inkonsistent bezeichneten.
Damit ist ein großer Bogen gespannt, unter dem sich im Versuch einer Integration das Folgende festhalten läßt: Eigenschaftsbezogene Fragen erfordern für die Beantwortung mehr Zeit als Items, die dem momentanen Zustand gelten. Als Ursache dafür scheint eine Art situativer Stichproben-Prozeß in Betracht zu kommen. Der größere Zeitaufwand stellt insofern eine lohnende Investition dar, als wir aus anderen Arbeiten Anhaltspunkte dafür haben, daß die mehr dispositionsbezogenen Fragen gegenüber Fremdeinschätzungen von Eigenschafts-Ausprägungen valider sind als die mehr situationsbezogenen. Das macht auch Sinn, weil die Fremdurteile ihrerseits vermutlich ebenfalls auf der Verhaltensbeobachtung in mehreren Situationen beruhen, also gleichfalls auf einem Prozeß des situativen Sampling.
Daneben lassen sich Personen mit unterschiedlichem Zeitbedarf bei der Bearbeitung von Items identifizieren, wobei die Regel gilt, daß extreme Merkmalsausprägungen mit kürzeren Beantwortungszeiten einhergehen, und zwar anscheinend deshalb, weil hier das situative und/oder das Indikatoren-Sampling nicht nur durch Stärke und Häufigkeit der Verhaltensweisen, sondern auch durch deren Konsistenz verkürzt wird, wofür das zuletzt vorgestellte Resultat ein Beleg sein mag. Im Falle von Inkonsistenz muß nach zusätzlichen Informationen zugunsten einer Entscheidungsfindung gesucht werden, was mehr Zeit erfordert. Bei Konstanthaltung des Item-Typus sind unter diesem Blickwinkel also gerade die schnelleren Antworten die im Sinne des Eigenschaftsmodells brauchbareren.
Die Unterscheidung in situations- und dispositionsbezogene Fragen eröffnet die weitreichende Perspektive einer je nach Art der geforderten Vorhersage unterschiedlichen Klassifikation der Items von Persönlichkeitstests und die Aussicht, in Form der situationsbezogenen Fragen Prädiktions-Indikatoren zur Verfügung zu haben, auch und gerade für jene Personen, die sich - da "trait-free" - offenkundig eher an den Feinheiten der Kontextbedingungen orientieren.
Autor:
Prof. Dr. Manfred Amelang, Psychologisches Institut, Hauptstr. 47-51, 69117 Heidelberg,
Telefon (06221) 54 73 28