Lügendetektor

Ein Lügendetektor ist ein Gerät, das aufgrund von den physiologischen  Reaktionen eines Probanden den Wahrheitsgehalt seiner Aussagen ermitteln möchte.

Der veraltete Polygraph (auch: Mehrkanalschreiber oder Biosignalgerät) misst peripher-physiologische Parameter wie den Blutdruck, Puls, die Atmung oder die elektrische Leitfähigkeit der Haut einer befragten Person. Die so aufgezeichneten Reaktionen sind jedoch nicht spezifisch für die Wahrheit oder Unwahrheit der gegebenen Antwort, sondern zeigen lediglich das momentane Aktiviertheitsniveau an.

Deshalb messen moderne Lügendetektoren v.a. hirnphysiologische Veränderungen wie den neuronalen Blutfluss, die weniger fehleranfällig und deshalb aussagekräftiger sind (siehe insb.: Magnetresonanztomographie).

Darstellung der Messwerte eines Lügendetektors auf einem Notebook
Darstellung der Messwerte eines Lügendetektors auf einem Notebook

1. Polygraph

1.1. Entwicklung und Geschichte

Die Grundidee zum Polygraphen geht auf die Psychologen Carl Gustav Jung und Max Wertheimer zurück. Zu Beginn des 20. Jahrhunderts veröffentlichten sie zwei unabhängige Arbeiten zur Nutzung physiopsychologischer Verfahren als Indikatoren für juristische Belange. Vittorio Benussi konstruierte im März/April 1913 an der Universität Graz einen Apparat, der die Atmungsphasen und den Puls registriert und an dem abgelesen werden kann, ob die Versuchsperson lügt – den ersten Polygraphen. Ein Polygraph wurde zum ersten Mal am 2. Februar 1935 in einem Experiment von Leonarde Keeler getestet.

Seitdem haben sich Polygraphen in einigen Ländern verbreitet, das Hauptanwendungsgebiet war und ist jedoch die USA, in denen mit der American Polygraph Association auch eine Lobby-Organisation existiert. Die Anwendungsgebiete erstrecken sich von Bewerbungsgesprächen für eine Arbeitsstelle bis zu Vernehmungen bei der Polizei. Auch Geheimdienste wie die CIA und die Bundespolizei FBI in den USA verwenden Polygraphen, um die Vertrauenswürdigkeit aktueller und potentieller Mitarbeiter zu beurteilen.

Neben den Polygraphen wurden in jüngerer Zeit alternative Methoden zum Erkennen wahrer oder unwahrer Aussagen entwickelt. Darunter sind rein stimmenbasierte, die Änderungen in der Stimme als Indikator für Lügen verwenden und bei einem Telefongespräch eingesetzt werden können, sowie Infrarotkameras, mit denen die Durchblutung des Gesichts sichtbar gemacht und als Indikator verwendet wird.[1]

1.2. Theorie

Polygraphische Untersuchungen basieren auf der Annahme, dass Menschen beim Lügen mindestens geringfügig nervös werden. Auch wenn diese Nervosität dem Gegenüber unsichtbar bleibt, erzeugt sie durch das vegetative Nervensystem unwillkürliche Reaktionen. Dieses momentane Aktiviertheitsniveau des Organismus lässt sich durch entsprechende Messgeräte sichtbar machen und kann aufgezeichnet werden.

Geeignete Reaktionen sind unter anderem:

• Änderung der Atemfrequenz

• Änderung des Pulses

• Änderung des Blutdrucks

• elektrodermale Aktivität – Änderung des Hautwiderstands durch Schwitzen    Zittern

Für eine zuverlässige Bewertung werden mehrere dieser Reaktionen gleichzeitig überwacht. Der Polygraph an sich ist nicht mehr als ein Messgerät, das ebendiese Reaktionen misst und aufzeichnet. Eine Auswertung findet durch das Gerät nicht statt und obliegt allein dem Polygraphisten, der entsprechend ausgebildet wurde. Ein Polygraphist soll in der Lage sein, echte Reaktionen von willentlich herbeigeführten unterscheiden zu können.

1.3. Durchführung einer polygraphischen Untersuchung

Um den Wahrheitsgehalt einer Aussage zu klären, etwa bei einem Tatverdacht, gibt es zwei gängige polygraphische Testverfahren: den Tatwissens- und den Vergleichsfragentest.

a. Tatwissenstest

Beim Tatwissenstest handelt es sich um eine indirekte Methode, weil der zu Untersuchende nicht direkt gefragt wird, ob er dieses oder jenes getan habe, sondern er wird gefragt, ob er etwas über die aufzuklärende Tat wisse. Ziel ist herauszufinden, ob er Wissen über Einzelheiten des Tatgeschehens besitzt, das nur der Täter haben kann. Zu diesem Zweck wird der zu Untersuchende zunächst gefragt, was er über die vorgeworfene Tat weiß und woher dieses Wissen stammt. Sodann werden ihm zu einem bestimmten Aspekt der Tat (Begehungsweise etc.) sechs Fragen gestellt, worunter eine Alternative die zutreffende ist. Es hat sich gezeigt, dass die Reaktionen besonders hoch sind, wenn die Frage auf die zutreffende Antwortalternative wahrheitswidrig verneint wird.[2] Laut Max Stellerzeigten verschiedene Laborstudien sogar, „daß Probanden ohne Tatwissen bei fast allen Untersuchungen mit dem Tatwissentest zu 100 Prozent richtig identifiziert werden konnten, d.h., daß keine falsch-positiven Zuordnungen erfolgten. Bei Personen mit Tatwissen erfolgten in 80 bis 95 Prozent richtige Klassifikationen.“[3]

b. Vergleichsfragentest

Beim Vergleichsfragentest[4] (auch Kontrollfragentest genannt; engl. control question test oder CQT) geht es nicht um mögliches Tatwissen, sondern der zu Untersuchende wird direkt nach dem zu klärenden Sachverhalt gefragt, etwa ob er die aufzuklärende Tathandlung begangen habe. Eine solche Frage kann beim Vorwurf sexueller Nötigung etwa lauten: „Haben Sie Person X jemals geküsst?“ Die auf den Tatvorwurf zielenden Fragen (in der Regel sind es drei) werden als Tatfragen bezeichnet. Sie werden in Beziehung gesetzt zu (möglichst vier) Vergleichsfragen. Der methodische Ansatz, der dem Versuchsaufbau zugrunde liegt, besteht darin, dass die Reaktionen einer Person auf die tatbezogenen Fragen zu vergleichen sind mit den Reaktionen derselben Person auf dargebotene Vergleichsfragen. Die tatbezogenen Fragen lösen sowohl beim Täter als auch beim fälschlich Verdächtigten eine starke Reaktion aus. Beim fälschlich Verdächtigten lösen die Vergleichsfragen aber noch stärkere Reaktionen als die tatbezogenen Fragen aus, während der Täter von der Bedrohung, die von den tatbezogenen Fragen für ihn ausgeht, überhaupt nicht abzulenken ist. Damit die Vergleichsfragen ihren Zweck erfüllen, müssen sie so formuliert werden, dass sie den Probanden während der Dauer der Untersuchung „beschäftigen“, ihre gewissenhafte Beantwortung ihm also „zu schaffen macht“. Um dies zu erreichen, beziehen sich die Vergleichsfragen auf sozial missbilligtes Verhalten des Untersuchten, und zwar auf dem gleichen Normgebiet, dem auch die Taten angehören, deren er verdächtigt wird.

Anfangs wird mit dem Probanden ein Gespräch geführt, in dem neben einer biographischen Anamnese auch der Konsum von Medikamenten, Alkohol und Drogen innerhalb der letzten 24 Stunden sowie die Länge der Schlafenszeit in der vergangenen Nacht erfragt werden. Sodann werden mit dem zu Untersuchenden zunächst die tatbezogenen Fragen besprochen und danach die Vergleichsfragen. Stehen sowohl Tat- als auch Vergleichsfragen fest, wird der Proband mit dem Untersuchungsablauf vertraut gemacht und mit ihm ein Probelauf durchgeführt. Dazu wird der Proband gebeten, eine der Zahlen 22 bis 26 auszuwählen und diese Zahl, ohne dass der Untersucher die Möglichkeit der Kenntnisnahme hat, zu notieren. Sodann wird der Proband an den Polygraphen angeschlossen, d.h. ihm werden die Messfühler angelegt in Form einer Blutdruckmanschette am linken Oberarm, eines Atmungsgürtels am Brustkorb, von Fingerelektroden zur Messung der Schweißabsonderung an den Ringfinger und an den Zeigefinger der linken Hand sowie einer Fingerklemme, mit der die Durchblutung der Haut über die Fingerspitze gemessen wird. Im Anschluss daran werden drei Einzeltests durchgeführt: Zuerst werden die Zahlen 22 bis 26 der Reihe nach abgefragt, wobei der Proband immer mit „Nein“ antworten soll, also auch dann, wenn er nach der Zahl gefragt wird, die er notiert hat. Beim zweiten Durchgang werden die Zahlen in unterschiedlicher Reihenfolge abgefragt, wobei der Proband wiederum stets mit „Nein“ antworten soll. Im dritten Durchgang soll der Proband die Fragen wahrheitsgemäß beantworten. Der Zahlentest dient vor allem dazu, Störungen auszuschließen, die die Auswertung der im Haupttest zu gewinnenden Reaktionskurven unmöglich oder unsicher machen würden. Einen die Treffsicherheit leicht erhöhenden Nebeneffekt stellt es dar, dass dem Probanden die Zuverlässigkeit des Tests verdeutlicht wird. Das geschieht, indem der Untersucher dem zu Untersuchenden die von diesem notierte Zahl „verrät“. In der Regel kennt der Untersucher die notierte Zahl nämlich bereits nach den ersten beiden Durchgängen.

Danach werden dem Probanden noch einmal alle Fragen vorgelesen, und es wird ihm erklärt, dass der Probedurchgang zufriedenstellend verlaufen ist und der Durchführung des eigentlichen Tests keine Schwierigkeiten im Wege stehen. Im Anschluss an diese Informationen wird der zu Untersuchende gefragt, ob er sich dem Test unterziehen wolle. Es wird ihm weiter gesagt, wenn er dies nicht wolle, so brauche er das nur zu sagen. Die Untersuchung werde dann sofort abgebrochen, und er werde nicht einmal danach gefragt, weshalb er sich dem Test nicht unterziehen wolle. Aus seiner Ablehnung dürften und würden keine negativen Schlüsse gezogen. Entschließt sich der Proband zur Fortführung des Tests, folgt der Auswertung und Erklärung der Reaktionskurven die Hauptuntersuchung. Zum Einsatz kommt der Polygraph meist in drei Durchgängen, die Messungen können aber auch bis zu fünf Mal erfolgen. Im Anschluss daran beginnt die Testauswertung. Die drei Einleitungsfragen werden nicht ausgewertet. Sie dienen dazu, den in der Psychologie bekannten Effekt „aufzufangen“, dass der erste in einer Reihe dargebotene Reiz immer eine verstärkte Aufmerksamkeitszuwendung erfährt.

Bei der Auswertung wird die Reaktion auf die tatbezogene Frage mit der Reaktion auf eine der beiden daneben stehenden Vergleichsfragen verglichen. Dafür werden die auf Millimeterpapier aufgezeichneten körperlichen Reaktionen (Atmung, Hautwiderstand, Blutdruck und periphere Hautdurchblutung) ausgewertet, die während der Hauptuntersuchung bei den drei bis fünf Durchgängen angefallen sind. Quantifiziert werden die unterschiedlichen Kurvengrößen mithilfe einer siebenstufigen Skala. Ist ein Unterschied nicht klar erkennbar, wird die Bewertung „0“ vergeben; ist er deutlich erkennbar, so wird er mit „1“ bewertet, bei einem großen Unterschied mit „2“ und bei einem außerordentlich großen Unterschied mit „3“. Ist die Reaktion auf die tatbezogene Frage größer, erhält die Ziffer ein Minus-Zeichen; ist die Reaktion auf die Vergleichsfrage stärker, wird ein Plus vergeben. Die siebenstufige Skala reicht also von −3 bis +3. Sind die tatbezogenen Fragen inhaltlich verschieden, so kann für jede einzelne Frage ein Gesamtwert berechnet werden, indem alle für die betreffende tatbezogene Frage ermittelten Vergleichswerte unter Berücksichtigung des Vorzeichens addiert werden. Die Summe ist dann der Testwert für die betreffende tatbezogene Frage. In der experimentellen Forschung und in der kriminalistischen Praxis haben sich folgende Grenzwerte bewährt: Werte von +3 und darüber sind Indikatoren dafür, dass die tatbezogene Frage wahrheitsgemäß verneint wurde. Werte von −2 bis +2 erlauben keine sichere Schlussfolgerung. Schließlich ist bei Werten von −3 und darunter davon auszugehen, dass die tatbezogene Frage wahrheitswidrig verneint wurde.

Sind die drei ausgewerteten tatbezogenen Fragen inhaltsgleich (unterscheiden sich also nur in den Formulierungen), so können sämtliche Vergleichswerte unter Berücksichtigung des Vorzeichens zu einem Gesamtwert für den ganzen Test summiert werden. Bei dieser Konstellation haben sich in der experimentellen Forschung und in der kriminalistischen Praxis folgende Grenzwerte bewährt: Werte von +6 und darüber sind Indikatoren für die wahrheitsgemäße Verneinung der tatbezogenen Fragen, Werte von −5 bis +5 erlauben keine sichere Schlussfolgerung, und bei Werten von −6 und darunter ist davon auszugehen, dass die tatbezogenen Fragen wahrheitswidrig verneint wurden.

1.4. Kritik an Polygraphen und Lügendetektoren im Allgemeinen

Angesichts der Tatsache, dass die Anerkennung von Lügendetektoren bei Unzuverlässigkeit großen Schaden anrichten kann, sind die Gegenstimmen zahlreich. Es wird angeführt, dass keine wissenschaftlich haltbaren Beweise für die Zuverlässigkeit existieren, dagegen aber viele Fälle von Fehleinschätzungen durch Lügendetektortests bekannt und die Tests demonstrierbar zu manipulieren sind.[1]

a. Rechtliche Beurteilung

Mit seinem Urteil vom 16. Februar 1954[5] verbietet der Bundesgerichtshof den Einsatz von Lügendetektoren sowohl im Strafverfahren als auch bei den Vorermittlungen, selbst wenn der Angeklagte dem Einsatz zustimme. Dies ergebe sich aus Art. 1 Abs. 1 GG sowie § 136a StPO. Die Zulässigkeit hänge nicht von der Brauchbarkeit, Richtigkeit und Verlässlichkeit des Polygraphen („Lügendetektors“) ab, sondern allein von den das Strafverfahren regelnden Grundsätzen. Diese würden die Anwendung des Gerätes verbieten.[6]

Der Test verletze die Menschenwürde, weil der Beschuldigte Beteiligter und nicht Gegenstand des Verfahrens sei. Die Wahrheit müsse vom Gericht gegebenenfalls auch ohne das Zutun des Beschuldigten aufgeklärt werden.

„Diese Grundsätze des Verfassungs- und Strafverfahrensrechts wurzeln darin, daß selbst der Tatverdächtige und Straffällige der Gesamtheit stets als selbstverantwortliche, sittliche Persönlichkeit gegenübersteht; bei erwiesener Schuld darf und muß er zur Sühne unter das verletzte Recht gebeugt werden; seine Persönlichkeit jedoch darf über jene gesetzlichen Beschränkungen hinaus dem gewiß wichtigen öffentlichen Anliegen der Verbrechensbekämpfung nicht aufgeopfert werden.“
– Urteil vom 16. Februar 1954, 1 StR 578/53 BGHSt 5, 332, 334
[7]

Der Polygraph („Lügendetektor“) beeinträchtige weiterhin den Willen des Beschuldigten und untergrabe die im § 136a StPO (Verbot der Misshandlung) garantierte Willensfreiheit.

„Der Polygraph bezweckt mithin, vom Beschuldigten mehr und andere „Aussagen“ als beim üblichen Verhör zu erlangen, darunter solche, die er unwillkürlich macht und ohne das Gerät gar nicht machen kann. Neben der bewußten und gewollten Antwort auf die Fragen „antwortet“, ohne daß der Beschuldigte es hindern kann, auch das Unbewußte. Ein solcher Einblick in die Seele des Beschuldigten und ihre unbewußten Regungen verletzt die Freiheit der Willensentschließung und -betätigung (§ 136a StPO) und ist im Strafverfahren unzulässig. Zur Erhaltung und Entwicklung der Persönlichkeit gehört ein lebensnotwendiger und unverzichtbarer seelischer Eigenraum, der auch im Strafverfahren unangetastet bleiben muß.“
– Urteil vom 16. Februar 1954, 1 StR 578/53 BGHSt 5, 332, 335
[8]

Am 17. Dezember 1998 lehnte der Bundesgerichtshof den Polygraphen erneut als Beweismittel wegen mangelnder Verlässlichkeit der Ergebnisse ab. Er widerspricht jedoch der Argumentation des Urteils vom 16. Februar 1954 und sieht bei Einwilligung des Betroffenen keinen Menschenwürdeverstoß. Auch ein Verstoß gegen § 136a Abs. 1 StPO sei nicht erkennbar, da eine Täuschung des Betroffenen nicht vorliege.[9] Ebenfalls ablehnend reagierte der Bundesgerichtshof in seinem Beschluss vom 30. November 2010.[10][11]

Am 14. Mai 2013 hat das Oberlandesgericht Dresden entschieden, dass die „Untersuchung mit einem Polygraphen […] im Sorge- und Umgangsrechts-verfahren ein geeignetes Mittel [ist], einen Unschuldigen zu entlasten (…)“[12]

Am 26. März 2013 entschied das Amtsgericht Bautzen, dass das entlastende Ergebnis einer polygraphischen Untersuchung als Indiztatsache auch in Strafverfahren verwertbar sei.[13] Nach neuester Rechtsprechung ist ein Polygraphietest ein ungeeignetes Mittel im Straf- und Disziplinarverfahren (BVerwG, Beschluss vom 31. Juli 2014, vgl. ZBR 2014, 420 ff., – 2 B20/14 im Anschluss an BGH, Beschluss vom 30. November 2010 – 1 StR 509/10, vgl. NStZ 2011, 474). Das Bundesverwaltungsgericht verwarf dabei auch explizit das Bautzener Urteil.

b. Ethische Bewertung

Aus heutiger Sicht wirkt die Vorstellung vom „mechanistischen Innenleben“ des Menschen befremdlich. Es wird unterstellt, dass ein bestimmter Input zu einem reproduzierbaren und bei allen Menschen vergleichbaren Output führe, sprich: eine Konfrontation mit bestimmten Fakten zu einem bestimmten Affekt. Eine willentliche Beeinflussung dieser Affekte wird so schon a priori ausgeschlossen.

Die Kritik am Einsatz des Polygraphen als Lügendetektor, insbesondere in der Variante 'Vergleichsfragentest' wird auch von Praktikern geteilt. In einer 1997 vorgenommenen Umfrage unter Mitgliedern der Society for Psychophysiological Research stimmten nur 36 % der Aussage zu, dass der Kontrollfragentest auf einem wissenschaftlich fundierten Prinzip beruhe.[14]

Der Einsatz von Lügendetektoren spielt mittlerweile auch eine große Rolle in den Medien. In deutschen „daily talkshows“ wie Britt werden diese Tests sehr häufig eingesetzt. Bedenklich erscheint vor allem, dass die Ergebnisse nicht hinterfragt, sondern als unumstößlich wahr dargestellt werden.

c. Mangelnde wissenschaftliche Grundlage

Ein erster wesentlicher Kritikpunkt bezieht sich auf die Theorie, die dem Einsatz der Technik zugrunde liegt, nämlich die Annahme, durch das technische Hilfsmittel eines Polygraphentests („Lügendetektors“) körperliche Reaktionen bei einer Befragung so festhalten und auswerten zu können, dass damit der Wahrheitsgehalt von Antworten „gemessen“ werden könne. Die gemessenen Erregungsunterschiede sind jedoch grundsätzlich unspezifisch, d.h. es ist an der Erregungsveränderung selbst nicht abzulesen, ob sie durch Schuldbewusstsein, Stress beim Lügen oder etwa der Angst, fälschlich verdächtigt zu werden, ausgelöst wurde. 'Lügendetektoren' messen demnach keine Lügen, sondern lediglich Veränderungen der körperlichen Erregung, die auf Nervosität oder andere Emotionen zurückzuführen sind. Damit ist jemand, der auf eine Frage nicht gelassen reagiert, trotz wahrheitsgetreuer Antwort gefährdet, für einen Lügner gehalten zu werden. Emotionale Reaktionen eines unschuldig Verdächtigten auf eindringliche Beschuldigungen sind nicht überraschend, vor allem wenn der Befragte dem Opfer des Verbrechens nahesteht.

Ein zweiter Kritikpunkt bezieht sich auf die empirische Evidenz, mit der die Trefferquoten des Polygraphen belegt werden sollen. Diese Belege stammen entweder aus dem Labor oder aus dem Feld; bei beiden Datenquellen sind gravierende methodische Probleme vorhanden. In Laborstudien ist es nahezu unmöglich, den Stress nachzubilden, unter dem eine Person steht, wenn sie in einem echten Ermittlungsverfahren befragt wird. Dies gilt insbesondere für die Erregung fälschlich Verdächtigter. Daher ist im Labor die Trennung von Lügnern und wahrheitsgemäß aussagenden Personen anhand der Erregung zwar häufig möglich, die Test-Situation ist aber nicht genügend wirklichkeitsnah. In Feldstudien wird als Kriterium für die tatsächliche Täterschaft (mit der das Polygraphen-Ergebnis in Beziehung gesetzt wird) das Geständnis des Verdächtigten verwendet. Dass ein Tatverdächtigter sich zu einem (möglicherweise sogar falschen) Geständnis entschließt, ist aber seinerseits nicht unabhängig von dem Polygraphen-Ergebnis. Damit ist das Geständnis kein geeignetes Vergleichs-Kriterium.

d. Verzerrung durch Vorurteile

Eine Eigenschaft der Lügendetektoren ist, dass sie keine exakten Zahlen oder dergleichen ausgeben. Die Ergebnisse hängen von der Interpretation durch den Untersucher ab, wobei dieselbe Aufzeichnung von verschiedenen Polygraphisten unterschiedlich ausgewertet werden kann. Damit sind Vorurteile nicht ausgeschlossen.

In der sogenannten Friendly-Polygraph-Examiner-Hypothese wird eine Wechselwirkung zwischen Messergebnis und der Haltung des Untersuchers angenommen, dergestalt, dass bei einem freundlich gesinnten Untersucher eher entlastende Ergebnisse erzielt würden, sei es, dass der Tatverdächtige weniger eine Entdeckung fürchtet und die messbaren Erregungsdifferenzen dadurch geringer würden oder dass der Untersucher die Ergebnisse eher als entlastend wertet.[15]

Befürworter von „Lügendetektoren“ weisen darauf hin, dass Ergebnisse eines EKG-Geräts prinzipiell von ähnlicher Natur sind wie jene eines Polygraphen (eine auf Papier aufgezeichnete Kurve), aber bei einem EKG spreche man von einer wissenschaftlich haltbaren Methode. Der Unterschied zwischen Polygraph und EKG ist aber, dass die Grundlagen der EKG-Resultate restlos klar sind (elektrische Spannung der verschiedenen Herzmuskeln); und dass der gleiche Schaden am Herz auch zu den gleichen Ergebnissen führt. Diese fehlende Reproduzierbarkeit führt zu einem Interpretationsspielraum, der Vorurteile begünstigt.

e. Manipulierbarkeit

Es ist möglich, messbare Reaktionen willentlich durch Methoden zu erzeugen, die der Untersucher nicht entdeckt. Damit kann das Ergebnis eines Tests in eine gewünschte Richtung gelenkt werden und eventuell eine andere Person mit einem Verbrechen belastet werden. Dies geschieht nicht durch Erregungs-Unterdrückung bei den kritischen Fragen, sondern durch Erregungs-Erhöhung bei den Kontrollfragen. Führende Polygraphisten behaupten, sie könnten jede Art solcher Manipulation entdecken, bleiben den Beweis aber schuldig. Fest steht, dass Angehörige militärischer Spezialeinheiten (im Rahmen ihrer RtI = Resistance-to-Interrogation-Ausbildungsphase) und Mitarbeiter von Geheimdiensten seit langem im Manipulieren von Lügendetektortests geschult werden.

Unter Anderen hatte James Randi seine Herausforderung (er bot eine Million Dollar für den Beweis übernatürlicher Kräfte) so ausgeweitet, dass der Beweis dieser Behauptung ebenfalls gewonnen hätte. Kein Polygraphist nahm die Herausforderung an, jedoch zogen sie ihre Behauptung auch nicht zurück.[1]

f. Bekannte Fälle

Es sind viele Fälle bekannt geworden, in denen durch das Vertrauen auf Lügendetektoren Schaden angerichtet wurde.

Aldrich Ames war ein Mitarbeiter der CIA, der geheime Informationen an die Sowjetunion verkaufte. Vor allem handelte es sich dabei um die Identitäten von Quellen im KGB und dem sowjetischen Militär, die die USA mit Informationen versorgten. Dies führte dazu, dass mindestens 100 Geheimoperationen aufflogen und mindestens 10 Informanten hingerichtet wurden. Ames bestand während seiner Spionagezeit zwei Lügendetektortests bei der CIA und wurde erst durch das eingeschaltete FBI aufgedeckt. Wie er später erzählte, hatte er vor den Tests seinen sowjetischen Kontakt gefragt, was er tun solle. Ihm wurde gesagt, er solle sich bei den Tests einfach entspannen, was er dann tat.

Melvin Foster wurde 1982 als Verdächtiger in den Green-River-Morden einem Polygraphentest unterzogen, den er nicht bestand. In Folge wurde er jahrelang weiter öffentlich verdächtigt, obwohl keine handfesten Beweise vorlagen. Erst 2001 wurde er endgültig von allen Verdächtigungen befreit, als DNS-Untersuchungen Gary Ridgway mit den Fällen in Verbindung brachten. Ridgway war anfangs einer der Hauptverdächtigten, wurde dann aber nicht weiter beachtet, da er zwei Lügendetektortests bestand. Ridgway konnte seine Mordserie fortsetzen und gestand schließlich bis heute 49 Morde.

2. Gehirnscans als Lügendetektor

2.1. Die Grundidee

Neue Methoden versuchen den Wahrheitsgehalt einer Aussage anhand von Gehirnscans festzustellen. Mittels fMRT-Aufnahmen, die aktive Hirnareale sichtbar machen, wollen Firmen wie z. B. Cephos Trefferquoten von 90 % erreicht haben.[16] Steven Laken, Präsident von Cephos, ist selbst Koautor einiger wissenschaftlicher Publikationen zu den hirnphysiologischen Veränderungen beim Lügen. Er fasst in einer Sendung die Idee wie folgt zusammen: „Beim Lügen benötigt das Gehirn mehr Energie als beim Sagen der Wahrheit.“ Die Sprecherin bringt es an einer anderen Stelle so auf den Punkt: „Es funktioniert ganz einfach. Weil das Äußern einer Lüge mehr Blutfluss im Gehirn erfordert, kann die Maschine das feststellen.“

Die grundsätzliche Idee ist, dass Lügen ein komplexerer Vorgang ist, als die Wahrheit zu sagen; demzufolge sind dabei mehr bzw. andere Gehirnareale (Frontal- und Parietallappen) aktiv. Eine weitere Begründung lautet: die Lüge strengt das Gehirn mehr an als die Wahrheit und deshalb werden bestimmte Regionen stärker durchblutet.[17] Wenn der Proband sich allerdings schon vorher überlegt was er sagen wird und sich fest genug „einredet“ es sei wahr, dann wird beim Test die vorbereitete Antwort aus dem Gedächtnis (Temporallappen bzw. Hippocampus) abgefragt, und erscheint somit als wahr.

2.2. Forschungsprojekte

In einem engeren wissenschaftlichen Rahmen haben sich in den letzten zehn Jahren vor allem zwei Forschergruppen um die Entwicklung eines Lügendetektors mithilfe der fMRT bemüht: Die Gruppe um den Psychiater Daniel Langleben von der University of Pennsylvania in Philadelphia (USA) hat mehrere Experimente mit Spielkarten durchgeführt, über deren Besitz die Versuchsperson Informationen besaßen. An dieser Forschung orientiert sich No Lie MRI, und einige der Forscher aus dieser Gruppe waren oder sind mit der Firma assoziiert. Die Gruppe um den Psychiater Andrew Kozel von den Southwestern University in Dallas (US-Bundesstaat Texas) hat ihre Probanden hingegen Verbrechersituationen nachspielen lassen und anschließend mit dem Hirnscanner versucht, über die Auswertung von Aussagen auf die begangene Tat zu schließen. Einige dieser Forscher verfolgen eigene finanzielle Interessen und haben ihre Arbeiten zusammen mit Steven Laken von Cephos publiziert.

Der Berliner Neurowissenschaftler John-Dylan Haynes arbeitet gar an einem Lügendetektor, der „unfehlbar und unabhängig von subjektiven Einschätzungen“ sein soll. Ausgangspunkt der Überlegungen zur Entwicklung eines „Hirnscanners“, eines „Neuronalen Lügendetektors“ ist, dass ein Gehirn vorher erlebte Situationen als „neuronale Spiegelbilder“ speichere, sie wiedererkennt und das deutlich macht, auch wenn der Mensch das Wissen darum zu verbergen trachte: die Hirnaktivität einer Person verrate den Probanden. Angedacht ist: Das Gehirn islamistischer Terroristen werde reagieren, wenn ihnen Bilder von Terrorcamps vorgespielt werden; auf derselben Basis – so die Vorstellung – werde man einer bestimmten Straftat verdächtigte Täter überführen können, wenn man ihnen Bilder von Tatorten vorspiele: Selbst wenn der Täter eine Tatbeteiligung leugnen würde, würde ihn das Wiedererkennen seines Gehirns überführen, wenn unter den vorgespielten Tatortsituationen diejenige dabei ist, die sich auf die ihm zu Recht vorgeworfene Straftat bezieht. Das Gehirn würde im Vergleich zu den vorgespielten Tatortsituationen, an denen er nicht beteiligt war und daher kein neuronales Spiegelbild gespeichert hat, auf die erlebte Tatortsituation erkennbar reagieren, selbst wenn der Täter das verbergen wolle. Die Tatortwiedererkennung des Gehirns sei nicht willentlich beeinflussbar.[18]

2.3. Methoden

Wie bereits erwähnt, ist heute die Idee verbreitet, dass die Untersuchung des Gehirns eine bessere Unterscheidung von Wahrheit und Lüge zulässt als frühere Methoden. Wenn alle Gedankenvorgänge durch bestimmte Vorgänge im Gehirn realisiert sind oder sie wenigstens zuverlässig begleiten, müssten dort dann Lügen und Täuschungsabsichten nicht erkennbar sein? Theoretisch ja - aber es ist auch eine praktische Frage, ob beispielsweise die Auflösung des Verfahrens gut genug ist, um entscheidende Merkmale dieser Vorgänge zu erkennen. Es ist ferner eine empirische Frage, ob die Verarbeitung von Lüge und Täuschung zwischen und innerhalb von Versuchspersonen hinreichend stabil ist, um charakteristische Muster aufzuweisen. Eine experimentelle Frage ist es schließlich, ob sich Versuchspersonen in einer Laborsituationen in realistischer Weise in die Lage eines Lügners bringen lassen, sodass die Ergebnisse in die Lebenswelt übertragbar sind.

In Experimenten haben sich in der wissenschaftlichen Welt auch hier vor allem die zwei Vorgehensweisen etabliert (s.o.): Bei der ersten geht es um ein besseres Verständnis der (hirn-)physiologischen und letztlich psychischen Vorgänge im Zusammenhang mit Lüge und Täuschung (daher englisch Differentiation of Deception, DoD). Hier sollen die Versuchspersonen eine Reihe von Fragen mal ehrlich, mal unehrlich beantworten. Einen Schritt weiter gedacht, legt diese Forschung ein Umdrehen von Schlussverfahren nahe. Hat man erst einmal robuste (hirn-)physiologische Korrelate von Wahrheit und Täuschung gefunden, dann lässt sich das Verfahren vielleicht auf Situationen übertragen, in denen Wahrheit und Lüge nicht bekannt sind.

Die zweite Vorgehensweise zielt nicht an sich auf unehrliche Antworten ab, sondern soll Hinweise auf verborgene Informationen liefern (daher Tatwissenstest, englisch Guilty Knowledge Test, GKT; auch Concealed Informationen Test, CIT). Hier geht es darum, ob Versuchspersonen auf bestimmte kritische Details, wie sie beispielsweise neben Opfern und Ermittlungsbeamten nur der oder die Täter wissen können, anders reagieren als auf irrelevante Details.[19] Ob Versuchspersonen eine konkrete Frage beantworten und bewusst die Wahrheit sagen oder lügen, ist beim CIT daher nachrangig. Allerdings verschwimmt die Grenze zwischen CIT und DoD, wenn die Probanden zusätzlich zum Informationsabruf wahre oder unwahre Auskünfte erteilen sollen. Ein Beispiel dafür sind die im Folgenden vorgestellten Arbeiten aus der Langleben-Gruppe, die sich unter beiden Gesichtspunkten verstehen lassen. Die Forscher selbst sprechen vom GKT, also dem Test auf verborgenes Wissen, interpretieren ihre Ergebnisse aber vor allem in Hinsicht auf die kognitiven Prozesse der Täuschung.

Eine Minderheit hält ferner am sogenannten Kontroll- oder Vergleichsfragentest fest (englisch Control Question Test, CQT), der aufgrund einer festgelegten Vorgehensweise Wahrheit oder Lüge bei bestimmten Antworten identifzieren soll. Hier wird der oder die Verdächtige direkt mit der Tat konfrontiert, etwa mit einer Frage wie: "Haben Sie am 23. Oktober den Supermarkt in der Bahnhofsstraße überfallen?" Neben üblicherweise drei tatbezogenen Fragen dieser Art sind die in etwa vier Vergleichsfragenn von entscheidender Bedeutung. Diese handeln von sozial missbiligtem Verhalten, das demselben Normenbereich der Tatfragen angehört und die untersuchten Persone unter Druck setzen soll. Daher bieten sich unangenehme Fragen a, die sich idealerweise auf ihre eigenen Biografien beziehen. Bei einem Raubüberfall könnten beispielsweise frühere Diebstähle thematisiert werden, bei einem sexuellen Verbrechen sozial unerwünschte oder unangenehme sexuelle Vorlieben.

Der Theorie zufolge werden Täter von der Bedrohung der tatbezogenen Fragen derart vereinnahmt, dass bei ihnen die (polygraphisch) gemessenen Reaktionen am stärksten ausfallen. Demgegenüber würden bei Unschuldigen die Reaktionen bei den unangenehmen Kontrollfragen stärker sein.[20] Dieses Verfahren ist also sehr viel individueller und durch die Interaktion zwischen Fragendem und Befragtem geprägt. Man kann dies als Vorteil sehen, da Lügen nun einmal in sozialer Interaktion besonders authentisch sind; man kann dies aber auch als Nachteil sehen, weil das Ergebnis dadurch subjektiver wird. In der jüngeren Hirnforschung haben jedenfalls bisher unr die ersten beiden Verfahren, DoD und GKT/CIT, eine nennenswerte Rolle gespielt. Demgegenüber bildet die American Polygraph Association mit dem Ziel, "gültige und zuverlässige Mittel der Wahrheitsprüfung anzubieten und die höchsten moralischen, ethischen und professionellen Standards im Gebiet der Polygraphie durchzusetzen", ihre Mitglieder vor allem im CQT aus.[21]

2.4. aktuelle Forschung

Am Ende wollen wir noch auf eine aktuelle Studie im Kontext der Lügenforschung eingehen. Joshua D. Greene und sein Kollege Joseph M. Paxton ließen ihre Versuchspersonen im Hirnscanner schummeln. Im Gegensatz zu vorherigen Untersuchungen von Lüge und Täuschung geschah dies jedoch nicht auf eine ausdrückliche Anweisung der Versuchsleiter hin. Tatsächlich hatten die Versuchsleiter sogar Anweisungen gegeben, bei der Aufgabe nicht zu täuschen. In dem Experiment mussten die Probanden den Ausgang eines Münzwurfs vorhersagen und konnten dabei Geld gewinnen. Allerdings wurde der Tipp nur in der Hälfte der Fälle im Voraus aufgezeichnet. In der anderen Hälfte konnten die Teilnehmer später selbst angeben, ob sie richtig oder falsch lagen - und damit durch eine Schummelei Geld verdienen und zwar bis zu sieben US-Dollar pro Durchlauf.

An dem Versuch nahmen 35 rechtshändige Männer und Frauen im Alter von im Mittel 24 Jahren teil, die das Spiel ganze 210 Mal mitmachen mussten. Bevor sie mit den Münzwürfen begannen, sollten sie aber noch einen Fragebogen über paranormale Fähigkeiten ausfüllen, in dem es um Hellseherei ging. Diese Idee haben sich die Forscher einfallen lassen, um die wahre Absicht hinter dem Experiment zu verschleiern. Anhand der gemittelten Entscheidungen jeder Versuchsperson unterschieden Greene und Paxton nach dem Experiment eine ehrliche, eine unklare und eine unehrliche Gruppe. Der Gedanke hierbei war, dass man - ohne hellseherische Fähigkeiten - bei der Vorhersage im Mittel in etwa 50% der Fälle richtig liegen müsste, also der Zufallswahrscheinlichkeit. Wer nach eigenem Bekunden allerdings zu häufig den korrekten Ausgang des Münzwurfs getippt hatte, der machte sich des Schummelns verdächtig. Die Forscher zogen die Grenze bei 69&. Wer so häufig oder noch öfter von sich selbst behauptete, mit seiner Vorhersage richtig gelegen zu haben, der kam in die Gruppe der unehrlichen Spieler. Das traf auf 14 der 35 Versuchspersonen zu, die im Mittel 84% der Münzwürfe richtig "geraten" hatten. Diesen wurden die 14 Probanden mit der niedrigsten Trefferquote als ehrliche Gruppe gegenübergestellt, deren Mittelwert bei 52% lag. Die sieben verbleibenden Versuchspersonen wurden als unklar eingestuft und in der Auswertung der Hirnphysiologie nicht weiter betrachtet.

Mit diesem Experiment wollten Greene und Paxton zwei Hypothesen über die Psychologie ehrlicher Reaktionen gegeneinander testen. Gemäß der ersten widerstehen Versuchspersonen der Versuchung zu täuschen dank willentlicher Kontrolle - "Willenshypothese". Gemäß der zweiten verhalten sich Probanden ehrlich, wenn sie keine Versuchung verspüren - "Gnadenhypothese" vom englischen Wort grace. In diesem Fall würde ihr Verhalten durch die An- oder Abwesenheit bestimmter automatischer Prozesse bestimmt, auf die sie selbst weniger direkten Einfluss hätten. Beide würden sich gemäß der Gehirn- und Verhaltensreaktionen voneinander unterscheiden lassen: Stimme die Willenshypothese, so würde man bei einem ehrlichen Verzicht eine stärkere Aktivierung in einem "Kontrollnetzwerk" erwarten, vor allem in dem uns bereits bekannten ACC und DLPFC. Außerdem sollten dementsprechend die Reaktionszeiten länger sein, da die Probanden dann der Versuchung aktiv widerstehen müssten. Gemäß der Gnadenhypothese in einer starken Form würde man jedoch weder auf der Ebene des Verhaltens noch der Hirnphysiologie Unterschiede erwarten.

Tatsächlich konnten Greene und Paxton die Gnadenhypothese recht deutlich stützen. Im Vergleich der ehrlichen mit den erzwungenen Verlusten fanden sich nämlich keine signifikanten Unterschiede.[12] Die Reaktionen waren mit 520 Millisekunden gegenüber 580 Millisekunden sehr ähnlich und in den erwarteten Hirnregionen gab es keinen Aktivierungsanstieg. Die Ergebnisse der unehrlichen Gruppe sind aber auffällig. Zwar fand sich bei ihnen konsistent mit den vorherigen Untersuchungen zur Täuschung eine erhöhte Aktivierung im "Kontrollnetzwerk". Überraschenderweise war diese aber gerade dann am ausgeprägtesten, wenn die insgesamt unehrlichen Versuchspersonen eine ehrliche Antwort gaben, also der Möglichkeit zu schummeln zum Trotz auf den Gewinn eines Durchlaufs verzichteten!

Dies stellt die Idee von den wahrheitsgemäßen Antworten als Standardzustand des Gehirns infrage, die in der Literatur aufgrund häufig fehlender Aktivierungszunahmen in den entsprechenden Bedingungen formuliert wurde. Dementsprechend erklären die Forscher, diese Aktivierungen könnten kaum mit der Überwindung einer ehrlichen Standardantwort einhergehen - so waren die Aufgaben von ACC und DLPFC vorher interpretiert worden -, denn die letztlich gegebenen Antworten in diesen Durchläufen seien ja selbst ehrlich. Greene und Paxton stellen zwei mögliche Alternativen in den Raum: Vielleicht würden die ehrlichen Probanden zwar automatisch reagieren (Gnadenhypothese), könnten die unehrlichen der Versuchung aber trotz ihrer kognitiven Bemühungen nicht erfolgreich widerstehen (negative Willenshypothese). Alternativ könnte es sein, dass sich die unehrlichen Versuchspersonen aktiver für oder gegen eine Lüge entscheiden als die ehrlichen. Anhand der vorliegenden Daten lässt sich das Rätsel zwar nicht lösen, dieser Fund stellt aber ein schönes Beispiel in Sachen "Neuro-Bescheidenheit" dar: Man sollte sich (zumindest beim heutigen Forschungsstand) davor hüten, jemanden aufgrund seiner Hirnaktivierung als Lügner zu bezeichnen. Es könnte nämlich zu Unrecht einen allgemein zwar eher unehrlichen Menschen treffen, der sich in diesem Fall aber besonders um eine ehrliche Antwort bemüht!

Einzelnachweise

1.     „Erfindung des Lügendetektors – Unehrliche Haut“, Kommentierte Fotostrecke von Katja Iken auf einestages, 3. Februar 2015

2.    Vgl. dazu Holm Putzke, Jörg Scheinfeld, Gisela Klein, Udo Undeutsch: Polygraphische Untersuchungen im Strafprozess. Neues zur faktischen Validität und normativen Zulässigkeit des vom Beschuldigten eingeführten Sachverständigenbeweises. In: Zeitschrift für die gesamte Strafrechtswissenschaft. 121, 2009, S. 604–644.

3.    Max Steller: Psychophysiologische Täterschaftsermittlung („Lügendetektion“, „Polygraphie“). In: M. Steller, R. Volbert (Hrsg.): Psychologie im Strafverfahren. Huber, Bern 1997, S. 92.

4.    Beschreibung des Testverfahrens nach: Holm Putzke, Jörg Scheinfeld, Gisela Klein, Udo Undeutsch: Polygraphische Untersuchungen im Strafprozess. Neues zur faktischen Validität und normativen Zulässigkeit des vom Beschuldigten eingeführten Sachverständigenbeweises. In: Zeitschrift für die gesamte Strafrechtswissenschaft. 121, 2009, S. 604–644.

5.    BGH-Urteil vom 16. Februar 1954, Az. 1 StR 578/53, BGHSt 5, 332 ff.

6.    BGH Urteil vom 16. Februar 1954, Az. 1 StR 578/53, BGHSt 5, 332, 333.

7.    BGH Urteil vom 16. Februar 1954, Az. 1 StR 578/53, BGHSt 5, 332, 334.

8.    BGH Urteil vom 16. Februar 1954, Az. 1 StR 578/53, BGHSt 5, 332, 335.

9.    Der Bundesgerichtshof folgte in seiner Entscheidung den kritischen Gutachten. (Alle Gutachten und Urteil in: Praxis der Rechtspsychologie. 9, 1999 (Sonderheft Psychophysiologische Aussagenbeurteilung)); Pressemitteilung Bundesgerichtshof Nr. 96 vom 17. Dezember 1998.

10. BGH Beschluss vom 30. November 2010, Az. 1 StR 509/10.

11. vgl. dazu auch die Besprechung des BGH-Beschlusses vom 30. November 2010, Az. 1 StR 509/10 (u.a. mit Darstellung der Rechtshistorie) von Holm Putzke in der Zeitschrift für das Juristische Studium. (ZJS) 06/2011, 557 (pdf-Datei; 106 kB)

12. OLG Dresden, Beschluss vom 14. Mai 2013, Az. 21 UF 787/12, BeckRS 2013, 16540.

13. AG Bautzen, Urteil vom 26. März 2013, Az. 40 Ls 330 Js 6351/12, BeckRS 2013, 08655.

14. W.G. Iacono, D.T. Lykken: The validity of the lie detector: Two surveys of scientific opinion. In: Journal of Applied Psychology. 82, 1997, S. 426–433.

15. M. Steller, K.-P. Dahle, K.-P.: Wissenschaftliches Gutachten: Grundlagen, Methoden und Anwendungsprobleme psychophysiologischer Aussage- und Täterschaftsbeurteilung („Polygraphie“, „Lügendetektion“). In: Praxis der Rechtspsychologie. 9, 1999, Sonderheft, S. 178–179.

16.  Brain Scans May Be Used As Lie Detectors (Memento vom 6. September 2006 im Internet Archive). AP/ABC News, 28. Januar 2006.

17. Rotes Gespinst in den Hirnwindungen – Eine kalifornische Firma hat einen Lügenscanner entwickelt. In: Berliner Zeitung. 13./14. Oktober 2007.

18.  Der Blick ins Gehirn: Thema zur Sendung „Rätselhafte Mimik“.

19. Vgl. die Übersichtsarbeiten Gamer M. & Vossel, G. (2009). Psychophysiologische Aussagenbeurteilung: Aktueller Stand und neuere Entwicklungen. Zeitschrift für Neurophysiologie, 20(3), S. 207-218.

20. Vgl. Putzke, H., Scheinfeld, J., Klein, G., & Undeutsch, U. (2009). Polygraphische Untersuchungen im Strafprozess. Neues zur faktischen Validität und normativen Zulässigkeit des vom Beschuldigten eingeführten Selbstverständigenbeweises. Zeitschrift für die gesamte Strafrechtswissenschaft, 121(3), S. 607-644.

21. aus der Selbstdarstellung auf www.polygraph.org.

Stand: 2017

Kommentare: 0

Impressum | Datenschutz | Cookie-Richtlinie | Sitemap
Diese Website darf gerne zitiert werden, für die Weiterverwendung ganzer Texte bitte ich jedoch um kurze Rücksprache.