Ein Ohr für Verbrechen: mit forensischer Phonetik den Tätern auf der Spur

Audio Forensik
17.04.19

Matthias Hegel, eine der Hauptfiguren in Auris, ist Audioforensiker. Doch was ist eigentlich Audioforensik? Unsere Autorin Josefine Andrae klärt auf.

Unbekannte Stimmen in einem Auto. Sie diskutieren. Aber nicht über die Fußballergebnisse vom Wochenende, sondern über ein Drogengeschäft. Plötzlich öffnet sich die Autotür. Von draußen zu hören: vorbeifahrende Autos? Eine Autobahn? Dann schlägt die Tür zu. Die Diskussion geht weiter. Szenenwechsel: Ein Mann ist zu hören. Er hat einen Bankdirektor entführt, fordert Lösegeld. Sein Deutsch klingt irgendwie anders, holprig, er sucht nach den richtigen Worten.

Beides ganz unterschiedliche Fälle und doch beides Situationen, in denen forensische Phonetiker und Audioforensiker von der Justiz zu Rate gezogen werden. Experten wie Dr. Gea de Jong-Lendle von der Universität Marburg. Sie ist forensische Phonetikerin, hat schon in den USA, Großbritannien, den Niederlanden geforscht und gearbeitet, Justizsysteme der unterschiedlichsten Länder bei der Wahrheitsfindung unterstützt und berät im Auftrag der Europäischen Kommission Länder wie den Kosovo, die mit dem Aufbau ihrer eigenen forensisch-phonetischen Labore noch am Anfang stehen.

Verbrecher anhand ihrer Stimme erkennen

„Die forensische Phonetik ist ein Teil der Linguistik“, erklärt Gea de Jong-Lendle, „es geht dabei um die Frage, wie Leute artikulieren, welche Sprache sie sprechen, wo sie herkommen, wie sie alt sind.“ Der Fachbereich ist noch recht neu, hat sich aber seit seinen Ursprüngen in den fünfziger, sechziger Jahren enorm weiterentwickelt – allein schon, weil mit der Verbreitung von Handys quasi jedermann jederzeit mehr oder weniger inkriminierende Tonaufnahmen anfertigen kann.

Und die sind wahnsinnig einfach zu fälschen, wie Patrick Aichroth, Gruppenleiter Mediendistribution und Sicherheit am Fraunhofer-Institut für Digitale Medientechnologie erklärt. „Audiomaterial lässt sich mit wenig Aufwand und simplen Open-Source-Tools sehr leicht manipulieren“, erklärt er, „unser Instinkt, Sprache zu vertrauen, wenn wir sie hören, macht die Sache durchaus kritisch.“ Deswegen haben sich Experten wie er darauf spezialisiert, Manipulationen von Audioaufnahmen mittels innovativer Technologien aufzudecken.

Dr. de Jong-Lendle und ihre Kollegen fertigen detaillierte Transkripte polizeilicher Telefonüberwachungsaufnahmen (zum Beispiel aus der Überwachung von Drogendealern) an, sind aber auch für Sprechererkennung und Sprecherprofile zuständig. Bei der Sprechererkennung stellt sich vor allem die Frage nach der Wahrscheinlichkeit: Ist es der Verdächtige, der da auf der Tonaufnahme zu hören ist – oder doch jemand anderes?

Dazu gehören auch „Voice Line-ups“. Dabei werden sogenannten Ohrenzeugen die Stimmen verschiedener Leute – darunter der Verdächtige – vorgespielt, in der Hoffnung, dass sie den Täter wiedererkennen.

Im Ernstfall schnell bestimmen: Wer ist der Täter?

Bei Sprecher- oder Stimmenprofilen hingegen fangen die Experten bei null an: Ist der Sprecher ein Muttersprachler? Spricht die Person Deutsch mit ausländischem Akzent? Aus welchem Land kommt sie? Wo hat sie Deutsch gelernt? Wie lange hat die Person Deutsch gelernt? Das alles sind Fragen, die es zu klären gilt – und das im Ernstfall möglichst schnell: „Bei einer Entführung, zum Beispiel von einem Bankdirektor oder einem Kind, besteht immenser Zeitdruck“, so Gea de Jong-Lendle.

Was sich unter Vorhandensein ausreichenden Materials allein aus dem Gesprochenen über eine Person ableiten lässt, ist erstaunlich: ihr Herkunftsort, ihr grob geschätztes Alter und ihr Bildungsgrad zum Beispiel. Um das alles bestimmen zu können, bedarf es ausgiebiger Analysen. An deren Anfang steht „einfach zuhören“, wie Dr. de Jong-Lendle erklärt. Dann folgen technische sowie weitere auditive Analysen. Dabei werden alle Laute phonetisch bestimmt und transkribiert, der Dialekt analysiert, die Tonhöhe, Melodik der Stimme und Stimmhöhe determiniert und, und, und. „Am liebsten haben wir mit Tätern mit einer Pathologie zu tun, zum Beispiel ein stotternder Betrüger“, so De Jong-Lendle. „Das Glück hatte ich in meiner Karriere leider nur ein Mal. Die mögliche Sprecherzahl reduziert sich dann drastisch: Nur ein bis zwei Prozent der Bevölkerung stottern“.

Entscheidende Hinweise aus dem Hintergrund

Doch nicht nur die Stimmen sind relevant, auch Hintergrundgeräusche können entscheidende Hinweise geben. So lässt sich anhand eines Schusses zum Beispiel bestimmen, welche Waffe abgefeuert wurde, während das Klappern von Türen auf den Tathergang deuten kann.

Doch auch viel subtilere, nicht wahrnehmbare Spuren im Material, die durch Aufnahme, Codierung und andere Prozesse entstehen, können aufschlussreich sein: Durch eine Erkennung von Inkonsistenzen können zum Beispiel Schnitte erkennt werden und eine Analyse des Brummens in Aufnahmen erlaubt unter bestimmten Umständen, den Zeitpunkt einer Aufnahme zu ermitteln, so Patrick Aichroth. Außerdem lassen sich anhand des Materials Rückschlüsse auf das Aufnahmegerät ziehen, mit welchem die Aufnahme gemacht wurde.

Die Grenzen der forensischen Phonetik

Trotz aller technischer und wissenschaftlicher Fortschritte: die forensische Phonetik hat ihre Grenzen. „Wenn ein Täter seine oder ihre Stimme verstellt und das sehr gut macht, dann stehen auch wir vor einem unlösbaren Fall“, so Gea de Jong-Lendle. Gleiches gilt für Aufnahmen, die zu kurz oder von schlechter Qualität sind.

Außerdem nicht zu vernachlässigen ist die Tatsache, dass die Stimme keinesfalls so einzigartig wie die DNA oder ein Fingerabdruck ist. Sie verändert sich schon im Laufe des Tages, kann passiv durch Allergien, Alkoholkonsum, Erkältung oder ganz bewusst und absichtlich beeinflusst werden.

„Ein Stimmvergleich ist eine sehr komplizierte Sache: Man kann nie ohne jeden Zweifel sagen, dass beispielsweise der Sprecher auf Aufnahme A auch der Sprecher auf Aufnahme B ist. Man kann nur angeben, wie viele Unterschiede und wie viele gemeinsame Merkmale man gefunden hat“, erläutert die Expertin. Der Stimmbeweis allein sollte deshalb nie einen Fall bestimmen.

Gleiches gilt für die Manipulationsdetektion: „Wir können immer nur erkennen, was nach dem Stand der Technik mit unseren Technologien erkennbar ist“, so Aichroth, „und geben daher Plausibilitäten und Wahrscheinlichkeiten an, die aber wichtig für eine Gesamteinschätzung sind.“ Dabei lassen sich die „Angreifer“ immer wieder neue Methoden einfallen, um ihre Manipulationen zu vertuschen, und die „Verteidiger“ verbessern laufend ihre Erkennungsmethoden – ein ständiges Katz-und-Maus.

Realität in der Fiktion

Ihr könnt selbst überprüfen, wie viel der realen Ermittlerarbeit auch in "Auris" steckt. Bestellt das neue Hörspiel nach einer Idee von Sebastian Fitzek einfach schon mal vor!

Auris

Autor:
Sebastian Fitzek, Vincent Kliesch, Helge May, Judith Schöll
Sprecher:
Simon Jäger, Svenja Jung, Oliver Masucci, Thomas Balou Martin, Julian Horeyseck, Rauand Taleb
Spieldauer:
6:42 Std.