Wenn Du dieses Experiment gerade selbst durchgeführt hast, kannst Du
unten die Ergebnisse sehen. Ansonsten sind dort fiktive (aber typische) Ergebnisse
dargestellt. Zunächst wollen wir aber noch einmal genauer erklären, was eigentlich
untersucht wurde.
Als Beispiel hatten wir ja die beiden Wörter "Packen" und "Backen" genommen und
festgestellt, dass diese sich nur in einem einzigen Merkmal, der Stimmhaftigkeit (oder Stimmlosigkeit)
des ersten Konsonanten unterscheiden. Da als zweiter Laut direkt der Vokal "a" folgt, unterscheiden
sie sich sogar nur darin, wie bald nach Beginn des ersten Konsonanten die Stimmbänder anfangen
zu schwingen. Diese Zeitdauer hatten wir Voice-Onset Time genannt.
Für das Experiment haben wir nun das Wort "Packen" aufgenommen und in der Aufnahme
jeweils kurze Stücke aus der kurzen Stille zwischen dem "p" und dem "a" herausgeschnitten.
In der unten stehenden Tabelle kannst Du in der linken Spalte sehen, wie genau die daraus resultierenden Aufnahmen
"aussehen" (Du kannst die Bilder anklicken, um sie zu vergrößern). Jede dieser
Aufnahmen haben wir Dir zehn Mal vorgespielt und Dich gebeten, in jedem Fall zu entscheiden, ob sich
das Wort eher wie "Packen" oder eher wie "Backen" anhört. In der mittleren und rechten
Spalte der Tabelle kannst Du erkennen, wie oft Du in diesen Fällen die eine oder die andere
Antwort gegeben hast.
Zunächst einmal kann man in der Tabelle erkennen, dass Du bei geringer Voice-Onset Time häufiger
den Eindruck hattest, das Wort "Backen" gehört zu haben, bei langer Voice-Onset Time häufiger das
Wort "Packen". Als erstes Ergebnis können wir also festhalten, dass es tatsächlich reicht, die Voice-Onset Time
zu verändern, um aus einem "p" ein "b" zu machen.
Im folgenden Diagramm sind die Ergebnisse noch einmal grafisch dargestellt:
Die roten Kreuze zeigen dabei den Prozentsatz der "B"-Antworten (wie oft Du also den
Eindruck hattest, das Wort "backen" gehört zu haben), die grünen Punkte entsprechen dem prozentualen
Anteil der "P"-Antworten. Von links nach rechts wird die Voice-Onset Time größer. Da Du Dich in jedem Fall
für das eine oder andere entscheiden musstest,
addieren sich die Prozentwerte jeweils zu 100.
Ein weiteres Ergebnis erkennt man im Diagram besser als in der Tabelle: Der Bereich in dem
der Höreindruck nicht eindeutig war, in dem Du also mal zu "p" und mal zu "b" tendiert hast,
ist ziemlich klein. Obwohl die Voice-Onset Time kontinuierlich in vielen kleinen Schritten
verändert wurde, "kippt" Dein Höreindruck recht abrupt. Du
kannst Dir das wie bei einer Waage vorstellen: Wenn die Gewichte auf beiden Seiten
gleich groß sind, reicht schon ein kleines zusätzliches Gewicht auf der einen Seite, um die
Waage vollständig kippen zu lassen. Der Bereich, in dem sich beide Seiten sprichwörtlich
"die Waage halten", ist klein.
Was bedeuten die Ergebnisse?
Die Unterscheidung von "b" und "p" beruht auf der Unterscheidung in einem einfachen Merkmal. Ein
Merkmal, das wir auf einfache Weise manipulieren können. Dass unser Höreindruck abrupt
von der einen zur anderen Wahrnehmung "kippt", spricht dafür, dass unser Wahrnehmungsappart darauf
angelegt ist, dieses Merkmal als "entweder-oder" wahrzunehmen. Entweder wir hören ein
stimmhaftes "b" oder ein stimmloses "p". Künstlich können wir auch Laute erzeugen,
die "dazwischen" liegen, bei denen wir uns nicht sicher sind, ob es sich eher um ein "b" oder eher
um ein "p" handelt. Dieser unsichere Bereich ist allerdings so klein, dass wir praktisch immer eindeutig entscheiden
können, um welchen Laut es sich handelt. Wir können also sagen, dass dieses Merkmal dichotom
ist: Ein Laut ist entweder stimmhaft oder stimmlos, dazwischen gibt es nichts.
Der Wahrnehmung von Sprache liegen viele solcher zweiwertigen oder "dichotomen" Merkmale zugrunde. Ein weiteres Merkmal ist
zum Beispiel "Vokal-Kein Vokal". Die Unterscheidung "nasal-nicht nasal" dürfte manchen aus dem
Französisch-Unterricht bekannt vorkommen. Das Experiment zur Voice-Onset-Time zeigt einen einfachen
Merkmalserkennungsmechanismus, der extrem schnell ist (normalerweise verständigen wir uns mit ca.
5-12 Lauten pro Sekunde), automatisch abläuft, d.h. keine Aufmerksamkeit erfordert (dadurch kann
man sich auf das Verstehen von Bedeutung konzentrieren) und eine Grundlage im Gehirn hat.
Diese Merkmalserkennungsmechanismen ermöglichen die schnelle und
automatische Lautidentifikation und bilden damit die einfachste Stufe
der Sprachwahrnehmung. Das Verständnis sprachlicher Bedeutung
erfordert Aufmerksamkeit und ist nur möglich, weil die Lautunterscheidung
und Lautidentifikation ohne Aufmerksamkeitszuwendung erfolgt.
Verantwortlich für diese Seite: Inhaltliche Konzeption und Text: Hans-Georg Bosshardt - Programmierung Experiment: Christoph Fenner - Programmierung Auswertung und weiterer Text: Thomas Friedrichsmeier