Deutsche Intonation und GToBI - coli.uni-saarland.de2002:DIG.pdf · Deutsche Intonation und GToBI 3...

of 33 /33
Linguistische Berichte 181/2000 © Helmut Buske Verlag, Hamburg Deutsche Intonation und GToBI Martine Grice und Stefan Baumann ABSTRACT In this paper we provide an overview of work carried out on the intonation of Standard Ger- man, both in auditory phonetic studies and in the instrumentally-based phonological accounts within the autosegmental-metrical framework. We examine how far the different accounts shed light on controversial issues such as leading tones, levels of phrasing, and phrase accents, and propose a surface-oriented annotation framework, GToBI, which aims to capture all empi- rically observed distinctive intonation patterns. For illustration purposes, the contours which are reported to occur most commonly are given in schematic form, along with their GToBI transcription and examples of their usage. 1 Einleitung Dem Englischen, Niederländischen und Deutschen wird eine große Ähnlichkeit auf dem Gebiet der Prosodie und Intonation nachgesagt, ein Umstand, der auf ihre gemeinsame Zugehörigkeit zur Westgermanischen Sprach(en)familie zu- rückzuführen sein mag. Alle drei Sprachen gelten als akzentzählend, sind rhythmisch in linksköpfige Füße bzw. Takte gegliedert, heben Information mit Hilfe einer Reihe verschiedener Akzenttöne 1 hervor und verwenden Grenztöne, um Äußerungen in Phrasen zu unterteilen. In Strukturen mit weitem Fokus fällt der nukleare Akzentton in allen drei Sprachen zumeist auf das letzte Argument der Intonationsphrase. Im Rahmen der Autosegmental-Metrischen (AM) Phonologie sind im we- sentlichen zwei Beschreibungsmodelle für die Intonation des Deutschen entwik- kelt worden. Auf der einen Seite handelt es sich hierbei um die Ansätze von Féry (1993) und Grabe (1998), die sich an Gussenhovens (1984) Analyse des Niederländischen anlehnen, auf der anderen Seite um GToBI (German Tones 1 Akzentton und Tonakzent werden in diesem Aufsatz synonym verwendet. Beide Begriffe ent- sprechen dem englischen Pitch Accent.

Embed Size (px)

Transcript of Deutsche Intonation und GToBI - coli.uni-saarland.de2002:DIG.pdf · Deutsche Intonation und GToBI 3...

  • Linguistische Berichte 181/2000 Helmut Buske Verlag, Hamburg

    Deutsche Intonation und GToBI

    Martine Grice und Stefan Baumann

    ABSTRACT

    In this paper we provide an overview of work carried out on the intonation of Standard Ger-man, both in auditory phonetic studies and in the instrumentally-based phonological accountswithin the autosegmental-metrical framework. We examine how far the different accountsshed light on controversial issues such as leading tones, levels of phrasing, and phrase accents,and propose a surface-oriented annotation framework, GToBI, which aims to capture all empi-rically observed distinctive intonation patterns. For illustration purposes, the contours whichare reported to occur most commonly are given in schematic form, along with their GToBItranscription and examples of their usage.

    1 Einleitung

    Dem Englischen, Niederlndischen und Deutschen wird eine groe hnlichkeitauf dem Gebiet der Prosodie und Intonation nachgesagt, ein Umstand, der aufihre gemeinsame Zugehrigkeit zur Westgermanischen Sprach(en)familie zu-rckzufhren sein mag. Alle drei Sprachen gelten als akzentzhlend, sindrhythmisch in linkskpfige Fe bzw. Takte gegliedert, heben Information mitHilfe einer Reihe verschiedener Akzenttne1 hervor und verwenden Grenztne,um uerungen in Phrasen zu unterteilen. In Strukturen mit weitem Fokus flltder nukleare Akzentton in allen drei Sprachen zumeist auf das letzte Argumentder Intonationsphrase.

    Im Rahmen der Autosegmental-Metrischen (AM) Phonologie sind im we-sentlichen zwei Beschreibungsmodelle fr die Intonation des Deutschen entwik-kelt worden. Auf der einen Seite handelt es sich hierbei um die Anstze vonFry (1993) und Grabe (1998), die sich an Gussenhovens (1984) Analyse desNiederlndischen anlehnen, auf der anderen Seite um GToBI (German Tones

    1 Akzentton und Tonakzent werden in diesem Aufsatz synonym verwendet. Beide Begriffe ent-sprechen dem englischen Pitch Accent.

  • 2 Martine Grice und Stefan Baumann

    and Break Indices), einem gemeinschaftlich von Martine Grice, MatthiasReyelt, Ralf Benzmller, Anton Batliner und Jrg Mayer (Grice et al 1996;Reyelt et al 1996) erarbeiteten System, das eng verwandt ist mit dem ursprng-lichen englischen ToBI (im folgenden als Mainstream American English ToBI(MAE_ToBI) bezeichnet: Beckman & Hirschberg 1994; Beckman & Ayers-Elam 1997, Beckman, Hirschberg & Shattuck-Hufnagel (im Druck)), welchesseinerseits auf der Analyse des Englischen von Pierrehumbert (1980) undBeckman & Pierrehumbert (1986) basiert.

    Die hier relevanten Unterschiede zwischen den Anstzen bestehen in fol-genden zwei Punkten: Erstens sind Tonakzente in Gussenhovens Modell stetslinkskpfig, analog zur Fustruktur. Dies bedeutet, da die Tonbewegung un-mittelbar vor der akzentuierten Silbe, mit der der Tonakzent assoziiert ist, nichtals Teil dieses Tonakzents beschrieben wird. Dagegen postulieren GToBI undMAE_ToBI sowohl links- als auch rechtskpfige Tonakzente. Letztere tragenzum einen der Tonbewegung auf der akzentuierten Silbe, zum anderen der Ton-bewegung unmittelbar vor der Akzentsilbe Rechnung. Der Ton zur Linken wirdals Leading-Ton bezeichnet. Zweitens analysiert Gussenhoven nukleare Kontu-ren als eine Kombination aus einem Tonakzent und dem Grenzton einer Intona-tionsphrase. GToBI und MAE_ToBI nehmen einen zustzlichen Ton zwischenAkzent und Grenzton an, der Phrasenakzent genannt wird.

    Auf den ersten Blick erscheint es, als wren diese Unterschiede darauf zu-rckzufhren, da eine Forschergruppe das Deutsche eher dem Englischen an-lehnt, die andere eher dem Niederlndischen. Da aber Gussenhoven die Existenzvon Leading-Tnen und Phrasenakzenten auch fr das Englische anzweifelt,wird deutlich, da die erwhnten Unterschiede eher theoretischer als typologi-scher Natur sind.

    Zwei weitere deutsche AM-Anstze sind die von Wunderlich (1988) undUhmann (1991), deren Zuordnung zu den genannten Gruppen weniger eindeutigist. Im Hinblick auf Struktur und Inventar der Akzenttne und Phrasierungsein-heiten sind diese Anstze mit dem Modell Gussenhovens vergleichbar, wenn siesich auch nicht explizit darauf berufen.2

    Im folgenden Kapitel werden wir zunchst kurz auf die traditionelle Litera-tur zur deutschen Intonation eingehen, die in der Regel theorie-neutral war undsich auf auditive Eindrcke, z.T. phonetisch detailliert beschrieben, sttzte.Danach geben wir einen berblick ber die Autosegmental-Metrische Literatur,die zum Teil auf den Arbeiten Gussenhovens aufbaut, gefolgt von einer aus-fhrlichen Beschreibung GToBIs. Abschlieend wird GToBI einem Vergleichmit anderen Autosegmental-Metrischen Modellen zur deutschen Intonationunterzogen sowie unsere Motivation fr abweichende Analysen erlutert.

    2 In bezug auf die verwendeten Darstellungsebenen hingegen hneln beide Anstze dem Mo-dell von Pierrehumbert, bei dem eine abstrakt-phonologische Reprsentation ohne Umweg berphonologische Modifikationen oder Adjustment Rules (wie bei Gussenhoven) in eine phonetischeOberflchenform bertragen wird.

  • Deutsche Intonation und GToBI 3

    2 Beschreibungsmodelle deutscher Intonation

    Intonation ist traditionell entweder in Form von Konturen, d.h. als Tonbewe-gungen in bestimmte Richtungen, oder in Form von Ebenen, in die sich derStimmumfang eines Sprechers einteilen lt, beschrieben worden. In letzteremAnsatz werden Intonationsmuster als Abfolge verschiedener Tonstufen verstan-den. Zunchst werden wir die kontur-basierten Modelle untersuchen, dann einenBlick auf die frhen Ebenen-Modelle werfen, bevor wir uns mit den neuerenAutosegmental-Metrischen Anstzen beschftigen, die ebenfalls Ebenen-Modelle darstellen.

    2.1 Kontur-basierte Modelle

    Frhe Beschreibungen deutscher Intonation, wie etwa durch von Essen (1964),Pheby (1975), Kohler (1977) und Fox (1984), grnden sich grtenteils aufauditive Analysen und sind didaktisch ausgerichtet. Sie stellen Intonationsmu-ster mittels einer detaillierten interlinearen Transkription der Tonhhe jedereinzelnen Silbe einer uerung dar. Alle diese Arbeiten folgen den Ideen derBritischen Schule, z.B. Crystal (1969) und Halliday (1967), die Intonation inForm von dynamischen Tonkonturen beschreiben und die dem Nukleus (Halli-days Tonic, Phebys Tonstelle) als der prominentesten Silbe der uerung beson-dere Bedeutung beimessen. Fr Pheby und Fox beginnt die Tonbewegung, diefr die Klassifizierung eines Intonationsmusters entscheidend ist, auf der nu-klearen Silbe und erstreckt sich bis zum Ende der Phrase. In der BritischenSchule wird diese Tonbewegung als Nuclear Tone bezeichnet.

    Bei Kohler beschrnkt sich die distinktive Kontur einer Intonationseinheitnicht auf die Akzentsilbe und das ihr nachfolgende Material. Vielmehr kann dieentscheidende Tonbewegung vor der Akzentsilbe beginnen. Kohler verstehtAkzenttne als Tonhhengipfel, deren zeitliche Koordination mit dem Text(Alignment) nach vorne oder nach hinten variieren kann. In neueren, instru-mentalphonetisch untersttzten Arbeiten (z.B. Kohler 1991), differenziert er dreiArten von Gipfeln (frh, mittel, spt) und weist ihnen verschiedene pragmati-sche Interpretationen zu: Ein frher Gipfel, bei dem das Tonhhenmaximum aufder prnuklearen Silbe liegt, markiert selbstverstndliche oder bereits gegebeneInformation. Ein mittlerer Gipfel - mit der grten Tonhhe etwa in der Mitteder akzentuierten Silbe - markiert neue Information. Ein spter Gipfel, der ge-gen Ende der akzentuierten oder erst in der folgenden Silbe erreicht wird, drcktEmphase bzw. ein greres Engagement auf seiten des Sprechers aus, als es beieinem mittleren Gipfel der Fall ist (1991:160).

    Ein etwas anderer kontur-basierter Ansatz wurde von Selting (1995) vorge-schlagen mit dem Ziel, ein Beschreibungssystem fr die Analyse spontanerDialoge zu entwickeln. Seltings Modell ist grtenteils auditiv, untersttzt durchinstrumentale Analysen. Es unterscheidet sich von den Anstzen der Britischen

  • 4 Martine Grice und Stefan Baumann

    Schule darin, da Intonationskonturen als holistische Einheiten betrachtet wer-den und der Nukleus keinen Sonderstatus besitzt. Im Gegensatz zur gngigenAuffassung in den frhen auditiven Studien zur deutschen Intonation spiegelnfr Selting Konturen nicht die grammatische Struktur von uerungen wider,sie signalisieren vielmehr das Zusammenspiel als kohsiv wahrgenommenerprosodischer Einheiten (Selting 1995:39) in der Diskursorganisation, z.B. beider Konstruktion von Turns. Seltings Ansatz kann als Overlay Approach (Ladd1996) bezeichnet werden, weil sie nicht nur die Form einzelner lokaler Akzent-tne bestimmt, sondern auch Angaben zum globalen Tonhhenverlauf und zuVernderungen des Stimmumfangs macht.

    Wir werden auf einige dieser Modelle in Kapitel 4 nher eingehen.

    2.2 Frhe Ebenen-Modelle

    Nicht alle Arbeiten zur Intonation des Deutschen waren kontur-basiert. In denfrhen sechziger Jahren beschrieb z.B. Moulton (1962), der Tradition der ameri-kanischen Strukturalisten Pike (1945) und Trager & Smith (1951) folgend, diedeutsche Intonation mit Hilfe von distinktiven Tonebenen (Moulton verwendetedrei statt der bis dahin blichen vier Ebenen; er verzichtete auf die vierte Ebenefr emphatische Sprechweise). Ebenso wie Trager & Smith hatte auch Moultonsogenannte terminale Konturen in seinem Inventar, die die Tonbewegung amEnde einer Phrase als steigend, fallend oder gleichbleibend auswiesen. Ausdiesem Grund ist Moultons Ansatz eher eine Mischung aus Ebenen und Kontu-ren als ein reines Ebenen-Modell.

    Im ersten reinen Ebenen-Modell des Deutschen reduzierten Isaenko &Schdlich (1966) die Anzahl der Ebenen auf zwei. Hierzu haben sie uerun-gen auf einer hohen und einer tiefen Frequenz monotonisiert und Teststimuli miteinem Schritt von der einen Ebene zur anderen, entweder vor der akzentuiertenSilbe (priktisch3) oder danach (postiktisch), zusammengestellt. Priktisch fal-lende Tonhhe ist quivalent zu Kohlers frhem Gipfel, postiktisch fallendeTonhhe entspricht mittleren oder spten Gipfeln. Auf die frhen Gipfel werdenwir bei der Diskussion der GToBI-Akzenttne zurckkommen (Abschnitt 4.1.1).

    2.3 Autosegmental-Metrische Modelle

    Neuere Ebenen-Modelle sind im theoretischen Rahmen der Autosegmental-Metrischen Phonologie entwickelt worden. Der Terminus Autosegmental-Metrisch (AM) geht auf Ladd (1996) zurck und bezeichnet alle Intonations-modelle, die der richtungsweisenden Arbeit von Pierrehumbert (1980) folgen.Alle diese Anstze postulieren mindestens zwei (H (high) und L (low)), hch-

    3 Der Wortakzent wird auch als Iktus bezeichnet.

  • Deutsche Intonation und GToBI 5

    stens drei (H, L und M (mid)) Ebenen fr die Beschreibung von Intonation.Tne bzw. Tonbewegungen werden als Abfolge von Zielpunkten verstanden, dieauf diesen Ebenen liegen. Zum einen dienen Tne dazu, bestimmte Silben her-vorzuheben. Diese werden dann als Tonakzente (bzw. Akzenttne) bezeichnetund sind entweder monotonal (z.B. H*) oder bitonal (z.B. L*+H). Der gesternteTon ist mit der Akzentsilbe assoziiert (und in der Regel auch zeitlich koordi-niert, wenngleich sich die Frage des Alignment in neueren Untersuchen als u-erst komplex erwiesen hat (Arvaniti et al 1999)). Ungesternte Tne, die derakzentuierten Silbe vorangehen, nennt man Leading-Tne, der Akzentsilbenachfolgende Tne Trailing-Tne. Wie bereits erwhnt, besteht ein Unterschiedzwischen Pierrehumberts Modell und GToBI einerseits und den brigen AM-Modellen fr das Deutsche andererseits darin, da erstere sowohl Leading-Tneals auch Trailing-Tne in ihrem Inventar haben, whrend letztere lediglich Trai-ling-Tne erlauben. In Abschnitt 4.1 werden wir ausfhrlicher auf diesenAspekt eingehen.

    Des weiteren knnen Tne als initiale oder finale Grenzmarkierungen frintonatorisch relevante Phrasen fungieren. In den unten beschriebenen Modellenwerden Tne als perzeptiv-phonetische Kategorien verstanden, die sich aku-stisch in Vernderungen des Grundfrequenz(F0)-Verlaufs manifestieren. Aller-dings ist der konkrete F0-Wert dieser Tne in Akzentfolgen oder in Kombina-tionen aus Akzenten und Grenztnen nicht immer eindeutig, d.h. die phoneti-sche Umsetzung der phonologisch definierten H und L Tne kann sich je nachModell sehr unterscheiden. Ferner wird die Hhe der (paradigmatisch ausge-whlten) Tne von syntagmatischen Phnomenen wie Upstep oder Downstepbeeinflut, bei denen die Grundfrequenz in Relation zu einem vorangehendentonalen Ereignis entweder angehoben oder abgesenkt wird.

    Wir werden im folgenden eines der beiden erwhnten, an Gussenhoven an-gelehnten Modelle (Fry) und die beiden unabhngigeren Modelle (Wunderlich,Uhmann) kurz vorstellen, ihr Inventar an Tonakzenten und Grenztnen auflistensowie ihre Beschreibungen gngiger Intonationsmuster des Deutschen untersu-chen, um sie in Kapitel 4 einem Vergleich mit GToBI zu unterziehen.

    Wir beginnen mit der Arbeit von Wunderlich (1988). Wie die meisten deut-schen Intonologen konzentriert er sich auf die grammatischen Funktionen vonIntonation, vor allem Satzmodusunterscheidung und Fokus-Hintergrund-Gliederung (vgl. z.B. Altmann, Batliner & Oppenrieder (1989) fr eine Vielzahlexperimenteller Daten). Wunderlich nimmt nur eine Phrasierungseinheit an, dieIntonationsphrase. Sein tonales Inventar besteht aus einzelnen Akzenten, Ak-zent-Akzent-Sequenzen und Akzent-Grenzton-Sequenzen. Sie sind nachfolgendzusammen mit den Kontexten, in denen sie vorkommen, aufgelistet (soweit vomAutoren angegeben):

    H* Gipfelakzent Standard-AkzentH* H L* Brckenakzent mehrfache Foki, Kontrast%H L* Fallend-Tiefakzent AusrufeL* H% Tiefakzent-Steigend

  • 6 Martine Grice und Stefan Baumann

    L* H (H%) Echoakzent EchofragenH* H linker Brckenpfeiler Anfnge von Listen

    Wunderlich nimmt fr jedes Muster mehrere Verwendungsmglichkeiten an,wobei er die Funktionen des Brckenakzents genauer untersucht. Diese Akzent-folge gilt als typisch fr deutsche Stze mit mehrfachem Fokus: Nach einemGipfelakzent (H*) bleibt der Ton auf einem hohen Niveau, bis er auf der oderzur akzentuierten Silbe steil abfllt (L*). Das ungesternte H beschreibt das hohePlateau zwischen den Akzenten. Es knnte gleichzeitig als Trailing-Ton desersten und als Leading-Ton des zweiten Akzents interpretiert werden. Wenn derBrckenakzent durch eine Phrasengrenze in zwei Teile gespalten wird, beginntder zweite Teil mit dem Tonmuster %H L*, wobei %H fr einen phrasen-initialen Grenzton steht. GToBI wrde den letzten Akzent in einem Brckenak-zent mit einem hohen Leading-Ton (H+L*) notieren, was dem ungesternten H inH* H L* sowie dem %H in %H L* entsprche.

    Uhmanns (1991) Arbeit ber deutsche Intonation ist sehr viel ausfhrlicherund detaillierter, allerdings beschrnkt sie sich, wie Wunderlich, auf eine Unter-suchung der prosodischen Markierung grammatischer Funktionen, insbesondereauf das Verhltnis zwischen Intonation und Fokus-Hintergrund-Struktur. Uh-manns Inventar besteht aus einem optionalen Grenzton L% oder H% zu Beginneiner Intonationsphrase (eine mittlere Tonhhe ist der Normalfall und bleibtdaher unmarkiert), einem obligatorischen finalen Grenzton L% oder H% sowievier Akzenttnen L*, H*, L*+H und H*+L. Der nukleare Akzent ist immerbitonal, prnukleare Akzente knnen mono- oder bitonal sein. Tonale Ziel-punkte direkt vor einer akzentuierten Silbe (d.h. Leading-Tne) gelten als unn-tig fr eine adquate Beschreibung der Tonmuster.

    Uhmann betrachtet Grenztne als phonologische Korrelate der (syntakti-schen) Phrasierung und Akzenttne als phonologische Korrelate des Fokus-merkmals. Sie ordnet Akzenttnen mehr oder weniger distinktive Bedeutungenzu: Ein prnukleares L*+H fungiert als Topikmarker, L* hebt Hintergrundkon-stituenten, H* Fokus- oder Hintergrundkonstituenten hervor, und H*+L repr-sentiert den Default-Fokusakzent.

    Folgende Beziehungen zwischen nuklearem Tonmuster und Satzmodus wer-den postuliert:

    H*+L L% Deklarativstze, W-FragenL*+H H% Echo-Fragen, Ja/nein-FragenH*+L H% Ja/nein-Fragen (nuklearer Akzentton markiert)L*+H L% W-Fragen (nuklearer Akzentton markiert)

    Der Ansatz von Fry (1993) widmet sich ebenfalls dem Einflu der Fokus-struktur auf die Intonationsmuster des Deutschen. Ihr Inventar weicht nur ge-ringfgig von Uhmanns ab. So nimmt Fry z.B. die gleichen vier bitonalenAkzenttne an. Die monotonalen Akzenttypen sind kein zugrundeliegenderBestandteil ihres Inventars, sondern werden durch phonologische Regeln aus

  • Deutsche Intonation und GToBI 7

    den bitonalen abgeleitet. Fry verzichtet auf initiale Grenztne, erlaubt aber dieMglichkeit eines hohen finalen Grentzons (H%), wenn die Tonhhe nach demTrailing-Ton des nuklearen Akzents noch deutlich ansteigt. In Anlehnung anGussenhoven (1984) postuliert die Autorin, da smtliche Tonakzente linkskp-fig und zugrundeliegend bitonal (H*+L or L*+H)4 sind, obwohl sich auch Aus-nahmen von dieser Regel in ihrem Inventar finden, die wir spter diskutierenwerden. In einer Akzentsequenz (z.B. H*+L H*+L) kann ein prnuklearer Ak-zent entweder teilweise oder vollstndig mit einem nuklearen Akzent verbundenwerden. Bei der partiellen Verbindung wird der Trailing-Ton des prnuklearenAkzents mit einer Silbe kurz vor dem Nukleus assoziiert, was an der Oberflcheeinem tritonalen Akzentton entspricht (z.B. H* L+H*+L). Bei der vollstndigenVerbindung wird der Trailing-Ton des prnuklearen Akzents getilgt (z.B. H*H*+L).

    Ein Ziel von Frys Arbeit besteht darin, einen berblick ber die Vielzahlder tonalen Muster des Deutschen zu geben. Besonders detailliert beschreibt siezwei verschiedene Typen der sogenannten Hutkontur (Wunderlichs Brcken-akzent). Der erste ist in (1) dargestellt.

    (1) H* H*+L

    BALD ist sie DA (Fry 1993:150)

    Dieses Muster wird im allgemeinen als eine Phrase realisiert. Der zweite Typusder Hutkontur besteht aus einer Sequenz aus einem steigenden und einem fal-lenden Akzent (L*+H H*+L), wie in Beispiel (2).

    (2) L*+H H*+L

    geSCHLAfen hat KEIner von uns (Fry 1993:129)

    Fry behauptet, da dieses Tonmuster immer in Form zweier Teilphrasen reali-siert werde und da es vom ersten Typus grundstzlich aufgrund des jeweiligenKontexts unterschieden werden knne. Whrend nmlich der erste Typus invielen verschiedenen Strukturen verwendet werden knne, sei der zweite Typusdes Hutmusters auf Topik-Kommentar-Stze beschrnkt, weil es aus einemTopikakzent (L*+H) und einem Fokusakzent (H*+L) bestehe, sowie in kontra-stiven Stzen, in Gappingkonstruktionen und in Clefts.

    Fry postuliert sechs verschiedene nukleare Konturen und gibt zu jeder ein-zelnen typische Kontexte und/oder Bedeutungen in bezug auf Satzmodus,pragmatischer Interpretation oder Spechstil an.

    H*+L Deklarativstze, W-Fragen, Wnsche, ImperativstzeL*+H Progrediente Intonation, Fragen (z.B. Echofragen),

    Unsicherheit/Emprung

    4 Aus Grnden der bersicht und Einheitlichkeit notieren wir zwischen zwei Tnen, die zu ei-nem Akzentton gehren, ein +-Zeichen. Wir bernehmen diese Konvention von Pierrehumbert(1980). Sie wird von Fry nicht verwandt.

  • 8 Martine Grice und Stefan Baumann

    H*+L H% Fragen, DrohungenL*+H+L Implizites selbstverstndlich, leicht drohendH+H*+L Fernsehreporter-StilH*+M Rufkontur

    Allerdings ist die Struktur L*+H+L problematisch, weil Fry hier einen bitona-len Trailing-Ton konstruiert, der ansonsten in ihrem System nicht vorkommt.Die Kontur wre besser als L*+H mit folgendem L% beschrieben. Fry verwirftdiese Analyse aber, vermutlich weil sie der Verteilung der Tne ber die Silbenin ihren Beispielen nicht entspricht. Auerdem ist die steigend-fallende Konturnicht zwangslufig ein Spiegelbild der fallend-steigenden Kontur, die Fry alsH*+L H% reprsentiert. Nach GToBI, das, wie wir sehen werden, nicht nurTrailing-Tne, sondern auch zwei verschiedene Typen von Grenztnen in sei-nem Inventar hat, wird das steigend-fallende Muster als L*+H L-(%) transkri-biert, wobei das H einen Trailing-Ton darstellt. Dies ist nicht als parallel zumfallend-steigenden Muster H* L-H% zu verstehen: In letzterem variiert dasAlignment des L je nach Position metrisch starker (stressed) postnuklearer Sil-ben, die als Anker fr den L Ton dienen. Das L ist hier ein tiefer Grenzton(vgl. Abschnitte 3.3 und 4.2). GToBI erfat auf diese Weise, da die zeitlicheKoordination von Tnen und Text in beiden Mustern unterschiedlich ist. Imbrigen ist die Bedeutung, die Fry diesem Muster, das sie auch als sptenGipfel bezeichnet (1993:96), zuweist, eine andere als bei Kohlers sptem Gip-fel: Whrend nach Fry die Kontur L*+H+L Selbstverstndlichkeit ausdrckt,weist Kohler diese Bedeutung einer ganz anderen Kontur zu, nmlich dem fr-hen Gipfel (vgl. Abschnitte 2.1 und 4.1.1).

    Die Beschreibung stilisierter Konturen, z.B. Rufkonturen, stellt ein weiteresProblem fr Frys Modell dar. Sie reprsentiert die Rufkontur als H*+M undfgt ihrem System damit eine mittlere Tonebene hinzu. Obwohl einiges dafrspricht, Rufkonturen von anderen Intonationsphnomenen abzugrenzen, weil sieoft (geradezu) gesungen werden und daher eine musikalische Notation ange-brachter sein mag, werden sie in GToBI mit Hilfe des regulren Inventars be-schrieben: Die akzentuierte Silbe ist hoch (H*) und der folgende Phrasenakzentherabgestuft (downstepped), symbolisiert als !H-.

    Obwohl Fry explizit von linkskpfigen Tonakzenten (d.h. der gesternte Tonsteht links) ausgeht, nimmt sie einen Akzent in ihr Inventar auf, fr dessen Be-schreibung die Tonhhe vor dem gesternten Ton essentiell ist: der frhe GipfelH+H*+L. In Abschnitt 4.1 werden wir sehen, da diese Kontur auch bei GToBIvorkommt, wenn auch in einer anderen Darstellung.

  • Deutsche Intonation und GToBI 9

    3 GToBI

    3.1 Einfhrung

    GToBI ist ein Transkriptionssystem fr die Intonation des Deutschen, das leichtzu erlernen und flexibel fr verschiedene Anwendungen einsetzbar ist. Es wurdezwischen 1995 und 1996 von Forschern aus Saarbrcken, Stuttgart, Mnchenund Braunschweig mit dem Ziel entwickelt, prosodisch annotierte Daten leichteraustauschen zu knnen. Es wurde ein Konsistenz-Test des gemeinschaftlichvereinbarten Systems durchgefhrt (Grice et al (1996), Reyelt et al (1996)), derzeigte, da die Transkribenten oft schon nach kurzer Zeit in der Lage waren,GToBI konsistent anzuwenden. Als Hilfen standen gedruckte Trainingsmateri-alien sowie begleitende Klang-Dateien (vgl. Benzmller & Grice 1997) zurVerfgung. Individuelles Training wurde praktisch nicht gegeben. Die GToBI-Trainingsmaterialien sind im Jahr 2001 berarbeitet und erweitert worden, be-sonders im Hinblick auf Leading-Tne und Phrasenakzente. Sie sind ber dieoffizielle ToBI-Webseite (http://www.ling.ohio-state.edu/~tobi) zugnglich, aufder auch Links zu ToBI-Systemen in anderen Sprachen zu finden sind. In die-sem Aufsatz wird eine leicht modifizierte Version des ursprnglichen GToBIvorgestellt.

    Ein Teil der Flexibilitt GToBIs ist auf seine verschiedenen Beschreibungse-benen, die sogenannten Tiers, zurckzufhren. Das Konsens-System hat minde-stens drei Tiers zur Verfgung fr die Annotation von Text, Tnen und Grenzen.Prinzipiell werden Informationen nur dann notiert, wenn sie nicht (automatisch)von den Labels anderer Tiers oder vom Sprachsignal abgeleitet werden knnen.

    Der Text-Tier liefert eine orthographische Transkription der geuertenWrter. Auf dem Ton-Tier wird die wahrgenommene Kontur in Form von Ak-zenttnen und Grentnen annotiert, mit diakritischen Zeichen fr Vernderun-gen des Tonhhenumfangs (Pitch Range) wie Downstep und Upstep, die un-mittelbar vor den betreffenden Ton gesetzt werden. Informationen ber die Str-ke von Phrasengrenzen finden sich auf dem Break-Index-Tier. Eine weitereEbene kann fr zustzliche Informationen aller Art verwendet werden (inMAE_ToBI als Miscellaneous Tier bezeichnet). Abbildung 1 zeigt ein Beispielmit Sprachsignal, Ton-, Text-, Grenzstrken- und Kommentar5-Labels sowie F0-Kontur. Die einzelnen Labels werden in den folgenden Abschnitten erlutert.

    5 Creaky Voice ist eines der gngigsten Kommentar-Labels. Es bezeichnet eine Anregungsart,bei der die Stimmbnder nur sehr langsam und/oder unregelmig schwingen. Aus diesem Grundkann oftmals keine Grundfrequenz berechnet werden. Creaky Voice ist ein hufig auftretendesPhnomen am Ende von uerungen.

  • 10 Martine Grice und Stefan Baumann

    Abbildung 1: F0-Kontur und Annotationsebenen (Tiers) der uerung Alsoich bin genau waagerecht rechts von der GOLDmine6 (aus Grice & Benzmller1995).

    Ein Groteil der kodierten Information mu in Relation zu anderen Tiers be-trachtet werden. So sind z.B. die Ton- und Text-Tiers ber die lexikalisch be-tonte (stressed)7 Silbe des akzentuierten Wortes miteinander verknpft. DieseAssoziation wird auf der tonalen Ebene durch einen Stern ausgedrckt (z.B.L+H*). Die lexikalisch betonte Silbe eines Wortes mu gesondert identifiziertwerden, weil Stress in der orthographischen Transkription nicht markiert wird.Es gibt zwei Ausnahmen von dieser Konvention: Zum einen wird Stress tran-skribiert, wenn die Wahl der Wortbetonung frei ist, wie in dem Wort Kaffee, dasentweder als 'Kaffee oder Kaf 'fee (Duden 2000) realisiert werden kann. AlsKennzeichen dient das IPA-Symbol fr Betonung ('), das auf der Text-Ebeneunmittelbar vor der betreffenden Silbe eingefgt wird. Auf die gleiche Weisewird Stress markiert, wenn der Tonakzent nicht auf die lexikalisch primrbe-tonte Silbe eines Wortes fllt. In Beispielsatz (3) sind keine Markierungen ntig,weil die lexikalisch betonte Silbe zwan den Akzent trgt. In (4) ist dagegen derAkzent aus rhythmischen Grnden auf die Vorsilbe hun verschoben.8

    6 In diesem Aufsatz verwenden wir fettgedruckte Grobuchstaben, um nukleare Silben zukennzeichnen.

    7 Bei abstrakten Hervorhebungen auf Wortebene sprechen wir von Betonungen bzw. Stresses,bei konkreten Hervorhebungen auf uerungsebene von Akzenten.

    8 In ihrer Studie ber das amerikanische Englisch haben Shattuck-Hufnagel et al. (1994) dieWahrnehmung von Prominenzen in uerungen mit rhythmischen Zusammensten untersucht. Siekonnten zeigen, da in vielen Fllen eine Verschiebung der wahrgenommenen Hervorhebung vonder lexikalisch betonten auf eine frhere Silbe stattfindet, die sich durch eine deutliche F0-Bewegung (ein Merkmal von akzentuierten Silben) auf der prominenten Silbe manifestiert, ohne da

  • Deutsche Intonation und GToBI 11

    (3) hundertzwanzig(4) 'hundertzwanzig Mann (Giegerich 1985:218)

    Da also die akzentuierte Silbe eines Wortes bis auf die erwhnten Ausnahmennur indirekt zu bestimmen ist, ist es wichtig, da das Label fr den Tonakzent(d.h. der gesternte Ton) in der mit dem Akzent assoziierten Silbe liegt. Dies istunproblematisch, wenn sich der Tonhhengipfel oder das Tonhhental innerhalbder akzentuierten Silbe befindet. In diesem Fall wird das Label auf den Gipfeloder das Tal gesetzt. Wenn allerdings Gipfel oder Tal auerhalb der Akzentsilbeliegt, wird das Tonakzent-Label innerhalb der mit dem Akzent assoziierten Silbeplaziert und der F0-Extremwert mit einem > bzw.

  • 12 Martine Grice und Stefan Baumann

    H*

    Eine kanonisch mit H* markierte Silbe wird als relativ hoch wahrgenommen.Ihr kann ein flacher Anstieg vorangehen.

    L+H*

    Wie bei H* wird die Akzentsilbe als hoch wahrgenommen. Sie folgt unmittelbareinem tiefen Zielpunkt, was zu einem steilen Tonhhenanstieg innerhalb derakzentuierten Silbe oder zu einem Sprung auf die akzentuierte Silbe fhrt. DerGipfel wird oft erst spt in der akzentuierten Silbe erreicht (vgl. Adriaens 1991,Grabe 1998).

    L*

    Die mit L* assoziierte Silbe reprsentiert ein lokales Tonhhenminimum, demeine leicht fallende Bewegung vorangehen kann. Die akustischen ParameterIntensitt und Dauer, die neben der F0-Bewegung zur Wahrnehmung eines Ak-zents beitragen, sind bei diesem Akzenttyp von entscheidender Bedeutung.

    L*+H

    Hier folgt dem tiefen Zielpunkt innerhalb der Akzentsilbe ein (steiler) Anstieg,der spt in der Akzentsilbe beginnt und seinen Gipfel auf der nchsten Silbe(manchmal spter) erreicht. Im Gegensatz zu L+H* wird der Akzent als tiefwahrgenommen.

    H+L*

    Die Akzentsilbe liegt im Bereich der Grundlinie des Stimmumfangs des Spre-chers. Ihr geht ein hoher Zielpunkt voran, der in der Regel auf der unmittelbarvorhergehenden Silbe erreicht wird.

    H+!H*

    Wie bei H+L* geht der Akzentsilbe eine Silbe mit grerer Tonhhe unmittelbarvoran. Allerdings ist die akzentuierte Silbe hier nicht tief, sondern liegt etwa inder Mitte zwischen dem Tonhhengipfel und der Grundlinie des Stimmumfangsdes Sprechers. Dieser mittlere Ton wird als herabgestufter (downstepped)Hochton symbolisiert: !H. Wenn diesem Akzenttyp ein tiefer Grenzton (L-)unmittelbar folgt, entspricht die Kontur einer stetig fallenden Bewegung von der

  • Deutsche Intonation und GToBI 13

    prakzentuierten Silbe durch die akzentuierte Silbe bis hin zur letzten Silbe derPhrase.

    Das Fehlen des Akzenttyps H*+L im Inventar von GToBI wird ausfhrlichin Abschnitt 4.2 diskutiert.

    Die sechs (paradigmatischen) Tonakzenttypen knnen je nach (syntagmati-schem) Kontext modifiziert werden, d.h. die Ausrichtung der H und L Tne imStimmumfang des Sprechers (bzw. Register10) kann variieren. Vernderungen imStimmumfang knnen anhand einer konstruierten oberen und unteren Register-linie beschrieben werden. Die gngigste Vernderung besteht im Absenken deroberen Registerlinie, dem bereits mehrfach erwhnten Downstep. Hierbei wirddem betreffenden H Ton ein Ausrufezeichen als Diakritikum vorangestellt, wiebeim eben vorgestellten Akzenttyp H+!H*. Generell kann jeder H Ton herabge-stuft werden (z.B. !H*, L*+!H), bis auf den ersten innerhalb einer Intonati-onsphrase, weil Downstep nur in Relation zu einem vorangehenden H Ton mg-lich ist. Es ist wichtig zu beachten, da sich alle H Tne, die einem Downstep inderselben Intonationsphrase folgen, innerhalb des durch den Downstep verrin-gerten Registers bewegen. Diese H Tne mssen nicht einzeln als herabgestuftmarkiert werden, es sei denn, es findet ein weiterer signifikanter Downstep statt.Eine solche Folge mehrerer Downsteps hintereinander zeigt die zweite Phrase inAbbildung 1, ...WAAgerecht RECHTS von der GOLDmine: H* !H* !H* L-%.In den eher generativ ausgerichteten Autosegmental-Metrischen Modellen wirdDownstep entweder automatisch durch einen bestimmten Akzenttyp ausgelst,wie in Pierrehumberts Modell fr das Englische (1980), oder als fakultativeOperation behandelt (Gussenhoven 1984). Da GToBI oberflchenorientierter istals die anderen AM-Modelle, wird Downstep einfach bei jedem Auftreten expli-zit markiert.

    Zu Beginn jeder neuen Phrase wird die u.a. durch Downstep verursachte Ab-senkung der oberen Registerlinie in aller Regel aufgehoben (Reset). Ein Resetkann auch nach einer Folge von Downsteps innerhalb einer Phrase vorkommen,dann meist unmittelbar vor dem Nukleus. Das heit: Nach einem schrittweisenAbsinken der Tonhhe findet ein Schritt nach oben, ein Upstep, zum Gipfel dernuklearen Silbe statt. Solche Konturen bzw. Akzentfolgen kommen im Stan-darddeutschen etwa bei emphatischer Sprechweise vor. Sie sind auch fr sd-deutsche Dialekte (Truckenbrodt, erscheint) sowie fr das Englische (Ladd1983:735, Beispiel 4b; Beckman & Pierrehumbert 1986:29911) belegt. In GToBIwerden diese Tne durch das diakritische Zeichen ^ markiert.12

    10 Genaugenommen versteht man unter Register den in einem uerungsteil genutzten Sprech-stimmumfang. Der Sprechstimmumfang ist der Teil des Stimmumfangs, der zum Sprechen genutztwird, whrend Stimmumfang den gesamten Tonhhenbereich bezeichnet, der vom jeweiligen Spre-cher produziert werden kann.

    11 Im Gegensatz zu Ladd postulieren Beckman & Pierrehumbert eine Intermedirphrasengrenzeunmittelbar vor dem Upstep. In den deutschen Beispielen, die einen Upstep enthalten und mit GTo-BI annotiert wurden, haben wir keine Hinweise auf eine Intermedirphrasengrenze gefunden.

    12 Ein Beispiel fr Upstep bei Leading-Tnen wird in Abschnitt 4.1.1 (Abb. 5) diskutiert.

  • 14 Martine Grice und Stefan Baumann

    Die explizite Kennzeichnung des Upstep, die GToBI von anderen Autoseg-mental-Metrischen Anstzen unterscheidet, wird nicht nur fr Akzenttne son-dern auch fr Grenztne verwendet, auf die wir im nchsten Abschnitt eingehenwerden.

    3.3 Grenztne

    GToBI unterscheidet zwei Ebenen der Phrasierung: die (kleine) Intermedir-phrase (ip) und die (groe) Intonationsphrase (IP). Eine IP besteht aus minde-stens einer ip, und jede ip beinhaltet mindestens einen Tonakzent.13

    Die Grenztne dieser Phrasen beschreiben die Kontur vom letzten Ton desnuklearen Tonakzents bis zum Ende der jeweiligen Phrase. Die schematischenDarstellungen der Grenztne und Grenzton-Kombinationen gehen jeweils voneinem vorangehenden H*-Tonakzent aus. Es gibt drei verschiedene Grenztnefr Intermedirphrasen:

    L-

    L- symbolisiert einen tiefen Zielpunkt am Ende der ip.

    H-

    H- hat in etwa den gleichen F0-Wert wie der letzte Gipfel der Phrase. Wennmehrere Silben zwischen dem nuklearen H Ton und dem hohen ip-Grenztonauftreten, entsteht ein hohes Plateau.

    !H-

    Ein hoher ip-Grenzton kann ebenso wie jeder andere H Ton in Relation zu ei-nem vorangehenden H herabgestuft werden. Dies kommt zum Beispiel in Ruf-konturen vor (vgl. Abschnitt 3.5).

    Theoretisch kann ein weiterer Grenzton einer Intermedirphrase angenom-men werden, nmlich ^H-. Allerdings haben sich bisher keine Beispiele gefun-den, die diesen Ton eindeutig von H- unterschieden htten.

    Der Zielpunkt eines ip-Grenztons wird oft auf einer postnuklearen, lexika-lisch betonten Silbe (falls vorhanden) erreicht und erstreckt sich bis zum Anfangder letzten Silbe der Phrase. Diese Tendenz des zeitlichen Alignment von ip-Grenzton und lexikalisch betonter Silbe wurde in einer Untersuchung von Grice

    13 Eine Ausnahme bilden die sogenannten Intonational Tags (Anhngsel wie z.B. ..., ne?), dieals enklitische tonale Einheiten betrachtet werden knnen.

  • Deutsche Intonation und GToBI 15

    und Benzmller (1998)(vgl. Abschnitt 4.2) besttigt und zeigt, da es sich beidieser Art von Grenztnen um sogenannte Phrasenakzente im Sinne von Grice,Ladd & Arvaniti (2000) handelt. Phrasenakzente bestehen aus Tnen, die alsGrenztne fungieren, aber auch mit lexikalisch betonten Silben oder anderentontragenden Einheiten assoziiert werden knnen. GToBI bietet die Mglichkeit,diese Assoziation durch die Transkription eines zustzlichen L(*) oder H(*) aufdem Ton-Tier anzuzeigen. Der in Klammern gesetzte Stern und die BezeichnungPhrasenakzent bringen die (sekundre) Prominenz dieses Tons zum Ausdruck.Abbildung 2 illustriert ein Beispiel fr diese Notation (weitere Beispiele findensich in Abb. 3, Abschnitt 3.5, und in Abb. 6, Abschnitt 4.1.1).

    Abbildung 2: Optionale Transkription von Phrasenakzenten in der uerungHatten die Schler die WOHnungen beMAlen WOLlen? (leicht abgendertaus Grice, Ladd & Arvaniti (2000)); die schattierten Bereiche markieren dieprominenten Silben WOH, MA und WOL.

    Eine Intonationsphrasengrenze tritt immer zusammen mit einer Intermedir-phrasengrenze auf. Daher werden ihre Tne als Kombinationen angegeben. Frdie hier beschriebene neue Version von GToBI wurde die Notation der Grenzt-ne vereinfacht und phonetisch transparenter gestaltet. So wird etwa in Fllen, indenen IP- und ip-Grenztne die gleiche Tonhhe reprsentieren, nurmehr einerder beiden Tne transkribiert: H-% ersetzt die alte Notation H-L% (Erluterungsiehe unten) und L-% die ursprngliche Notationsform L-L%. Die folgende

  • 16 Martine Grice und Stefan Baumann

    Beschreibung kanonischer Grenzton-Konturen geht von mindestens zwei Silbenzwischen dem letzten Akzentton und der Phrasengrenze aus.14

    H-%

    Diese Grenzton-Kombination reprsentiert ein hohes Plateau. Der Hauptunter-schied zwischen H- und H-% ist nicht tonal, sondern besteht in der wahrge-nommenen Strke der Grenze, ausgedrckt durch die Labels 3 bzw. 4 auf demparallelen Break-Index-Tier (vgl. Abschnitt 3.4).

    Es hat bereits verschiedene Vorschlge fr die Beschreibung eines Plateausan Phrasengrenzen gegeben. Grabe (1998) verwendet zum Beispiel die Tran-skription 0% fr eine Kontur, die vom Ende des letzten Akzenttons bis zurGrenze mehr oder weniger gleich bleibt. Das Problem dieser Notation bestehtdarin, da ein solcher unmarkierter Grenzton nicht direkt anzeigt, ob die Phrasehoch oder tief endet. Sein Wert hngt vom vorangehenden Akzentton ab. Dieursprngliche GToBI-Transkription eines Plateaus war H-L%, mit automati-schem Upstep des L Tons (analog zur Notation bei Pierrehumbert 1980). Daaber ein L zur Reprsentation eines mittleren oder sogar hohen Tonniveaus jederIntuition zuwiderluft und daher nur schwer zu vermitteln ist, wird in der neuenTranskription auf diesen Ton verzichtet. Das kombinierte Label H-% hat denVorteil, die Tonhhe am Ende der Phrase direkt wiederzugeben, ohne da einsyntagmatischer Rckgriff auf vorangehende Akzenttne ntig wre. Auf dieseWeise wird das System durchsichtiger, leichter erlernbar und besser nutzbar frautomatische Datenverarbeitung.

    H-^H%

    Der Upstep des H% symbolisiert einen steilen Anstieg der Tonhhe innerhalbder letzten Silbe der Phrase, oft sehr hoch im Stimmumfang des Sprechers.

    L-H%

    Diese Grenzton-Kombination steht fr eine fallend-steigende Kontur, wenn einH Ton vorangeht, ansonsten fr eine flache Kontur mit einem Anstieg auf einemittlere Tonhhe innerhalb der letzten Silbe der Phrase.

    L-%

    Der Hauptunterschied zwischen L- und L-% liegt in der wahrgenommenenGrenzstrke. Auerdem fllt L-% im allgemeinen tiefer als L-. Das Absinken

    14 Wenn zwischen der letzten Akzentsilbe und der Grenze weniger Material zur Verfgungsteht, geht ein Teil der beschriebenen Form verloren, weil nicht genug Zeit fr die Realisierung dereinzelnen Tne vorhanden ist.

  • Deutsche Intonation und GToBI 17

    der Tonhhe am Phrasenende ist vermutlich auf das sogenannte Final Loweringzurckzufhren, ein Effekt, der sich allerdings nicht auf die letzte Silbe be-schrnken mu. Wir unterscheiden nicht zwischen mehreren Tiefegraden anIP-Grenzen.15

    %H

    GToBI bietet die Option, einen auergewhnlich hohen Beginn einer IP durchden initialen Grenzton %H zu markieren. Der Beginn einer IP auf mittleremoder tiefem Tonniveau ist der Default-Fall und wird daher nicht explizit gekenn-zeichnet.

    Folgende Grenzton-Kombinationen sind derzeit nicht im Inventar von GTo-BI enthalten:

    L-^H%

    Prinzipiell knnte diese Kombination fr die Beschreibung einer flachen Konturmit einem steilen Anstieg bis in einen hohen Bereich des Stimmumfangs desSprechers verwendet werden (L-H% steigt nur auf ein mittleres Niveau). Aller-dings ist diese Kontur bislang weder durch gengend Beispiele belegt noch gibtes Hinweise auf einen Bedeutungsunterschied gegenber L-H% (oder H-^H%),der die Einfhrung einer eigenen Kategorie rechtfertigen wrde.

    H-L%

    Diese Notation wurde in frheren GToBI-Versionen verwendet, um ein Plateauzu beschreiben (mit automatischem Upstep des L% nach einem H- Phrasenak-zent; siehe oben). Da Upstep nunmehr explizit markiert wird, knnte H-L% einefallende Kontur nach einem hohen Plateau symbolisieren. Wenn auch eine sol-che Kontur im Standarddeutschen nicht belegt ist, so wurde sie doch in Untersu-chungen zu ostflischen (Kerckhove 1948:63) und pflzischen Dialekten (Peters2001a, 2001b) erwhnt.

    Die brigen drei logisch mglichen Grenzton-Kombinationen sind durch be-reits erwhnte abgedeckt: H-H% und H-^L% knnen mit H-% gleichgesetztwerden, und L-^L% wre der Kontur L-H% sehr hnlich. Weitere Nuancen beider Beschreibung von Tonbewegungen an Intonationsphrasengrenzen habensich bisher als nicht notwendig erwiesen, weil das GToBI-Inventar alle in dereinschlgigen Literatur erwhnten charakteristischen Bedeutungen oder Funk-tionen phrasenfinaler Konturen abdeckt.

    15 Dies bedeutet, da wir nicht zwischen L-% und L-L% fr tief und extra tief unterscheiden,weil unklar ist, inwiefern eine solche Differenzierung fr das Standarddeutsche funktional gerecht-fertigt werden knnte.

  • 18 Martine Grice und Stefan Baumann

    3.4 Break-Indizes

    Die Verwendung der Break-Index-Ebene ist eng an MAE_ToBI angelehnt, d.h.die Indizes 3 und 4 entsprechen den Grenzen einer Intermedir- bzw. einer Into-nationsphrase. Allerdings werden diese beiden Break-Indizes in GToBI imNormalfall nicht (hand)gelabelt, sondern knnen automatisch gesetzt werden,weil die entsprechenden Grenzen auch auf dem Ton-Tier gekennzeichnet sind(als bzw. %). Bei Unklarheiten oder mangelnder bereinstimmung zwischenden Tiers stehen folgende Labels zur Verfgung: 4- wird in den Fllen ver-wendet, in denen eine Phrasengrenze wahrgenommen wird, ber deren Strkeallerdings nicht entschieden werden kann. Ferner unterscheidet GToBI zweiDiskrepanzen zwischen der tonalen und der rhythmischen Ebene, die inMAE_ToBI beide mit dem Index 2 markiert werden: 2r steht fr einen rhyth-mischen Bruch bei tonaler Kontinuitt, z.B. bei einer Zgerpause, whrend 2teine tonale Unterbrechung bei rhythmischer Kontinuitt reprsentiert, z.B. wenneine Phrasengrenze wahrgenommen wird, aber keine Pause eintritt. Dies ist oftbei schneller Sprechweise der Fall. Break-Index 2 ohne zustzliches Diakriti-kum findet bei GToBI keine Verwendung, ebensowenig wie Indizes unterhalbdieser Ebene.

    3.5 Gngige nukleare Intonationsmuster

    Tabelle 1 zeigt schematische Darstellungen von nuklearen Intonationskonturendes Deutschen, die hufig in der Literatur erwhnt werden, sowie mglicheKontexte und konkrete Textbeispiele. In den schematischen Konturen markierenextra fettgedruckte Linien akzentuierte Silben und weniger fettgedruckte Linienpostnuklear betonte Silben. Horizontale Linien reprsentieren die Grundlinie desStimmumfangs des Sprechers. Wir gehen bei der Darstellung von maximalenKonturen aus, d.h. dem Nukleus folgen mindestens eine postnuklear betontesowie eine weitere Silbe. Obwohl die meisten konkreten Beispiele tatschlicheine postnukleare Betonung aufweisen, so entsprechen doch nicht alle der ma-ximalen Kontur. Dies liegt daran, da die uerungen aufgrund ihrer pragmati-schen Beispielhaftigkeit und nicht wegen ihrer rhythmischen Struktur ausge-whlt wurden. So wird etwa die steigende Kontur 3a mit zwei uerungen be-schrieben: Tauschen Sie auch BRIEFMARken? und Von wem ich das HAbe?.Im ersten Satz entspricht die extra fettgedruckte Linie der nuklearen Silbe,BRIEF, und die fettgedruckte Linie der postnuklear betonten Silbe MAR. Imzweiten Satz folgt der nuklearen Silbe HA nur noch eine Silbe. Da fr die Reali-sierung der schematischen Kontur (steigend-Plateau-steigend) nicht genug Seg-mente vorhanden sind, steigt die Tonhhe von der Silbe HA direkt bis zum Endeder Phrase. Wenn die nukleare Silbe die letzte der Phrase bildet, kann die Kon-tur verkrzt werden (truncation), besonders wenn die Silbenkoda stimmlose

  • Deutsche Intonation und GToBI 19

    Obstruenten enthlt. Dies gilt vor allem fr fallende Konturen (vgl. Grabe1998).

    Die Tabelle beinhaltet kontextuelle Interpretationen, die auf die konkretenBeispiele bezogen sind. Sie sollen nicht als allgemeine Bedeutungen der Kontu-ren verstanden werden. Wir nehmen keine strikte Trennung von rein linguisti-schen und eher paralinguistischen Aspekten intonatorischer Bedeutung vor. Diesgeschieht im Einklang mit den Erkenntnissen von Scherer, Ladd & Silverman(1984), die in einer Reihe von Experimenten festgestellt haben, da auch dieemotionale Botschaft einer uerung von phonologischen Kategorien wie Ak-zentton-Typ oder Grenzton mitgetragen wird, stets in Verbindung mit anderenlinguistischen Kategorien, wie z.B. dem Satztyp. In einem im Grundsatz pho-nologischen Beschreibungsmodell wie GToBI steht diese, (vermutlich) kognitivgesteuerte Seite der emotionalen Botschaft im Vordergrund, die an andererStelle (Ladd et al 1985, Mozziconacci 1998) dem Begriff Einstellungen zuge-ordnet wurde, im Gegensatz zu Emotionen im engeren Sinne, die eher physiolo-gisch bedingt sind und deren angemessene Beschreibung sich kontinuierlicherakustischer Parameter bedient (vorausgesetzt die Emotionen werden berhauptber den Sprachkanal ausgedrckt).

    Die Konturen in der Tabelle werden unten im einzelnen diskutiert.

    Tabelle 1 - Gngige nukleare Intonationsmuster des Deutschen und Beispiele frihre Verwendung

    GToBI Schematische Kontur Kontext BeispielFallend 1a H* L-% Neutrale

    Aussage

    NeutraleW-Frage

    Mein ZAHNtut WEH.1

    Wo hast duden WAgengePARKT?1

    1b L+H*L-%

    KontrastiveFeststellung

    Schon derVerSUCH istSTRAFbar!2

    Steigend-fallend(SpterGipfel)

    2 L*+HL-%

    Sebstver-stndliche

    Feststellung

    Engagierteoder sarkasti-

    sche Fest-stellung

    Das WEISSich SCHON!6

    Der Blick istja FAbel-

    haft!3

  • 20 Martine Grice und Stefan Baumann

    Steigend 3a L* H-^H%

    Neutrale Ent-scheidungs-

    frage

    Echo-Frage

    Tauschen Sieauch BRIEF-MARken?1

    Von wem ichdas HAbe?2

    3b L* L-H%

    Emprung

    Melden amTelefon

    DOCH!

    BECken-BAUer?4

    3c (L+)H*H-^H% Anschlu-

    frage...oder ist Ihr

    BRUderHIER?5

    Gleich-bleibend

    4 (L+)H*H-(%)

    Weiterwei-sende ue-

    rung

    FloskelhafteAusdrcke

    ANderer-SEITS...6

    GutenMORgen!3

    Fallend-Steigend

    5 (L+)H*L-H%

    HflichesAngebot

    Mgen SieROGgen-

    BRTchen?1

    FrherGipfel

    6a H+!H*L-%

    Besttigungeiner

    BekanntenTatsache

    Hab ich mirschon ge-

    DACHT.7

    6b H+L*L-%

    Beruhigendeoder hflicheAufforderung

    Nun erZHle

    doch MAL!2

    StilisierteHerab-stufung

    7 (L+)H*!H-% Ausrufe BECken-

    BAUer!

    Beispiele aus 1Fry (1993), 2von Essen (1964), 3Fox (1984) 4Ladd (1996,angelehnt), 5Moulton (1962), 6Pheby (1984) und 7Grice & Benzmller (1995).Fettgedruckte Grobuchstaben symbolisieren nukleare Silben, normal gedruckteGrobuchstaben postnuklear betonte Silben.

  • Deutsche Intonation und GToBI 21

    Fallend In der Autosegmental-Metrischen Literatur wird nur ein fallenderKonturtyp (in nuklearer Position) beschrieben. GToBI unterscheidet dagegenzwischen einer einfach fallenden Bewegung, notiert als H* L-%, und einer fal-lenden Kontur, der ein steiler Anstieg zur Akzentsilbe oder innerhalb der Ak-zentsilbe vorangeht. Letztere wird mithilfe eines tiefen Leading-Tons symboli-siert: L+H* L-%. Diese Kontur drckt oft einen Kontrast aus (besonders beigroer Ausnutzung des Stimmumfangs eines Sprechers), wie im Beispiel inAbbildung 3.

    Abbildung 3: F0-Kontur von L+H* L-% auf Schon der VerSUCH istSTRAFbar. Der schattierte Bereich markiert die nukleare Silbe SUCH; L(*)reprsentiert einen optionalen Phrasenakzent auf der postnuklear betonten SilbeSTRAF.

    Steigend-fallend Die steigend-fallende Kontur, notiert als L*+H L-%, un-terscheidet sich von der eben beschriebenen Kontur L+H* L-% in der Synchro-nisierung mit der akzentuierten Silbe. Bei L*+H L-% ist die Tonhhe in derAkzentsilbe zunchst tief. Der Anstieg beginnt innerhalb der Akzentsilbe oderkurz danach (vgl. Abbildung 4). Bei L+H* L-% dagegen setzt der Anstieg fr-her ein, oft bereits vor der Akzentsilbe. Die akzentuierte Silbe der ersten Konturklingt tief, die der zweiten Kontur hoch.

  • 22 Martine Grice und Stefan Baumann

    Abbildung 4: F0-Kontur von L*+H L-% auf Der Blick ist ja FAbelhaft; derschattierte Bereich markiert die nukleare Silbe FA.

    Steigend In der frhen Autosegmental-Metrischen Literatur finden sichhchstens zwei verschiedene Arten steigender Konturen. GToBI differenziertzwei tief einsetzende nukleare Bewegungen, L* L-H% und L* H-^H%, wobeider Endpunkt der zweiten hher liegt als der der ersten. Zustzlich gibt es dieMglichkeit einer Kontur, die von einer mittelhohen Akzentsilbe bis zum Phra-senende steigt (mit oder ohne Anstieg zur Akzentsilbe): (L+)H* H-^H%.

    Gleichbleibend Konturen, die auf gleichbleibender oder anhaltender Ton-hhe enden, werden in der Literatur kaum behandelt. Nach Fry kann eineKontur, die einem nuklearen L*+H folgt, bis zum Phrasenende auf der Hhe desTrailing-Tons bleiben. Dieser gleichbleibende (Grenz-)Ton wird von Fry nichttranskribiert. Damit verzichtet sie auf eine Unterscheidung zwischen steigendenund gleichbleibenden nuklearen Mustern: As a matter of fact, rising tones andprogredient intonation cannot be kept apart. (1993:89). GToBI kennzeichneteine gleichbleibende Kontur mit oder ohne Rising Onglide (vgl. Abschnitt 4.1.2)als L+H* H-% bzw. H* H-%.

    Fallend-Steigend Im allgemeinen werden fallend-steigende Bewegungenin GToBI als (L+)H* L-H% transkribiert. Es ist aber auch mglich, eine hohefallend-steigende Bewegung darzustellen, bei der die Tonhhe zwischen den

  • Deutsche Intonation und GToBI 23

    beiden Gipfeln nicht ganz tief absinkt, und zwar als (L+)H* !H-^H%. Aller-dings ist fraglich, ob eine solche Unterscheidung tatschlich notwendig ist.

    Frher Gipfel GToBI hat zwei Arten von Frhe-Gipfel-Konturen im In-ventar: H+!H* und H+L*. Die erste entspricht dem von Kohler beschriebenenMuster, das eine zusammenfassende, abschlieende Argumentation (1995:198)anzeigt, sowie der Kontur, die von Fry als H+H*+L transkribiert wird. VonEssen behauptet, da diese Tonbewegung Finalitt kennzeichnet, sogar aufnicht-abgeschlossenen Teilen einer uerung. Das Muster werde oft von Ra-diosprechern beim Verlesen der Meldungen verwendet. Diese Beobachtunghnelt derjenigen Frys, die Frhe-Gipfel-Konturen vor allem bei Fernsehre-portern ausgemacht hat. Die schematische Darstellung von H+!H* in Tabelle 1gibt Raum fr eine postnuklear betonte Silbe, die in dem spontansprachlichenBeispiel nicht vorhanden ist. In einem Beispielsatz wie Sie htte ja LgenKNnen wre die zweite fettgedruckte Linie mit der Silbe kn assoziiert. Dieandere Frhe-Gipfel-Kontur, H+L*, drckt nach von Essen eine fatalistischeStimmung aus. Sie kann auch in beruhigenden oder hflichen Aufforderungenverwendet werden, wie in dem in Tabelle 1 angegebenen Beispiel. Eine detail-liertere Diskussion der Frhe-Gipfel-Konturen folgt in Abschnitt 4.1.1.

    Stilisierte Herabstufung Die stilisierte Herabstufung (oder Rufkontur) wirdals (L+)H* !H-% reprsentiert. Der Phrasenakzent !H- fllt auf eine betonteSilbe, falls eine solche vorhanden ist. Wie bereits in Abschnitt 3.3 erwhnt,besteht die Mglichkeit, die Prominenz dieser Silbe mit dem zustzlichen Label(*) zu kennzeichnen. Die vielfltige Verwendung der Rufkontur im Deutschenist ausfhrlich von Gibbon (1976, 1998) beschrieben worden.

    4 GToBI im Vergleich mit anderen AM-Anstzen

    Tabelle 2 zeigt, da die drei AM-Anstze von Wunderlich (1988), Uhmann(1991) und Fry (1993) jeweils eine Reihe von nuklearen Konturen des Deut-schen darstellen (knnen), diese Konturen aber nicht immer deckungsgleichsind. GToBI ist mit dem Ziel entwickelt worden, smtliche bekannten Tonmu-ster beschreiben zu knnen. Zustzlich ermglicht GToBI feinere Differenzie-rungen bei der Darstellung einzelner Tonverlufe. Diese grere Vielfalt wirdvor allem durch zwei Faktoren erreicht: Zum einen hat GToBI Leading-Tne imInventar, die eine Unterscheidung z.B. zwischen einer fallenden Kontur undeiner fallenden Kontur mit vorangehendem Onglide ermglichen. Zum anderenwerden in GToBI zwei Phrasierungsebenen (ip und IP) und damit zwei Artenvon Grenztnen (Phrasenakzente und IP-Grenztne) verwendet, die zustzlichdurch explizite Markierung von Upstep und Downstep differenziert werden

  • 24 Martine Grice und Stefan Baumann

    knnen. Alle anderen Anstze gehen dagegen nur von einem Grenzton aus. Wirwerden diese Aspekte im folgenden nher behandeln.

    Tabelle 2 - Nukleare Tonmuster des Deutschen drei Modelle im Vergleich mitGToBI

    Wunderlich Uhmann Fry GToBIFallend 1 a H* L H*+L L% H*+L H* L-%

    1 b L+H* L-%

    Steigend-fallend(Spter Gipfel)

    2 L*+H L% L*+H+L L*+H L-%

    Steigend 3 a L* H H% L*+H H% L*+H L*(+H) H-^H%3 b L* H% L* L-H%3 c (L+)H* H-^H%

    Gleichbleibend 4 L*+H (L+)H* H-(%)

    Fallend-steigend 5 H*+L H% H*+L H% (L+)H* L-H%

    Frher Gipfel 6 a H+H*+L H+!H* L-%6 b %H L* L H+L* L-%

    StilisierteHerabstufung

    7 H*+M (L+)H* !H-%

    4.1 Leading-Tne

    GToBI bietet die Mglichkeit zur Beschreibung hoher oder tiefer Leading-Tne.Dies bedeutet, da die Tonhhe vor einer Akzentsilbe entweder als H transkri-biert werden kann, was als Frhe-Gipfel-Kontur bezeichnet wird, oder als L,was eine Kontur mit Anstieg auf eine akzentuierte Silbe zur Folge htte, dieauch Rising Onglide genannt wird.

    4.1.1 Frhe Gipfel

    Es gibt viele Beispiele, die die Existenz von Frhe-Gipfel-Konturen (bzw.Konturen mit einem hohen Leading-Ton) im Deutschen nahelegen. Ein klassi-scher Fall ist Kohlers frher Gipfel, wiedergegeben in (5a).

  • Deutsche Intonation und GToBI 25

    (5a)

    Sie hat ja ge- LO- gen (Kohler 1995:123)

    Kohler hat Perzeptionstests durchgefhrt, die eindeutig belegen, da ein ho-her Ton unmittelbar vor der Akzentsilbe distinktiv ist, d.h. die Frhe-Gipfel-Kontur, die gegebene Information signalisiert, reprsentiert eine andere lingui-stische Kategorie als ein mittlerer Gipfel, der zur Markierung neuer Informationverwendet wird. In GToBI kommt diese Unterscheidung in den Notationen zumAusdruck: Ein frher Gipfel wird durch einen H Leading-Ton vor der (tieferen)Akzentsilbe symbolisiert (in (5a) auf der Silbe ge-), whrend ein mittlerer Gip-fel als H* auf der Akzentsilbe (mglicherweise mit einem L Leading-Ton) tran-skribiert wrde (im Beispielsatz (5b) auf der Silbe LO-):

    (5b)

    Sie hat ja ge- LO- gen (Kohler 1995:123)

    Im Zwei-Ebenen-Modell von Isaenko & Schdlich entspricht diepriktisch fallende Kontur dem frhen Gipfel. Sie ist in (6a) schematisch dar-gestellt. (6b) zeigt eine postiktisch fallende Kontur, die mittlere und spteGipfel reprsentiert.

    (6a) priktisch fallend (6b) postiktisch fallend___ _______die KINder die KIN der

    (Isaenko & Schdlich 1966:60)

    GToBI hat nicht nur eine Frhe-Gipfel-Kontur, sondern zwei: H+!H* undH+L*. Grabe (1998:89f.) erklrt den Unterschied zwischen beiden Formen als

  • 26 Martine Grice und Stefan Baumann

    teilweisen bzw. vollstndigen Downstep des zugrundeliegenden AkzenttonsH*+L (allerdings hlt sie den Unterschied fr graduell). Wie in Abschnitt 3.5gezeigt, beschreibt schon von Essen (1964) beide Arten der Frhe-Gipfel-Kontur und weist ihnen unterschiedliche Verwendungen zu.

    Die Abbildungen 5 und 6 illustrieren spontansprachliche uerungen derbeiden Kontur-Typen.

    Abbildung 5: F0-Kontur eines nuklearen H+!H* L-% auf Man stellt sicheinfach daHINter; die schattierten Bereiche markieren die akzentuierten SilbenSTELLT, EIN und HIN.

  • Deutsche Intonation und GToBI 27

    Abbildung 6: F0-Kontur von H+L* L-% auf ... bis ich endlich DRAN-KAM. Der schattierte Bereich markiert die nukleare Silbe DRAN; L(*) repr-sentiert einen optionalen Phrasenakzent auf der postnuklear betonten SilbeKAM.

    Der in Abbildung 5 dargestellte Satz liefert ein Beispiel fr die Auswirkungender syntagmatischen Prozesse Downstep und Upstep (vgl. Abschnitt 3.2) auf HLeading-Tne. Die ersten beiden Akzenttne der uerung haben die FormH+L*, wobei der zweite H Ton auf sich in Relation zum ersten H Ton auf manherabgestuft ist. Dieser Downstep (!H) wird durch den nchsten H Leading-Tonauf der Silbe da aufgehoben; die Tonhhe erreicht durch Upstep (^H) wiederdas Niveau des initialen H Tons der Phrase.

    4.1.2 Rising Onglides

    Selting (1995) geht davon aus, da ein distinktives lokales Tonmuster auf einerakzentuierten Silbe beginnt und sich ber die nachfolgenden unakzentuiertenSilben erstreckt, und zwar bis unmittelbar vor den nchsten Akzent. Damit istSeltings Akzentdomne mit Abercrombies Fu bzw. dem Takt, wie diese Einheitin der Literatur ber das Deutsche oft genannt wurde (z.B. Kohler 1977, Pheby1975), verwandt und mit Gussenhovens (1990) Tonal Association Domain iden-tisch. Sie entspricht auch der Domne des Nuclear Tone in der Britischen Schule(zumindest fr den letzten Akzent einer Phrase bzw. Tongruppe). Eine Folgedieser Einteilung besteht darin, da die Tonhhe unmittelbar vor einer Akzent-silbe von der Beschreibung dieses Akzents ausgenommen ist. So wre zumBeispiel ein konventioneller Vertreter der Britischen Schule gezwungen, dienukleare Tonbewegung in Satz (7), entlehnt aus Fox (1984:19), als gleichblei-bend hoch zu analysieren, weil die relevante Bewegung erst mit dem Nukleusauf KOMMST beginnen sollte. Das gleiche gilt fr Seltings Ansatz.

    (7)

    Wenn du morgen KOMMST... (fahren wir zusammen)

    Allerdings wird die Bewegung von der prnuklearen Silbe -gen aufKOMMST eindeutig als steigend bzw. als Sprung nach oben auf den Nukleuswahrgenommen, so da die Spezifizierung der gleichbleibenden Tonhhe aufKOMMST allein nicht ausreicht, um das Wesen dieser Kontur angemessen zubeschreiben. Obwohl auch Fox der Britischen Schule zuzurechnen ist, pldierter in diesem Fall dafr, die prnukleare Tonbewegung miteinzubeziehen:

    h h

    h

    h

  • 28 Martine Grice und Stefan Baumann

    [...] an important characteristic of this pattern is the jump up to thehigh level pitch of the nucleus. The nucleus must always be at a higherpitch than the immediately preceding syllable. If the preceding head ishigh, its pitch must fall towards the end to allow for the jump up, hencethe lower pitch given to morgen [...]

    (1984:19f., Kursivierung wie im Original)

    Die beschriebene Kontur findet sich bereits im frhen Zwei-Ebenen-Modellvon Isaenko & Schdlich und wird dort als priktischer Anstieg bezeichnet,schematisch dargestellt in (8).

    (8) priktisch steigend______

    die KINder

    (Isaenko & Schdlich 1966:60)

    In GToBI wird diese Bewegung durch den bitonalen Tonakzent L+H* sym-bolisiert.

    4.2. Phrasierungsebenen und Phrasenakzente

    In Autosegmental-Metrischen Anstzen des Deutschen wird wie in groenTeilen der traditionellen Literatur im allgemeinen nur eine Phrasierungsebeneangenommen, die Intonationsphrase (z.B. Uhmann 1991, Grabe 1998). DieAusnahme unter den Anhngern der AM Phonologie bildet Fry (1993), diezustzlich (kleinere) Intermedirphrasen in ihrem Inventar hat, ebenso wieMAE_ToBI fr das Englische und GToBI fr das Deutsche. Unter den lteren,auditiv ausgerichteten Anstzen knnen lediglich in von Essens Ansatz zweiPhrasierungsebenen ausgemacht werden. Seine Analyseeinheit ist die Rhetori-sche Phrase. Er unterscheidet zwei Arten einer Rhetorischen Phrase: eine gre-re mit Nukleus (bzw. Schwerpunkt in von Essens Terminologie) und eine kleine-re ohne Nukleus. Wenn eine uerung mehr als eine Phrase umfat, enthlt dieletzte einen Nukleus. Dies wird in Beispiel (9) illustriert:

    (9) Ich habe geTAN | was mir beFOHlen war.

    (von Essen 1964:38)

    hhhh

    h h h

    h h

  • Deutsche Intonation und GToBI 29

    Nach GToBI wird dieser Beispielsatz in zwei Intermedirphrasen (ip) auf-geteilt, die zusammen eine Intonationsphrase (IP) bilden, dargestellt in (10):

    (10) [ [ Ich habe geTAN ]ip [was mir beFOHlen war]ip ]IP

    Obwohl die Analysen von Essens und GToBIs sehr hnlich aussehen, gibt esdoch einen wichtigen Unterschied: Whrend von Essen die beiden Phrasentypenaufgrund ihrer Kontur als eigene Kategorien betrachtet (progrediente Tonfh-rung auf der einen, terminale und interrogative Tonfhrung auf der anderenSeite), postuliert GToBI zwei verschiedene, hierarchisch strukturierte Domnender Phrasierung, die unabhngig von bestimmten Tonhhenverlufen sind. Dieeinzige Restriktion, die das Tonmuster betrifft, besteht in der Anzahl der Tne,die am Ende der beiden Phrasierungsebenen auftreten: Am Ende einer Interme-dirphrase steht nur ein Grenzton (der Phrasenakzent), am Ende einer Intonati-onsphrase dagegen immer zwei (Phrasenakzent plus IP-Grenzton). Die Tonmu-ster an ip-Grenzen sind also in der Regel weniger komplex als an IP-Grenzen.

    Fry verzichtet in ihrem Modell auf Phrasenakzente. Sie argumentiert, dadie beiden Funktionen, die der Phrasenakzent erfllt, nmlich Beschreibung desTonhhenverlaufs zwischen dem Nukleus und der Intonationsphrasengrenzesowie Markierung der Grenze einer Intermedirphrase (1993:79), vom Trailing-Ton des letzten Akzenttons der Phrase bernommen werden. Allerdings wirdhierdurch eine klare Differenzierung zwischen einer Sequenz prnuklearer bito-naler Akzenttne (die Fry (1993:120) ausdrcklich erlaubt) und einer Folgemehrerer Intermedirphrasen, die jeweils auf einen bitonalen Tonakzent enden,praktisch unmglich.

    Die Frage nach der angemessenen Transkription fr nuklear fallende Kontu-ren ist immer noch umstritten: H*+L, wie bei Fry und Uhmann, oder H* L-wie in GToBI? Grice & Benzmller (1998) haben belegt, da der Punkt, an demdie F0 die Grundlinie nach einem Gipfelakzent erreicht, variiert: Je weiter dienchste (postnuklear) betonte Silbe entfernt ist, desto spter liegt dieser tiefeZielpunkt. Es zeigte sich sogar, da in 94% aller fallend-steigenden Konturenund in 91% aller fallenden Konturen der Zielpunkt genau mit der betonten Silbekorrespondiert (vgl. Abbildung 2). Dieses Ergebnis ist ein starkes Argument freine Analyse der beschriebenen Konturen als H* L-H% bzw. H* L-% im Ge-gensatz zu H*+L H% bzw. H*+L L%.

    Wir wollen allerdings nicht ausschlieen, da es Konturen gibt, in denen dertiefe Zielpunkt in einem relativ konstanten Abstand vom Gipfelakzent auftrittund somit das L als Teil eines bitonalen Akzenttons H*+L analysiert werdenmu.16 Wir vermuten, da es dialektale Unterschiede in der Position des Ziel-

    16 Dies knnte etwa in Strukturen mit engem Fokus oder Kontrast der Fall sein, wie es einigeBeispiele in Uhmann (1991) suggerieren.

  • 30 Martine Grice und Stefan Baumann

    punkts gibt, ein Phnomen, das auch in anderen Sprachen zu beobachten ist. Sohat etwa die Fragekontur in verschiedenen Dialekten des Griechischen, Rumni-schen und Ungarischen die gleiche tonale Struktur, aber die Assoziation desPhrasenakzents mit dem Text ist jeweils von Dialekt zu Dialekt unterschiedlich.Ferner hat Fitzpatrick-Cole (1999) in ihrer Untersuchung des Berner Schweizer-deutsch eine Assoziation von Grenzton (analysiert als IP-Grenzton) und lexika-lisch betonter Silbe gefunden. Fr das Standarddeutsche haben wir allerdingszurzeit keine ausreichenden Hinweise auf eine distinktive Opposition von H*+Lund H* L-. Daher betrachten wir die beiden Notationen solange als quivalent,bis neue Forschungsergebnisse ber die genaue Position des tiefen Zielpunkts inverschiedenen (semantischen und segmentellen) Kontexten vorliegen.

    5. Fazit

    GToBI ist ein Transkriptionsmodell, das als Hilfsmittel fr die Forschung an derphonologischen Struktur deutscher Intonation entwickelt wurde. Sein Beschrei-bungsinventar ist deutlich grer als diejenigen anderer Autosegmental-Metrischer Modelle zur Intonation des Deutschen, wobei alle distinktiven Kate-gorien, die GToBI zur Verfgung stellt, durch unabhngige Studien, seien sieauditiv oder instrumental ausgerichtet, motiviert sind. Das umfangreichere In-ventar ergibt sich aus dem Ziel dieses Transkriptionsmodells, so flexibel wiemglich zu sein, um alle relevanten, empirisch belegten Muster beschreiben zuknnen, auch wenn sich Teile dieser Beschreibungen als redundant herausstellensollten, weil sich einige Muster als von anderen ableitbar erweisen oder eherdurch graduelle Faktoren zu erklren sind als durch kategorische.

    Literatur

    Adriaens, L.M.H. (1991): Ein Modell deutscher Intonation: eine experimentell-phonetischeUntersuchung nach den perzeptiv relevanten Grundfrequenznderungen in vorgelesenemText. Diss. Technische Universitt Eindhoven.

    Altmann, H., A. Batliner & W. Oppenrieder, Hrsg. (1989): Zur Intonation von Modus undFokus im Deutschen. Tbingen: Niemeyer.

    Arvaniti, A., D.R. Ladd & I. Mennen (1999): What is a starred tone?. In: M. Broe & J.Pierrehumbert, Hrsg. (1999): Papers in Laboratory Phonology V, Language Acquisitionand the Lexicon. Cambridge: Cambridge University Press.

  • Deutsche Intonation und GToBI 31

    Beckman, M.E. & G. Ayers-Elam (1997): Guide to ToBI Labelling. Text und begleitendeAudio-Beispiele erhltlich unter http://ling.ohio-state.edu/Phonetics/E_ToBI/etobi_homepage.html.

    Beckman, M.E. & J. Hirschberg (1994): The ToBI Annotation Conventions. Manuskript undbegleitendes Sprachmaterial. Ohio State University.

    Beckman, M.E., J. Hirschberg & S. Shattuck-Hufnagel (im Druck): The original ToBI systemand the evolution of the ToBI framework. In: S. Jun, Hrsg. (im Druck): Prosodic Typolo-gy. Oxford University Press.

    Beckman, M.E. & J. Pierrehumbert (1986): Intonational Structure in Japanese and English.Phonology Yearbook 3, 255-309.

    Benzmller, R. & M. Grice (1997): Trainingsmaterialien zur Etikettierung deutscher Intona-tion mit GToBI. Saarbrcken: Phonus 3, 9-34.

    Benzmller, R. & M. Grice (1998): The nuclear accentual fall in the intonation of StandardGerman. In: ZAS Papers in Linguistics: Papers on the conference "The word as a phone-tic unit". Berlin. 79-89.

    Crystal, D. (1969): Prosodic Systems and Intonation in English. Cambridge: Cambridge Uni-versity Press.

    Duden (2000): Aussprachewrterbuch (Duden Band 6). Mannheim: Dudenverlag. (4., neubearbeitete und aktualisierte Auflage).

    Essen, O. von (1964)2: Grundzge der hochdeutschen Satzintonation. Ratingen: Henn (1.

    Auflage 1956).

    Fry, C. (1986): Metrische Phonologie und Wortakzent im Deutschen. Studium Linguistik20, 16-43.

    Fry, C. (1993): German Intonational Patterns. Tbingen: Niemeyer.

    Fitzpatrick-Cole, J. (1999): The Alpine Intonation of Bern Swiss German. ProceedingsICPhS99, San Francisco. 941-944.

    Fox, A. (1984): German intonation: An outline. Oxford: Clarendon Press.

    Gibbon, D. (1976): Perspectives of intonation analysis. Bern: Lang.

    Gibbon, D. (1998): Intonation in German. In: D. Hirst & A. Di Cristo, Hrsg. (1998): Intona-tion Systems. A survey of 20 languages. Cambridge: Cambridge University Press. 78-95.

    Giegerich, H.J. (1985): Metrical Phonology and Phonological Structure. German and English.Cambridge: Cambridge University Press.

    Grabe, E. (1998): Comparative Intonational Phonology: English and German. (MPI Series inPsycholinguistics 7). Wageningen: Ponsen and Looijen.

  • 32 Martine Grice und Stefan Baumann

    Grice, M. & R. Benzmller (1995): Transcription of German Intonation using ToBI-Tones The Saarbrcken System. Saarbrcken: Phonus 1, 33-51.

    Grice, M. & R. Benzmller (1998): Tonal affiliation in German falls and fall-rises. Posterpresented at the 5

    thConference on Laboratory Phonology, York.

    Grice, M., D.R. Ladd & A. Arvaniti (2000): On the place of phrase accents in intonationalphonology. Phonology 17.2, 143-185.

    Grice, M., M. Reyelt, R. Benzmller, J. Mayer & A. Batliner (1996): Consistency in Tran-scription and Labelling of German Intonation with GToBI. Proceedings of the Fourth In-ternational Conference on Spoken Language Processing, Philadelphia. 1716-1719.

    Gussenhoven, C. (1984): On the Grammar and Semantics of Sentence Accents. Dordrecht:Foris.

    Gussenhoven, C. (1990): Tonal association domains and the prosodic hierarchy in English.In: S. Ramsaran, Hrsg. (1990): Studies in the pronunciation of English. London: Routled-ge.

    Halliday, M.A.K. (1967): Intonation and Grammar in British English. The Hague: Mouton.

    Isaenko, A.V. & H.J. Schdlich (1966). Untersuchungen ber die deutsche Satzintonation.Studia Grammatica VII, 7-64.

    Kerckhove, M. van de (1948): Intonationssystem einer Mundart. Zeitschrift fr Phonetikund Allgemeine Sprachwissenschaft, 52-65.

    Kohler, K.J. (1977): Einfhrung in die Phonetik des Deutschen. (Grundlagen der Germanistik20). Berlin: Schmidt. (2., neu bearbeitete Auflage 1995).

    Kohler, K.J. (1991): Terminal intonation patterns in single-accent utterances of German:Phonetics, phonology, and semantics. Kiel: AIPUK 25, 115-185.

    Ladd, D.R., K.E.A. Silverman, F. Tolkmitt, G. Bergman & K.R. Scherer (1985): Evidence forthe independent function of intonation contour type, voice quality, and F0 range in signal-ling speaker affect. Journal of the Acoustical Society of America 78, 435-444.

    Ladd, D.R. (1996): Intonational Phonology. Cambridge: Cambridge University Press.

    Moulton, W.G. (1962): The Sounds of English and German. Chicago: University of ChicagoPress.

    Mozziconacci, S.J.L. (1998): Speech variability and emotion: Production and perception. Diss.Technische Universitt Eindhoven.

    Peters, J. (2001a): Postnukleare Tonhhengipfel in der Vorderpfalz und in Mannheim. Ms.,Universitt Potsdam.

    Peters, J. (2001b): Frageintonation in der Pfalz. Eine Reanalyse des Gntherodt-Korpus. Ms.,Universitt Potsdam.

  • Deutsche Intonation und GToBI 33

    Pheby, J. (1975): Intonation und Grammatik im Deutschen. Berlin: Akademie-Verlag.

    Pheby, J. (1984)2: Phonologie: Intonation. (Kap. 6). In: K.E. Heidolph et al., Hrsg. (1984):

    Grundzge einer deutschen Grammatik. Berlin: Akademie-Verlag. 839-897. (1. Auflage1980).

    Pierrehumbert, J. (1980): The Phonology and Phonetics of English Intonation. Diss. MIT.Bloomington: Indiana University Linguistics Club.

    Pike, K.L. (1945): The intonation of American English. Ann Arbor: University of MichiganPress.

    Reyelt, M., M. Grice, R. Benzmller, J. Mayer & A. Batliner (1996): Prosodische Etikettie-rung des Deutschen mit ToBI. In: D. Gibbon, Hrsg. (1996): Natural Language and Spe-ech Technology, Results of the third KONVENS conference. Berlin, New York: Moutonde Gruyter. 144-155.

    Scherer, K.R., D.R. Ladd & K.E.A. Silverman (1984): Vocal cues to speaker affect: Testingtwo models. Journal of the Acoustical Society of America 76 (5), 1346-1356.

    Selting, M. (1995): Prosodie im Gesprch. Aspekte einer interaktionalen Phonologie derKonversation. Tbingen: Niemeyer.

    Shattuck-Hufnagel, S., M. Ostendorf & K. Ross (1994): Stress shift and early pitch accentplacement in lexical items in American English. Journal of Phonetics 22, 357-388.

    Trager, G.L. & H.L. Smith (1951): An outline of English structure. Norman, Oklahoma: Bat-tenburg Press. (neu bearbeitete Auflage 1957, Washington, American Council of LearnedSocieties).

    Truckenbrodt, H. (erscheint): Upstep and Register Levels. Phonology.

    Uhmann, S. (1991): Fokusphonologie. Eine Analyse deutscher Intonationskonturen im Rah-men der nicht-linearen Phonologie. Tbingen: Niemeyer.

    Wunderlich, D. (1988): Der Ton macht die Melodie - Zur Phonologie der Intonation desDeutschen. In: H. Altmann, Hrsg. (1988): Intonationsforschungen.Tbingen: Niemeyer.1-40.

    Danksagung

    Ralf Benzmller war mageblich an der Entwicklung der Ideen, die diesemAufsatz zugrunde liegen, beteiligt. Ihm gilt unser besonderer Dank. Auerdemmchten wir Bistra Andreeva, Bill Barry, Caroline Fry, Jrg Peters, JrgenTrouvain, Hubert Truckenbrodt sowie zwei anonymen Gutachtern fr hilfreicheKommentare herzlich danken.