Hungarian Spontaneous Speech Corpus  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
78315
Type K
Principal investigator Gósy, Mária
Title in Hungarian Magyar spontán beszéd adatbázis
Title in English Hungarian Spontaneous Speech Corpus
Keywords in Hungarian monológ, társalgás, korpusz, átírás
Keywords in English monologue, dialogue, corpus, transcription
Discipline
Linguistics (Council of Humanities and Social Sciences)100 %
Ortelius classification: Phonetics
Panel Linguistics
Department or equivalent HUN-REN Hungarian Research Centre for Linguistics
Participants Gráczi, Tekla Etelka
Gyarmathy, Dorottya
Váradi, Tamás
Veresné Horváth, Viktória
Starting date 2009-04-01
Closing date 2012-03-31
Funding (in million HUF) 5.648
FTE (full time equivalent) 3.31
state closed project
Summary in Hungarian
A spontánbeszéd-korpusz a beszélt nyelv nagy mennyiségű rögzített anyagát jelenti, amely meghatározott céllal és metodológiával készült és nélkülözhetetlen a spontán beszéd fonetikai és nyelvi elemzéséhez. A korszerű beszédkutatás igénye és új feladatai szükségessé tették egy a modern technológián alapuló, a minőségi hangrögzítés minden kritériumát teljesítő korpusz létrehozását. Magyar nyelven ilyen még nem létezik. A pályázat célja egy komplex, spontán beszédtípusokat, felolvasást és ismétlést tartalmazó, többfunkciós adatbázis létrehozása. A terv évente 30 beszélő (20 és 70 év közöttiek) felvétele; ez a pályázat időtartama alatt mintegy 90 órányi beszédanyag rögzítését, archiválását és leírását jelenti. A felvételi körülmények azonosak (ugyanazon csendesített helyiségben, azonos módszerrel történik); az elsődleges fonetikai átírás elősegíti a további kutatásokat. Az adatbázison fonetikai elemzések indítását tervezzük, amelyek alapján leírhatók a spontán közlések bizonyos hangzási jellemzői.
Summary
Recently, there is a growing consensus among phoneticians and linguists that spontaneous speech should bo one of the most important research targets in the coming decades. Studies should be based upon the analysis of reliable corpus. The present project is intended to build a speech corpus of spontaneous Hungarian on the one hand, and to start phonetic investigations using the corpus, on the other hand. The planned corpus contains monologues, repetitions and readings of 90 speakers (ages between 20 and 70) along with a broad transcription of the files. The corpus will consist of a speech material of about 90 hours. The recordings are planned to take place in the same sound-tight chamber using the same technical facilities in all cases. This corpus offers a unique opportunity for appropriate acoustic-phonetic analysis of spontaneous Hungarian.





 

Final report

 
Results in Hungarian
A kutatás során a terveknek megfelelően ugyanazon protokoll mentén rögzítették 90 adatközlő spontán beszédét, mondatismétléseit és felolvasásait, elvégezték a digitalizálást, az anonimizálást, a hanganyagok átírását, valamint az archiválást. A beszédanyag rögzítése állandó felvételi körülmények között történt, korszerű technikai háttér biztosításával. A beszélők közül 50 nő, 40 férfi, életkoruk 20 és 73 év közötti. A teljes beszédanyag időtartama 89 óra. Megvalósult a hanganyagok lekérdezhetősége a protokollegységek, illetve az adatközlők szerint. Számos, több szempontú fonetikai kutatást végeztek az adatbázis felhasználásával, összesen 31 tanulmányt publikáltak magyar és angol nyelven. A kutatott témák a beszéd szegmentális és szupraszegmentális szintjével, a spontán beszéd jellemzőivel, az olvasás és a spontán beszéd sajátosságaival, illetve a társalgás egyes fonetikai tényezőivel foglalkoztak. Az adatbázist a nyelvészet más területén kutatók számára is hozzáférhetővé tették. A kutatás eredményeként létrejött adatbázis nemzetközileg is és az ezredforduló magyar beszédének rögzítésével kulturálisan is maradandó értéket képvisel. Közvetlen tudományos jelentőségén túl számos gyakorlati alkalmazáshoz is felhasználható, és ez társadalmi tekintetben is növeli a jelentőségét.
Results in English
In accordance with the plans, project participants recorded spontaneous speech samples, sentence repetitions and text recitals from 90 subjects using identical recording protocols, and digitalised, anonymised, transcribed, and archived the whole material. Speech recording was carried out under uniform recording circumstances and in an up-do-date technological setting. The subjects included 50 women and 40 men; their ages ranged from 20 to 73 years. The total duration of the recorded material is 89 hours. The material can be searched/accessed both in terms of protocol units and in terms of subjects. Several multi-purpose phonetic investigations were carried out using the data base; as a result, a total of 31 papers have been published either in Hungarian or in English. The research topics involved both segmental and supra-segmental properties of speech, specific characteristics of spontaneous speech, peculiarities of reading aloud vs. spontaneous speech, as well as selected phonetic aspects of conversation. The data base has been made accessible for researchers working on other aspects of linguistic description, too. The data base represents a lasting value in the international scene and also in a cultural sense by recording the Hungarian speech of the turn of the millennium. Beyond its immediate scientific importance, it can be made use of in a number of practical applications, a fact that contributes to its general significance for the society at large.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=78315
Decision
Yes





 

List of publications

 
Markó Alexandra – Gráczi Tekla Etelka – Bóna Judit: Zöngésségi hasonulás a spontán beszédben és a felolvasásban (esettanulmányok), Beszédkutatás 5-27., 2009
Gráczi Tekla Etelka: Temporális jellemzők a beszédpartnerek ismeretségének függvényében, Beszédkutatás 121-133., 2009
Gósy Mária: Szóejtés és szóészlelés: változatosság és adaptálódás, Beszédkutatás 46-75., 2009
Gyarmathy Dorottya: A beszélő bizonytalanságának jelzései: ismétlések és újraindítások, Beszédkutatás 196-216., 2009
Csapó Tamás, Gráczi Tekla Etelka, Bárkányi Zsuzsanna, Beke András, Steven M. Lulich: Patterns of Hungarian vowel production and perception with regard to subglottal resonances., The Phonetician I-II., 7-28., 2009
Beke András – Gráczi Tekla Etelka: A magánhangzók semlegesedése a spontán beszédben., Nyelv, beszéd, írás. Pszicholingvisztikai tanulmányok I. Szerk. Navracsics Judit. Tinta Kiadó, Budapest, 57–64., 2010
Gósy Mária: Variability in the articulation and perception of a word., Acta Linguistica Hungarica 57/2-3, 239–267., 2010
Gósy Mária - Horváth Viktória: Changes in articulation accompanying functional changes in word usage., Journal of the International Phonetic Association 40/2, 135–161., 2010
Gósy Mária - Beke András: Magánhangzó-időtartamok a spontán beszédben., Magyar Nyelvőr 134/2, 140–165., 2010
Gráczi Tekla Etelka – Horváth Viktória: A magánhangzók realizációja spontán beszédben., Beszédkutatás 5–16., 2010
Gráczi Tekla Etelka - Bata Sarolta: The effect of familiarization on temporal aspects of turn-taking:A pilot study., Acta Linguistica Hungarica 57/2–3. 307–328., 2010
Gyarmathy Dorottya: Megakadásjelenségek: A beszélő és a hallgató stratégiái., Nyelv, beszéd, írás. Pszicholingvisztikai tanulmányok I. Szerk. Navracsics Judit. 74–82., 2010
Gyarmathy Dorottya: A spontán beszéd időzítési zavara: a perszeveráció., Beszédkutatás 139–159., 2010
Gráczi Tekla Etelka – Bata Sarolta: Megszólalási formák és funkciók az összeszokottság függvényében., Új módszerek az alkalmazott nyelvészeti kutatásban. Szerk. Gecső Tamás – Sárdi Csilla. Tinta Kiadó, Budapest, 28–32., 2010
Horváth Viktória: Filled pauses in Hungarian: their phonetic form and function., Acta Linguistica Hungarica 57/2-3, 288–306., 2010
Horváth Viktória – Gyarmathy Dorottya: A lónak is négy nyelve van, mégis megbotlik.” GPS nélkül a mentális lexikonban., Beszédkutatás 171–183., 2010
Markó Alexandra – Gráczi Tekla Etelka – Imre Angéla: A diskurzusjelölők használatának fejlődése: a hümmögés formai és funkcionális sajátosságai különböző életkorokban., Nyelv, beszéd, írás. Pszicholingvisztikai tanulmányok I. Szerk. Navracsics Judit. Tinta Kiadó, Budapest, 82–94., 2010
Markó Alexandra – Gráczi Tekla Etelka – Bóna Judit: The realization of voicing assimilation rules in Hungarian spontaneous and read speech: Case studies., Acta Linguistica Hungarica 57/2–3. 210–238., 2010
Beke András - Gyarmathy Dorottya: Zöngétlen résmássalhangzók akusztikai szerkezete., Beszédkutatás 57-76., 2010
Gráczi Tekla Etelka: Explozívák a zöngésségi oppozíció függvényében, V. Akkalmazott Nyelvészeti Doktoranduszkonferencia. Szerk. Váradi Tamás. MTA Nyelvtudományi Intézet, Budapest, 51-66., 2011
Gráczi Tekla Etelka: Intervokális explozívák a zöngésségi oppozíció függvényében, Beszédkutatás 40-60., 2011
Gyarmathy Dorottya, Neuberger Tilda: A BEA adatbázis alkalmazásfüggő lejegyzései, Beszédkutatás 109-121., 2011
Gósy Mária – Beke András – Horváth Viktória: Temporális variabilitás a spontán beszédben., Beszédkutatás 5–30., 2011
Gósy Mária: From stomatoscopy to BEA: the history of Hungarian experimental phonetics., Proc. of the 17th ICPhS. Eds.: W. Lee, E. Zee. City University of Hong Kong, Hong Kong, 2011
Gósy Mária, Gyarmathy Dorottya: A beszédtervezés atipikus kontrollja, Lexikai folyamatok egy- és kétnyelvű közegben. Pszicholingvisztikai tanulmányok II. Szerk.: Navracsics Judit, Legynel Zsolt. Tinta Kiadó, Budapest, 36-49., 2011
Gósy Mária: Beszédszövegek filológiai szempontból, Tegnapi filológiánk mai szemmel. Szerk. Bárdosi Vilmos. Tinta Kiadó, Budapest, 85-94., 2011
Gyarmathy Dorottya: Kétarcú újraindítás, Beszédtudmány. Szerk. Markó Alexandra, ELTE - MTA, 60-66., 2012
Beke András, Gósy Mária, Horváth Viktória: Gyakorisági vizsgálatok spontán beszédben, Beszédkutatás 260-277., 2012
Beke András, Gyarmathy Dorottya: Az ismétlések automatikus osztályozása spontán beszédben, Beszédkutatás 186-199., 2012
Gráczi Tekla Etelka: Obstruenskapcsolatok a spontán beszédben a zöngésségi oppozíció függvényében, Beszédkutatás 30-42., 2012
Gósy Mária: Sorozatmegakadások mintázata a spontán beszédben, Beszédkutatás 107-132., 2012





 

Events of the project

 
2010-09-28 14:14:41
Résztvevők változása




Back »