A BEA beszélt nyelvi adatbázis annotálása és fejlesztése  részletek

súgó  nyomtatás 
vissza »

 

Projekt adatai

 
azonosító
108762
típus K
Vezető kutató Gósy Mária
magyar cím A BEA beszélt nyelvi adatbázis annotálása és fejlesztése
Angol cím Annotation and development of BEA Hungarian spoken language database
magyar kulcsszavak szegmentálás, átírás, új felvételek, fonetikai kutatások
angol kulcsszavak segmentation, transcription, new recordings, phonetic research
megadott besorolás
Nyelvtudomány (Bölcsészet- és Társadalomtudományok)100 %
Ortelius tudományág: Fonetika
zsűri Nyelvészet
Kutatóhely MTA Nyelvtudományi Intézet
résztvevők Beke András
Gráczi Tekla Etelka
Gyarmathy Dorottya
Neuberger Tilda
Váradi Tamás
Veresné Horváth Viktória
projekt kezdete 2013-10-01
projekt vége 2018-09-30
aktuális összeg (MFt) 27.480
FTE (kutatóév egyenérték) 11.20
állapot aktív projekt

 

Zárójelentés

 
kutatási eredmények (magyarul)
A projekt időtartama alatt 120 beszélő felvételeit rögzítettük (különféle spontán beszédanyagok, narratívák, társalgások, mondatismétlések, felolvasások) ugyanazon körülmények között. A felvételek teljes időtartama mintegy 87 óra. A felvételekhez tartozó információs táblázat tartalmazza a beszélők adatait (pl. életkorát, termetét, dohányzási szokásait), valamint a narratívák és a társalgások témaköreit. 120 beszédfelvételt annotáltunk a Praat programban. Az adatbázis lekérdezhető és ingyenesen hozzáférhető a kutatók számára a megfelelő feltételek teljesítésével (open access). A kutatásaink során foglalkoztunk a beszéd különféle morfémáinak fonetikai mintázatával, elemeztük a spontán közlések időzítési jellemzőit és a megakadásjelenségeket. A pályázat időtartama alatt 35 magyar és 33 külföldi szakmai eseményen tartottunk előadást, és megrendeztük a tervezett nemzetközi workshopot. Összesen 51 tanulmányt, közülük 23-at angol nyelven és 4 könyvet publikáltunk.
kutatási eredmények (angolul)
During the project a specific speech database was developed by recording of various types of spontaneous narratives, conversations, sentence repetition and reading aloud of 120 Hungarian-speaking adults under the same conditions (the total duration of this database is about 87 hours). An information table of the recordings contains the data of the speakers (e.g., age, height, smoking habits) and the topics of the narratives and conversations. We annotated 120 speakers’ recordings using the internationally accepted Praat program. The database is accessible (as an open access system) for researchers, providing excellent opportunities for their speech analysis. Investigations concerned the phonetic patterns of various morphemes of speech, analysis of temporal characteristics and disfluency phenomena of spontaneous speech samples. Our research results were presented at 35 national and 33 international professional events including our international workshop. In sum, 51 papers (23 in English) and 4 books were published.
a zárójelentés teljes szövege https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=108762
döntés eredménye
igen

 

Közleményjegyzék

 
Gósy Mária, Krepsz Valéria: Morfémák időzítési mintázatai a beszédben, MTA Nyelvtudományi Intézet, Budapest., 2017
Gósy, Mária, Krepsz, Valéria: Phrase-final Lengthening of Phonemically Short and Long Vowels in Hungarian Spontaneous Speech across Ages, M. Gósy, T. Gráczi (szerk.): Challenges in analysis and processing of spontaneous speech . RIL of HAS, Budapest, 99–126., 2018
Gyarmathy Dorottya: Megakadásjelenségek a magyar spontán beszédben, MTA Nyelvtudományi Intézet. Budapest., 2017
Gráczi, Tekla Etelka, Markó, Alexandra: Word-initial Glottal Marking in Hungarian as a Function of Articulation Rate and Word Class., M. Gósy, T. Gráczi (szerk.): Challenges in analysis and processing of spontaneous speech. Budapest: RIL of HAS 75-98., 2018
Gyarmathy, Dorottya: The functions of silent pauses in spontaneous Hungarian speech., The Phonetician 115, 49-65., 2018
Gósy, Mária, Gráczi, Tekla Etelka (eds.): Challenges in analysis and processing of spontaneous speech., Research Instituute for Linguistics, HAS, Budapest, 2018
Gyarmathy Dorottya, Neuberger Tilda, Gráczi Tekla Etelka: Lejegyzési útmutató a BEA Spontánbeszéd-adatbázis háromszintű annotálásához, Alkalmazott Nyelvtudomány XIV. évf. 1-2. szám. 35–44., 2014
Beke, András, Gósy, Mária, Horváth, Viktória: Boundary markers in spontaneous Hungarian speech, In Z. Vetulani et al. (eds.): Human Language Technology. Challenges for Computer Science and Linguistics. Springer International Publishing Switzerland, 1–13., 2016
Krepsz Valéria, Gósy Mária: Megszakítás és javítás a szón belül, In Navracsics Judit – Bátyi Szilvia (szerk.): Első és második nyelv: interdiszciplináris megközelítések. Tinta Könyvkiadó, Budapest 252–264., 2015
Gósy Mária: Az életkor hatása a feldolgozási és a tervezési folyamatokra mondatismétléskor, Beszédkutatás 2016, 21–42., 2016
Gósy Mária: Beszédtervezési diszharmónia és a kitöltött szünetek összefüggései, Magyar Nyelvőr 139/4, 436–449., 2015
Gosztolya Gábor, Beke András, Neuberger Tilda: Nevetések automatikus felismerése mély neurális hálók használatával, In Tanács Attila, Varga Viktor, Vincze Veronika (szerk.): XII. Magyar Számítógépes Nyelvészeti Konferencia. Szeged. 122-133., 2016
Beke, András, Szaszák, György: Automatic summarization of highly spontaneous speech, In Ronzhin, A., Potapova, R., Németh, G. (eds.): Speech and Computer. Springer International Publishing. Vol. 9811, pp. 140-147., 2016
Beke András - Szaszák György: Automatic summarization of highly spontaneous speech, Lecture Notes in Computer Science 9811, 140–147, 2016
Gosztolya, Gábor - Beke, András - Neuberger, Tilda - Tóth, László: Laughter classification using deep rectifier neural networks with a minimal feature subset, Archives of Acoustics 41(4), 669-682., 2016
Gósy Mária: Szóvégi mássalhangzók törlődése a spontán beszédben, In: Nyomárkay István – Papp Andrea (szerk.): Világkép és etimológia. Írások Nyomárkay István 80 születésnapjára. Magyar Filológiai Társaság, Budapest, 159–166., 2017
Gósy, Mária – Vogel, Irene – Váradi, Viola: Temporal patterns of error repairs and approrpiateness repairs in Hungarian, The Phonetician 113, 61–78., 2016
Gósy, Mária – Eklund, Robert: Segment Prolongation in Hungarian, DisfProc. of the 8th Workshop on Disfluency in Spontaneous Speech. Eds.: Eklund, Robert - Rose, Ralph. Stockholm, TMH-QPSR, 29-32., 2017
Gyarmathy Dorottya: Izé ‘stuff’: a corpus-based study on a curious hungarian filler, The Phonetician 113. 82–101., 2016
Gyarmathy Dorottya: A néma szünetek funkciói a spontán beszédben, Beszédkutatás 20, 67–93., 2017
Krepsz Valéria: Morfémák időzítési mintázatai tizenévesek és felnőtt beszélők megnyilatkozásaiban, Beszédkutatás 20, 37-53., 2017
Gráczi Tekla Etelka - Markó Alexandra - Takáts Karolina: Az irreguláris zönge megjelenése mondatfelolvasásban: tizenéves és felnőtt beszélők adatainak összehasonlítása, Alkalmazott Nyelvtudomány XVII. 1-15, 2017
Neuberger Tilda - Beke András: A zárfelpattanás spektrális jegyei a hosszúsági oppozíció függvényében, Beszédkutatás 20, 7-24., 2017
Auszmann Anita: Megakadásjelenségek 40 évvel ezelőtti és mai beszélők spontán beszédében, Beszédkutatás 20, 135-150., 2017
Gósy, Mária – Eklund, Robert: Language-specific patterns of segment prolongation in Hungarian, The Phonetician 115, 33-48., 2018
Szaszák György, Tündik Máté Ákos, Beke András: Summarization of spontaneous speech using automatic speech recognition and a speech prosody based tokenizer, A. Fred, et al. (eds.): Proc. of 8th Int. Joint Conf. on Knowledge Discovery... Setúbal: SciTePress, 221-7., 2016
Horváth Viktória: Szóidőtartamok gyermekek és felnőttek spontán narratíváiban, Beszédkutatás 2014, 87-97., 2014
Krepsz Valéria, Gósy Mária: Temporal interactions of stems, suffixes, and the number of syllables of the words in Hungarian spontaneous speech, Proceedings of the 18th International Congress of Phonetic Sciences (ICPhS) 2015. Glasgow, 2015
Beke András, Horváth Viktória: Kisiskolások alaphangmagasságának variabilitása, Beszédkutatás 2015, 133–147., 2015
Beke András, Gósy Mária, Horváth Viktória, Gyarmathy Dorottya, Neuberger Tilda, Auszmann Anita: Megakadások a beszédstílus függvényében: spontán narratívákban és spontán társalgásokban, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest. 85–100., 2015
Gyarmathy Dorottya: Az úgyhogy funkcióbővülése a spontán beszédben, Beszédkutatás 2015. 92–106., 2015
Gyarmathy Dorottya: Diszharmóniás jelenségek, megakadások a beszédben, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 9–47., 2015
Gyarmathy Dorottya, Neuberger Tilda, Auszmann Anita: Ismétlések és az újraindítások temporális mintázatai, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 131–147., 2015
Gyarmathy Dorottya, Gósy Mária, Horváth Viktória, Neuberger Tilda, Beke András: A szerkesztési szakaszok sajátosságai újraindításkor és téves kezdéskor spontán beszédben, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 171–192., 2015
Neuberger Tilda, Gyarmathy Dorottya: A megakadásjelenségek gyűjtésének és lejegyzésének módszerei, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 249–261., 2015
Neuberger Tilda: Zöngétlen zárhangok időszerkezete a fonológiai hosszúság függvényében, Beszédkutatás 2015, 5–20., 2015
Neuberger Tilda: Durational correlates of singleton-geminate contrast in Hungarian voiceless stops, In: Proceedings of the 18th International Congress of Phonetic Sciences (ICPhS). Glasgow, 2015
Krepsz Valéria: Megakadásjelenségek előfordulása a beszédtempó függvényében, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 193–218., 2015
Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben, MTA Nyelvtudományi Intézet, Budapest, 2015
Auszmann Anita: A spontán beszéd időviszonyai 40 évvel ezelőtti és mai beszélőknél, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 219–234., 2015
Auszmann Anita, Gyarmathy Dorottya: Megakadásjelenségek siket és ép hallású beszélők szövegfelolvasásában, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 235–248., 2015
Beke, András, Horváth, Viktória: Hidden Markov model-based approach for nasalized vowels recognition in spontaneous speech, In: Proceedings of the 18th International Congress of Phonetic Sciences (ICPhS). Glasgow, 2015
Markó Alexandra, Gósy Mária: A megszólalás stratégiái társalgásban, In: Bárdosi Vilmos (szerk.) (szerk.) A nyelvi pragmatika kérdései szinkrón és diakrón megközelítésben. Budapest: Tinta Könyvkiadó, 2015. pp. 159-168. (Segédkönyvek a nyelvészet tanulmányozásához)
169., 2015
Gósy Mária: A beszédtervezés tükröződése a spontán beszédben, In: Laczkó Krisztina, Tátrai Szilárd (szerk.) (szerk.) Elmélet és módszer: Nyelvészeti tanulmányok. Budapest: ELTE Eötvös József Collegium, 2014. pp. 67-86., 2014
Neuberger Tilda, Gyarmathy Dorottya, Gráczi Tekla Etelka, Horváth Viktória, Gósy Mária, Beke András: Development of a large spontaneous speech database of agglutinative Hungarian language, In: Petr Sojka, Aleš Horák, Ivan Kopeček, Karel Pala (szerk.) (szerk.) Text, Speech, and Dialogue: 17th International Conference, TSD 2014, Brno, Czech Republic, September 8-12, 2014. Proceedings. Berlin; Heidelberg; New York: Springer, 2014. pp. 424-431. (Lecture Notes in Computer Science; 8655.), 2014
Dorottya Gyarmathy, Mária Gósy: The characteristics of sublexical errors in spontaneous speech, In: Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 166-169., 2014
Gósy Mária, Gyarmathy Dorottya: Szublexikális nyelvbotlások jellemzői a spontán beszédben, Magyar Nyelvőr 138/3, 296–307., 2014
Mária Gósy, Judit Bóna, András Beke, Viktória Horváth: Phonetic characteristics of filled pauses: the effects of speakers’ age, Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 150–153., 2014
Neuberger Tilda, Beke András, Gósy Mária: Acoustic analysis and automatic detection of laughter in Hungarian spontaneous speech, Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 285–287., 2014
Beke András, Gósy Mária, Horváth Viktória, Gyarmathy Dorottya, Neuberger Tilda: Disfluencies in spontaneous narratives and conversations in Hungarian, Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 29–32., 2014
Markó Alexandra, Gósy Mária, Neuberger Tilda: Prosody patterns of feedback expressions in Hungarian spontaneous speech, In: Social and Linguistic Speech Prosody: Proceedings of the 7th International Conference on Speech Prosody. Dublin, 482–486., 2014
Neuberger T., Gyarmathy D., Gráczi T. E., Horváth V., Gósy M., Beke A.: Development of a large spontaneous speech database of agglutinative Hungarian language, TSD 2014, Proceedings. Berlin, Heidelberg, New York: Springer, 424–431., 2014
Neuberger Tilda: Zöngétlen explozívák időviszonyai a beszédtípus és az egyéni sajátosságok tükrében, Beszédkutatás 2014, 56–68., 2014
Beke András: Egyszerrebeszélések detektálása a beszélődetektálás javításához, Beszédkutatás 2014, 172-193., 2014
Beke András, Gósy Mária: Phonetic analysis and automatic prediction of vowel duration in Hungarian spontaneous speech, Intelligent Decision Technologies 8, 301–314., 2014
vissza »