Annotation and development of BEA Hungarian spoken language database  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
108762
Type K
Principal investigator Gósy, Mária
Title in Hungarian A BEA beszélt nyelvi adatbázis annotálása és fejlesztése
Title in English Annotation and development of BEA Hungarian spoken language database
Keywords in Hungarian szegmentálás, átírás, új felvételek, fonetikai kutatások
Keywords in English segmentation, transcription, new recordings, phonetic research
Discipline
Linguistics (Council of Humanities and Social Sciences)100 %
Ortelius classification: Phonetics
Panel Linguistics
Department or equivalent HUN-REN Hungarian Research Centre for Linguistics
Participants Beke, András
Gráczi, Tekla Etelka
Gyarmathy, Dorottya
Neuberger, Tilda
Váradi, Tamás
Veresné Horváth, Viktória
Starting date 2013-10-01
Closing date 2018-09-30
Funding (in million HUF) 27.480
FTE (full time equivalent) 11.20
state closed project
Summary in Hungarian
A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.

A pályázat célja, hogy 120 magyar felnőtt beszélő (20 és 90 év közötti) beszédanyagát rögzítsük (a BEA adatbázis protokolljának megfelelően: különböző spontánbeszéd-típusokat, társalgást, felolvasást és mondatismétlést), valamint hogy a beszédanyagot több szinten szegmentáljuk és annotáljuk (beszédhangok, szavak, frázisok, beszélőváltások). Az annotálásokat a nemzetközileg elfogadott Praat programban a leiratok kettős ellenőrzésével, illetve statisztikai kontrolljával tervezzük. A tervezett adatbázis lehetőséget nyújt arra, hogy a hangfájlok és az annotálások egyidejű elemzésével kutassuk a felnőtt beszélők artikulációs gesztusainak akusztikai-fonetikai következményeit. Olyan kutatások végzésére is alkalmas, amelyekhez nagy mennyiségű adat szükséges, és azok automatikusan lekérdezhetők. Tervezünk továbbá a BEA adatbázishoz egy nyílt hozzáférésű (open access), ingyenes rendszert a kutatók számára, amely interneten keresztül érhető el. A célnak megfelelően a BEA adatbázis 120 új beszélővel (évente harminccal) bővül a pályázat tartama alatt. Az annotálásokkal párhuzamosan különböző fonetikai kutatásokat tervezünk, amelyek a Praatban lejegyzett beszédanyagon alapulnak (a beszédhangok finomelemzése, hangváltozatok, szavak, szövegek, beszélőspecifikus jegyek, megakadásjelenségek stb.). A fonetikai kutatások eredményeként a spontán magyar beszéd számos tulajdonságának, a finom fonetikai részleteknek a megismerése és leírása történik meg.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.

A beszédhangok, hangkapcsolatok képzésének, a megakadásjelenségek sajátos paramétereinek, a beszélőn belüli és a beszélők közötti jellemzőknek (stb.) az akusztikai-fonetikai következményei nagy, strukturált, szegmentális szinten annotált és lekérdezhető adatbázison tanulmányozhatók jól. A jelen pályázatban egy ilyen adatbázist tervezünk létrehozni. A megfelelően tervezett, annotált és lekérdezhető adatbázisok használata időigényes munkáktól kíméli meg a kutatót (adatközlők felkutatása, a felvételek rögzítésének előkészítése, annotálás). Egyetlen percnyi spontán beszéd szegmentális szintű annotálása ugyanis mintegy 2 órát vesz igénybe. Hipotéziseink a következők: (i) az annotált és lekérdezhető beszédadatbázis segíteni fogja a szakemberek munkáját az akusztika, a fonetika, a nyelvészet, a digitális jelfeldolgozás és a beszédtechnológia különböző területein, illetve (ii) a spontán beszéd finomelemzése ezen adatbázis felhasználásával új kutatási irányokat jelöl ki a fonetikában, és válaszokat adhat olyan problémákra, amelyeket korábban nem lehetett tanulmányozni (pl. szegmentumhatárok kijelölése, ritkán előforduló fonémarealizációk, a koartikulációs folyamatok finom fonetikai részletei).

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!

Nagyméretű, strukturált és lekérdezhető beszédadatbázis annotálása és fejlesztése alapvető fontosságú nyelvészeti, fonetikai alapkutatásokhoz, beszédtechnológiai alkalmazásokhoz. Az ilyen adatbázison végzett kutatások új ismereteket nyújtanak a spontán beszéd sajátosságairól, és alapot adnak további nyelvészeti vizsgálatokhoz. Az adatbázis használatával idő takarítható meg, amely mérésekre és elemzésre fordítható. A fejlesztendő adatbázis – protokolljának, felvételi körülményeinek, az annotálásnak és mennyiségi jellemzőinek következtében (sok beszélő, beszélőnként relatíve nagy mennyiségű beszédanyag, különböző beszédtípusok) – jól használható nyelvek összehasonlításában, a beszédszintézis kutatásában, az adatbányászatban, a bűnügyi beszélőazonosításban, illetve klinikai diagnosztikai eljárásokban. Az annotált adatbázis nagy jelentőségű a beszédszintézisben és az automatikus beszédfelismerő rendszerekben, amelyek hozzájárulnak a hallássérült, siket és vak emberek kommunikációjának megsegítéséhez. A fonetikai kutatások a valós nyelvhasználatot írják le, új megközelítések válnak lehetővé, és újabb kérdések fogalmazhatók meg a szélesebb nyelvészeti kutatásokban is (pl. a spontán beszéd grammatikája, nyelvtipológia, univerzálék). Eddig 126 tanulmány jelent meg, amelyek vizsgálatai a BEA adatbázison alapultak, továbbá az adatbázis hanganyagát kutatás-fejlesztési projektben (Monspeech) is felhasználták. A tervezett adatbázis nemzetközi tudományos értéke mellett, jelentős nemzeti értéket képvisel azzal, hogy bemutatja és megőrzi a 21. század eleji magyar beszélők beszédét, beszédstratégiáit és beszédviselkedését.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára.

A jelen pályázat célja 120 beszélő beszédanyagának rögzítése ugyanazon felvételi körülmények között, és ugyanennyi beszédfelvétel leírása úgy, hogy a szakemberek a hanganyagot és a leírásokat összehangoltan tudják használni kutatásaikban (beszédhangok, akusztikai hullámformák, illetve a nekik megfelelő betűk és szavak). A létrehozott anyag a BEA adatbázis kiegészítéseként különböző típusú spontán beszédet, társalgást, mondatismétlést és felolvasást és azok hangzáshű leírását tartalmazza Budapesten élő magyar felnőttektől (20 és 90 év közötti nőktől és férfiaktól). A pályázatban a tervezett adatbázishoz egy nyílt hozzáférésű, ingyenes rendszert fejlesztenek ki a kutatók számára, ezzel kiváló lehetőséget teremtve a különféle beszédelemzésekre. A fonetikai kutatások, amelyek a beszélők jellemzőivel, a beszédhangok, szavak, szövegek, társalgások, megakadásjelenségek (pl. nyelvbotlások, szóismétlések, hezitálások) sajátosságaival foglalkoznak, új adatokat eredményeznek a spontán beszéd megismerésében, továbbá segítenek azoknak a nyelvi változásoknak a felismerésében, amelyeket korábban nem lehetett megfelelően elemezni nagyméretű, strukturált és lejegyzett beszédadatbázis nélkül. A tervezett adatbázisnak nagy a jelentősége mind tudományosan, mind kulturálisan és társadalmi szempontból is (bővíti a spontán beszéddel kapcsolatos ismereteket, lehetőséget nyújt különféle nyelvi jelenségek elemzésére, és alapot ad a gyakorlati alkalmazások fejlesztésére, mint például az automatikus beszédfelismerő rendszerek, amelyek hozzájárulnak a hallássérült és vak emberek kommunikációjának megsegítéséhez). Az adatbázis kulturálisan, a magyar nemzeti örökség szempontjából is nagy értékű.
Summary
Summary of the research and its aims for experts
Describe the major aims of the research for experts.

The purpose of the proposed project is to annotate (by speech sounds, words, phrases, turn-takings) and expand an existing Hungarian spoken language database, the BEszélt nyelvi Adatbázis (BEA) and to conduct phonetic analyses using the expanded and annotated BEA. We will expand the database by increasing the number of speakers by 120 new speakers (aged between 20 and 90) following the protocol of the database (various types of spontaneous narratives, conversations, reading aloud and sentence repetitions) and annotate 120 speakers’ recordings. The annotations will be made using the internationally accepted and acknowledged Praat program with double-checking and statistically controlling the labeled speech samples. The project provides an opportunity to trace the diverse acoustic-phonetic consequences of articulation gestures of Hungarian-speaking adults using both audio files and annotations. This planned database is suitable for research that needs statistically relevant quantity of data for automatic queries. We plan to construct an open access system that provides an opportunity to use the database for various investigations by means of on-line query of the data (in Hungarian and English). In addition, in parallel with annotations, various phonetic investigations are planned that will be based on the annotated recorded speech material (refined analysis of speech sounds, sound variation, words, texts, speakers’ characteristic patterns, disfluency phenomena, etc.). The results would highlight specific properties and fine phonetic details of spontaneous Hungarian speech.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.

The study of acoustic-phonetic consequences of the various factors involved in the production of speech sounds, such as coarticulation, specific parameters of disfluency phenomena, intra- and inter-speaker characteristics (etc.) requires a large, well-constructed and queriable speech database containing segment-level annotation. This project is intended to provide such a database for Hungarian. Speech databases that are carefully designed and implemented and are annotated, queriable, relieve the researcher from the time consuming work of searching for speakers, preparing sound recordings and carrying out the annotation procedure (where one minute of segmental level annotation of spontaneous speech requires about 2 hours of work). Our hypotheses are that (i) an appropriate, annotated and queried speech database would help the work of experts of speech acoustics, phonetics, linguistics, digital signal processing, and various fields of speech technology and (ii) refined analysis of spontaneous speech using such a database would result in new aspects of fields of phonetics and new answers to questions that were impossible to study earlier (like segment boundary detection, rarely occurring phoneme realizations, fine phonetic details of co-articulation, etc.).

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.

The annotation and development of a large, well-constructed speech database that is queriable is extremely important for basic linguistic, phonetic and speech technology research. Results of phonetic research based on the database provide (i) new knowledge about the nature of spontaneous speech and (ii) basis for further linguistic investigations. Using the database, a lot of time is spared for analysis and measurements. Due to its protocol, recording conditions, annotations, and quantitative properties (many speakers, relatively large samples per speaker, various types of speech), BEA is ideal for use in comparisons across diverse languages, further research in speech synthesis, data-mining, forensic applications like speaker identification, clinical diagnostic procedures and social usage. An annotated large database is of crucial importance for speech synthesis and automatic speech recognition systems in order to aid hearing-impaired, deaf and blind people to communicate. Phonetic research contributes to the description of relevant language use, to form new aspects and new questions of phonetic and of broader linguistic investigations (e.g. grammar of spontaneous speech, language typology, universals). There are already about 126 scientific papers based on the BEA database on the one hand, and its sound material has been used in a research-development project (Monspeech), on the other hand. Beside the international scientific value of our planned database it has also a great national value as it demonstrates and preserves speech, speaking strategies and speaking behaviors of Hungarian-speaking people of the 21st century.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others.

The aim of this project is to record 120 new speakers’ speech material (various types of spontaneous narratives, conversation, recall, sentence repetition and reading) under the same conditions and to write down the recorded speech material so that researchers could use both the audio files and the written versions of the speech material appropriately (sounds, acoustic waveforms, and corresponding letters and words). The speakers are from Budapest (aged between 20 and 90). This development is an entirely new, large part of the BEA speech database. The project will develop an open access system (free of charge) to the database for researchers, providing excellent opportunities for various kinds of speech analysis. Phonetic research concerning the characteristics of speakers and speech sounds, words, texts, dialogues, disfluency phenomena (like slips of the tongue, repetition of words or hesitations) will yield new data about spontaneous speech and will help in the identification of language changes that could not be analyzed properly without a large, well-constructed and annotated database. This planned database is of great importance both scientifically (enhancing our basic knowledge of structure of spontaneous speech samples, and making possible the analysis of various linguistic phenomena and the development of practical applications, such as automatic speech recognition systems to help hearing-impaired and blind people to communicate), and it has a great value culturally from the point of view of national heritage.





 

Final report

 
Results in Hungarian
A projekt időtartama alatt 120 beszélő felvételeit rögzítettük (különféle spontán beszédanyagok, narratívák, társalgások, mondatismétlések, felolvasások) ugyanazon körülmények között. A felvételek teljes időtartama mintegy 87 óra. A felvételekhez tartozó információs táblázat tartalmazza a beszélők adatait (pl. életkorát, termetét, dohányzási szokásait), valamint a narratívák és a társalgások témaköreit. 120 beszédfelvételt annotáltunk a Praat programban. Az adatbázis lekérdezhető és ingyenesen hozzáférhető a kutatók számára a megfelelő feltételek teljesítésével (open access). A kutatásaink során foglalkoztunk a beszéd különféle morfémáinak fonetikai mintázatával, elemeztük a spontán közlések időzítési jellemzőit és a megakadásjelenségeket. A pályázat időtartama alatt 35 magyar és 33 külföldi szakmai eseményen tartottunk előadást, és megrendeztük a tervezett nemzetközi workshopot. Összesen 51 tanulmányt, közülük 23-at angol nyelven és 4 könyvet publikáltunk.
Results in English
During the project a specific speech database was developed by recording of various types of spontaneous narratives, conversations, sentence repetition and reading aloud of 120 Hungarian-speaking adults under the same conditions (the total duration of this database is about 87 hours). An information table of the recordings contains the data of the speakers (e.g., age, height, smoking habits) and the topics of the narratives and conversations. We annotated 120 speakers’ recordings using the internationally accepted Praat program. The database is accessible (as an open access system) for researchers, providing excellent opportunities for their speech analysis. Investigations concerned the phonetic patterns of various morphemes of speech, analysis of temporal characteristics and disfluency phenomena of spontaneous speech samples. Our research results were presented at 35 national and 33 international professional events including our international workshop. In sum, 51 papers (23 in English) and 4 books were published.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=108762
Decision
Yes





 

List of publications

 
Gósy Mária, Krepsz Valéria: Morfémák időzítési mintázatai a beszédben, MTA Nyelvtudományi Intézet, Budapest., 2017
Gósy, Mária, Krepsz, Valéria: Phrase-final Lengthening of Phonemically Short and Long Vowels in Hungarian Spontaneous Speech across Ages, M. Gósy, T. Gráczi (szerk.): Challenges in analysis and processing of spontaneous speech . RIL of HAS, Budapest, 99–126., 2018
Gyarmathy Dorottya: Megakadásjelenségek a magyar spontán beszédben, MTA Nyelvtudományi Intézet. Budapest., 2017
Gráczi, Tekla Etelka, Markó, Alexandra: Word-initial Glottal Marking in Hungarian as a Function of Articulation Rate and Word Class., M. Gósy, T. Gráczi (szerk.): Challenges in analysis and processing of spontaneous speech. Budapest: RIL of HAS 75-98., 2018
Gyarmathy, Dorottya: The functions of silent pauses in spontaneous Hungarian speech., The Phonetician 115, 49-65., 2018
Gósy, Mária, Gráczi, Tekla Etelka (eds.): Challenges in analysis and processing of spontaneous speech., Research Instituute for Linguistics, HAS, Budapest, 2018
Gyarmathy Dorottya, Neuberger Tilda, Gráczi Tekla Etelka: Lejegyzési útmutató a BEA Spontánbeszéd-adatbázis háromszintű annotálásához, Alkalmazott Nyelvtudomány XIV. évf. 1-2. szám. 35–44., 2014
Beke, András, Gósy, Mária, Horváth, Viktória: Boundary markers in spontaneous Hungarian speech, In Z. Vetulani et al. (eds.): Human Language Technology. Challenges for Computer Science and Linguistics. Springer International Publishing Switzerland, 1–13., 2016
Krepsz Valéria, Gósy Mária: Megszakítás és javítás a szón belül, In Navracsics Judit – Bátyi Szilvia (szerk.): Első és második nyelv: interdiszciplináris megközelítések. Tinta Könyvkiadó, Budapest 252–264., 2015
Gósy Mária: Az életkor hatása a feldolgozási és a tervezési folyamatokra mondatismétléskor, Beszédkutatás 2016, 21–42., 2016
Gósy Mária: Beszédtervezési diszharmónia és a kitöltött szünetek összefüggései, Magyar Nyelvőr 139/4, 436–449., 2015
Gosztolya Gábor, Beke András, Neuberger Tilda: Nevetések automatikus felismerése mély neurális hálók használatával, In Tanács Attila, Varga Viktor, Vincze Veronika (szerk.): XII. Magyar Számítógépes Nyelvészeti Konferencia. Szeged. 122-133., 2016
Beke, András, Szaszák, György: Automatic summarization of highly spontaneous speech, In Ronzhin, A., Potapova, R., Németh, G. (eds.): Speech and Computer. Springer International Publishing. Vol. 9811, pp. 140-147., 2016
Beke András - Szaszák György: Automatic summarization of highly spontaneous speech, Lecture Notes in Computer Science 9811, 140–147, 2016
Gosztolya, Gábor - Beke, András - Neuberger, Tilda - Tóth, László: Laughter classification using deep rectifier neural networks with a minimal feature subset, Archives of Acoustics 41(4), 669-682., 2016
Gósy Mária: Szóvégi mássalhangzók törlődése a spontán beszédben, In: Nyomárkay István – Papp Andrea (szerk.): Világkép és etimológia. Írások Nyomárkay István 80 születésnapjára. Magyar Filológiai Társaság, Budapest, 159–166., 2017
Gósy, Mária – Vogel, Irene – Váradi, Viola: Temporal patterns of error repairs and approrpiateness repairs in Hungarian, The Phonetician 113, 61–78., 2016
Gósy, Mária – Eklund, Robert: Segment Prolongation in Hungarian, DisfProc. of the 8th Workshop on Disfluency in Spontaneous Speech. Eds.: Eklund, Robert - Rose, Ralph. Stockholm, TMH-QPSR, 29-32., 2017
Gyarmathy Dorottya: Izé ‘stuff’: a corpus-based study on a curious hungarian filler, The Phonetician 113. 82–101., 2016
Gyarmathy Dorottya: A néma szünetek funkciói a spontán beszédben, Beszédkutatás 20, 67–93., 2017
Krepsz Valéria: Morfémák időzítési mintázatai tizenévesek és felnőtt beszélők megnyilatkozásaiban, Beszédkutatás 20, 37-53., 2017
Gráczi Tekla Etelka - Markó Alexandra - Takáts Karolina: Az irreguláris zönge megjelenése mondatfelolvasásban: tizenéves és felnőtt beszélők adatainak összehasonlítása, Alkalmazott Nyelvtudomány XVII. 1-15, 2017
Neuberger Tilda - Beke András: A zárfelpattanás spektrális jegyei a hosszúsági oppozíció függvényében, Beszédkutatás 20, 7-24., 2017
Auszmann Anita: Megakadásjelenségek 40 évvel ezelőtti és mai beszélők spontán beszédében, Beszédkutatás 20, 135-150., 2017
Gósy, Mária – Eklund, Robert: Language-specific patterns of segment prolongation in Hungarian, The Phonetician 115, 33-48., 2018
Szaszák György, Tündik Máté Ákos, Beke András: Summarization of spontaneous speech using automatic speech recognition and a speech prosody based tokenizer, A. Fred, et al. (eds.): Proc. of 8th Int. Joint Conf. on Knowledge Discovery... Setúbal: SciTePress, 221-7., 2016
Horváth Viktória: Szóidőtartamok gyermekek és felnőttek spontán narratíváiban, Beszédkutatás 2014, 87-97., 2014
Krepsz Valéria, Gósy Mária: Temporal interactions of stems, suffixes, and the number of syllables of the words in Hungarian spontaneous speech, Proceedings of the 18th International Congress of Phonetic Sciences (ICPhS) 2015. Glasgow, 2015
Beke András, Horváth Viktória: Kisiskolások alaphangmagasságának variabilitása, Beszédkutatás 2015, 133–147., 2015
Beke András, Gósy Mária, Horváth Viktória, Gyarmathy Dorottya, Neuberger Tilda, Auszmann Anita: Megakadások a beszédstílus függvényében: spontán narratívákban és spontán társalgásokban, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest. 85–100., 2015
Gyarmathy Dorottya: Az úgyhogy funkcióbővülése a spontán beszédben, Beszédkutatás 2015. 92–106., 2015
Gyarmathy Dorottya: Diszharmóniás jelenségek, megakadások a beszédben, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 9–47., 2015
Gyarmathy Dorottya, Neuberger Tilda, Auszmann Anita: Ismétlések és az újraindítások temporális mintázatai, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 131–147., 2015
Gyarmathy Dorottya, Gósy Mária, Horváth Viktória, Neuberger Tilda, Beke András: A szerkesztési szakaszok sajátosságai újraindításkor és téves kezdéskor spontán beszédben, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 171–192., 2015
Neuberger Tilda, Gyarmathy Dorottya: A megakadásjelenségek gyűjtésének és lejegyzésének módszerei, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 249–261., 2015
Neuberger Tilda: Zöngétlen zárhangok időszerkezete a fonológiai hosszúság függvényében, Beszédkutatás 2015, 5–20., 2015
Neuberger Tilda: Durational correlates of singleton-geminate contrast in Hungarian voiceless stops, In: Proceedings of the 18th International Congress of Phonetic Sciences (ICPhS). Glasgow, 2015
Krepsz Valéria: Megakadásjelenségek előfordulása a beszédtempó függvényében, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 193–218., 2015
Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben, MTA Nyelvtudományi Intézet, Budapest, 2015
Auszmann Anita: A spontán beszéd időviszonyai 40 évvel ezelőtti és mai beszélőknél, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 219–234., 2015
Auszmann Anita, Gyarmathy Dorottya: Megakadásjelenségek siket és ép hallású beszélők szövegfelolvasásában, In: Gósy Mária (szerk.): Diszharmóniás jelenségek a beszédben. MTA Nyelvtudományi Intézet, Budapest, 235–248., 2015
Beke, András, Horváth, Viktória: Hidden Markov model-based approach for nasalized vowels recognition in spontaneous speech, In: Proceedings of the 18th International Congress of Phonetic Sciences (ICPhS). Glasgow, 2015
Markó Alexandra, Gósy Mária: A megszólalás stratégiái társalgásban, In: Bárdosi Vilmos (szerk.) (szerk.) A nyelvi pragmatika kérdései szinkrón és diakrón megközelítésben. Budapest: Tinta Könyvkiadó, 2015. pp. 159-168. (Segédkönyvek a nyelvészet tanulmányozásához)
169., 2015
Gósy Mária: A beszédtervezés tükröződése a spontán beszédben, In: Laczkó Krisztina, Tátrai Szilárd (szerk.) (szerk.) Elmélet és módszer: Nyelvészeti tanulmányok. Budapest: ELTE Eötvös József Collegium, 2014. pp. 67-86., 2014
Neuberger Tilda, Gyarmathy Dorottya, Gráczi Tekla Etelka, Horváth Viktória, Gósy Mária, Beke András: Development of a large spontaneous speech database of agglutinative Hungarian language, In: Petr Sojka, Aleš Horák, Ivan Kopeček, Karel Pala (szerk.) (szerk.) Text, Speech, and Dialogue: 17th International Conference, TSD 2014, Brno, Czech Republic, September 8-12, 2014. Proceedings. Berlin; Heidelberg; New York: Springer, 2014. pp. 424-431. (Lecture Notes in Computer Science; 8655.), 2014
Dorottya Gyarmathy, Mária Gósy: The characteristics of sublexical errors in spontaneous speech, In: Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 166-169., 2014
Gósy Mária, Gyarmathy Dorottya: Szublexikális nyelvbotlások jellemzői a spontán beszédben, Magyar Nyelvőr 138/3, 296–307., 2014
Mária Gósy, Judit Bóna, András Beke, Viktória Horváth: Phonetic characteristics of filled pauses: the effects of speakers’ age, Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 150–153., 2014
Neuberger Tilda, Beke András, Gósy Mária: Acoustic analysis and automatic detection of laughter in Hungarian spontaneous speech, Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 285–287., 2014
Beke András, Gósy Mária, Horváth Viktória, Gyarmathy Dorottya, Neuberger Tilda: Disfluencies in spontaneous narratives and conversations in Hungarian, Proceedings of the 10th International Seminar on Speech Production (ISSP). Cologne, 29–32., 2014
Markó Alexandra, Gósy Mária, Neuberger Tilda: Prosody patterns of feedback expressions in Hungarian spontaneous speech, In: Social and Linguistic Speech Prosody: Proceedings of the 7th International Conference on Speech Prosody. Dublin, 482–486., 2014
Neuberger T., Gyarmathy D., Gráczi T. E., Horváth V., Gósy M., Beke A.: Development of a large spontaneous speech database of agglutinative Hungarian language, TSD 2014, Proceedings. Berlin, Heidelberg, New York: Springer, 424–431., 2014
Neuberger Tilda: Zöngétlen explozívák időviszonyai a beszédtípus és az egyéni sajátosságok tükrében, Beszédkutatás 2014, 56–68., 2014
Beke András: Egyszerrebeszélések detektálása a beszélődetektálás javításához, Beszédkutatás 2014, 172-193., 2014
Beke András, Gósy Mária: Phonetic analysis and automatic prediction of vowel duration in Hungarian spontaneous speech, Intelligent Decision Technologies 8, 301–314., 2014




Back »