The study of spoken language in Budapest  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
60403
Type K
Principal investigator Kontra, Miklós
Title in Hungarian Budapesti beszélt nyelvi vizsgálatok
Title in English The study of spoken language in Budapest
Keywords in Hungarian beszélt nyelv, szociolingvisztika, budapesti beszéd, nyelvi változások
Keywords in English spoken language, sociolinguistics, Budapest speech, language change
Discipline
Linguistics (Council of Humanities and Social Sciences)100 %
Panel Linguistics
Department or equivalent HUN-REN Hungarian Research Centre for Linguistics
Participants Bartha, Csilla
Borbély, Anna
Hattyár, Helga
Váradi, Tamás
Starting date 2006-02-01
Closing date 2010-01-31
Funding (in million HUF) 17.767
FTE (full time equivalent) 8.05
state closed project
Summary in Hungarian
A Budapesti Szociolingvisztikai Interjú (BUSZI) (www.nytud.hu/buszi/bsi.htm) nagyszabású felmérés, amely megbízható adatokat szolgáltat a fővárosi beszélt nyelv változatairól és változásairól. A BUSZI 2. változata 50 (2-3 órás) interjút tartalmaz, ezek kódolása, lejegyzése és ellenőrzése nagyrészt elkészült, néhány CD már minden kutató számára hozzáférhető. Ahhoz, hogy a BUSZI-2 adatai ne csak hozzáférhetők, hanem könnyen kutathatók is legyenek, további feldolgozásra van szükség, vagyis ki kell alakítani azt a rendszert, amely lehetővé teszi a numerikusan kódolt adatoknak és az összefüggő beszédbeli adatoknak egy-egy szociolingvisztikai változó szerinti csoportosítását. Ehhez az adatbázisnak a mainál magasabb szervezettségére van szükség. Ezen általános cél mellett bizonyos utómunkálatokat is el kell végeznünk (a lejegyző és az ellenőr által eltérően kódolt adatok véglegesítése, adattisztasági ellenőrzések és korrekciók, melyeket a rohamos technikai fejlődés diktál: a kódolás XT számítógépekkel és DBase programmal kezdődött 1990 körül). Mindezen előmunkálatok után megkezdjük a BUSZI rendszeres tudományos elemzését s az eredményeket hazai és külföldi konferenciákon bemutatjuk. Elemzési terveink: A beszédstílusok kvalitatív és kvantitatív vizsgálata; Ingadozó toldalékolású szavak; Az e -- ö váltakozás; Az í, ú, ű variabilitása Budapesten (VARBRUL elemzéssel); Ami és amely: stílusváltás vagy nyelvi változás?; Hogyan született egy ismeretlen tárgy magyar neve?
Summary
The Budapest Sociolinguistic Interview (BSI, see www.nytud.hu/buszi/bsi.htm) project studies variation and change in the speech of residents of the Hungarian capital. Version 2 of BSI contains 50 tape recorded interviews (each is 2 to 3 hours in length). Transcription, coding and checking of the transcripts is near-complete and a few CDs containing the transcripts and matching audio recordings have been made available for researchers at large. However, in order to make the BSI data easily researchable, the database has to be improved such that the numerically coded test data and the data in the guided conversations are arranged around the individual sociolinguistic variables studied. The rapid technological changes which have occurred since the beginning of coding and transcription in the early 1990s necessitate further checking and correction of the data as well as resolving the remaining disagreements between transcriber and checker. After the creation of an easy-to-research database, project participants will carry out analyses such as the quantitative and qualitative study of contextual styles in Hungarian, variation in vowel harmony, the e – ö variation, the variability of í, ú and ű in Budapest (a VARBRUL study), ami and amely: styleshifting or linguistic change?, and an in statu nascendi study of the Hungarian equivalent of the English word 'staple remover'.

 

Final report

 
Results in Hungarian
A kutatás eredményeként létrehoztunk egy Magyarországon egyedülálló, számítógéppel is jól kutatható beszélt nyelvi korpuszt. (1) Létrehoztuk a Budapesti Szociolingvisztikai Interjú 2. változatának (BUSZI-2) végső, kutatható változatát, vagyis 50 BUSZI-2 interjú irányított beszélgetéseinek (268 000 szó) másodszor ellenőrzött változatát, és az interjúk tesztadatainak (33 850 item és 2720 szöveges rekord) másodszor ellenőrzött változatát. (2) Létrehoztuk a beszélgetések átiratainak gépi elemzésre alkalmas XML formátumú változatát, egy olyan beszélt nyelvi adatbázist, amely szótövesítést, egyértelműsített morfológiai elemzést is tartalmaz. A nyelvi elemzéseket felhasználói felület könnyíti meg, amely lehetővé teszi a jelenségek több szempontú menüvezérelt lekérdezését. A korpuszt kezelő rendszer válaszideje általában néhány másodperc: például az 5737 darab ’l’ kiesés teljes összesítő táblázatának elkészítése 20–30 másodpercet vesz igénybe. Elkészítettük a tesztadatok lekérdező felületét is. (3) A két adatbázist felhasználva számos elemzést készítettünk, melyeket hazai és külföldi konferenciákon mutattunk be. 2010. februárjáig hét tanulmányt publikáltunk s további négy tanulmányunkat közlésre elfogadták. A vállaltakon túl megkezdtük a korpusz bővítésére irányuló munkálatokat is: elkészítettük a BUSZI-3 és BUSZI-4 tesztadatainak rögzítésére s ellenőrzésére szolgáló rendszert, s elvégeztük 142 interjú tesztadatainak első kódolását.
Results in English
As a result of the grant, a unique machine-readable corpus of spoken Hungarian has been created. First, the double-checked version of the transcripts of the guided conversations of Version 2 of the Budapest Sociolinguistic Interview project (BSI-2) has been created (268,000 words in 50 interviews), followed by the creation of the double-checked version of the test data (minimal pairs, reading passages, etc) in the same 50 interviews. Second, a machine-readable XML database has been developed from the transcripts of the guided conversations, in which all forms are lemmatized and provided with disambiguated morphosyntactic annotation. The database is connected to a user interface, which enables easy formulation of complex menu driven queries. The response time of the system is only a few seconds even with large scale queries, for example, preparing a full statistics of the 5737 cases of l-deletion (e.g. volt ~ vót) in the corpus takes only 20 to 30 seconds. An easy-to-use user interface has also been developed for the test data (33,850 items, and 2720 text records). Thirdly, a number of analyses of spoken Hungarian have been presented at conferences in Hungary and abroad. As of February 2010 seven papers have been published and four are forthcoming. Finally, in addition to the grant proposal, we have begun to enlarge the corpus by coding the test data of 142 interviews recorded for BSI-3 and BSI-4.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=60403
Decision
Yes

 

List of publications

 
Borbély A.; Bartha C.: Sociolinguistic and stylistic variation of the verbal suffix -nék and its stigmatized variant -nák in the Budapest Sociolinguistic Interview (BSI) corpus, P. 395. In: Sociolinguistics Symposium 16, University of Limerick, 6-8 July 2006, Abstracts., 2006
Borbély A.: Bevezetés "A nyelvek és nyelvváltozatok: összehasonlító adatok a kétnyelvű magyarországi kisebbségi közösségek nyelvi attitűdjeiről" című kutatáshoz., Pp. 57--60. In: Zelliger E., szerk, Nyelv, területiség, társadalom. A 14. Élőnyelvi Konferencia (Bük, 2006. október 9--11.) előadásai. Budapest, Magyar Nyelvtudományi T., 2007
Borbély A.; Bartha C.: Language Attitudes in Majority and Minority Groups: Research Based on the Survey of Spoken Hungarian and on the Survey of Six Minority Communities in Hungary, Pp. 359--360. In: The 6th International Symposium on Bilingualism, May 30 - June 2, 2007, University of Hamburg, Abstracts. http://www.isb6.org/static/abstracts.pdf, 2007
Borbély A.: Társadalmi variabilitás és/vagy stílus-variabilitás: a (nVk)2 nyelvi változó a Budapesti Szociolingvisztikai Interjú 2. változatában, Pp. 53--58. In: Guttmann M.; Molnár Z., szerk, V. Dialektológiai Szimpózium, Szombathely, 2007. Szombathely, Berzsenyi Dániel Főiskola, 2007
Bartha C.: Language shift in Romani-speaking communities in Hungary -- Combining macro and micro interpretations, Pp. 31--32. In: 17 Sociolinguistics Symposium, Micro and macro connections, 3-5 April 2008. Amsterdam. Abstracts. http://www.meertens.knaw.nl/ss17/ss17abstracts.pdf, 2008
Borbély A.: Morfológiai változók a standard nyelvi ideológia örvényében: Elemzések a Budapesti Szociolingvisztikai Interjú beszélt nyelvi korpuszban., Pp. 63--74. In: Borbély, A.; Vančoné Kremmer I.; Hattyár H., szerk., Nyelvideológiák, attitűdök és sztereotípiák. MTA Nyelvtudományi Intézet stb., Budapest stb., 2009
Kontra M.: Mivel korrelálnak a nyelvi előítéletek Budapesten?, Pp. 37--52. In: Borbély, A.; Vančoné Kremmer I.; Hattyár H., szerk., Nyelvideológiák, attitűdök és sztereotípiák. MTA Nyelvtudományi Intézet stb., Budapest stb., 2009
Hattyár H.; Kontra M.; Vargha FS: Van-e Budapesten zárt ë?, Magyar Nyelv 105: 453--468., 2009
Borbély A.; Bartha C.: Possibilities for studying the socio-stylistic variation of the sound l in the Budapest Sociolinguistic Interview (BSI) corpus, Pp. 12--13. In: ICLaVE #5, Book of Abstracts, University of Copenhagen, June 25-27, 2009, 2009
Mátyus K.: Az inessivusi (bVn) nyelvtani szerepei, Pp. 69--85. In: Váradi T. szerk., III. Alkalmazott Nyelvészeti Doktorandusz Konferencia. ISBN 978 963 9074 50 7. http://www.nytud.hu/alknyelvdok09/proceedings.pdf, 2009
Kontra M.: Szócsinálás: A motiváció szerepe egy ismeretlen tárgy megnevezésében, Közlésre elfogadva 2010. január 19-én, a Magyar Terminológia c. lektorált folyóiratban, 2010
Váradi T.; Peredy M.; Oravecz Cs.: A Budapesti Szociolingvisztikai Interjú lexikai és szintaktikai jellemzői, Közlésre elfogadva 2010. január 19-én, Általános Nyelvészeti Tanulmányok (sorozatszerk.: Kenesei István), 2010
Hattyár H.: Az e - ö variánsokkal kapcsolatos kérdések a BUSZI-2-ben -- Szabad váltakozás vagy nyelvi változó?, Közlésre elfogadva 2009. december 18-án, az Anyanyelv-pedagógia c. lektorált folyóiratban, 2010
Bartha Cs.; Hámori Á.: A stílus szociolingvisztikai megközelítései és az anyanyelvi oktatás, Közlésre elfogadva 2009. december 18-án, az Anyanyelv-pedagógia c. lektorált folyóiratban, 2010
Borbély A.; Vančoné Kremmer I.; Hattyár H.: Bevezető a 15. Élőnyelvi Konferencia kötetéhez, Pp. 9--15. In: Borbély A.; Vančoné Kremmer I.; Hattyár H., szerk, Nyelvideológiák, attitűdök és sztereotípiák. MTA Nyelvtudományi Intézet stb., Budapest stb., 2009
Borbély A.; Vančoné Kremmer I.; Hattyár H. szerk.: Nyelvideológiák, attitűdök, sztereotípiák -- 15. Élőnyelvi Konferencia, Párkány (Szlovákia), 2008. szeptember 4--6., MTA Nyelvtudományi Intézet/Gramma Nyelvi Iroda/Konstantin Filozófus Egyetem Közép-európai Tanulmányok Kara/Tinta Könyvkiadó, Budapest/Dunaszerdahely/Nyitra, pp. 542, 2009
Back »