Dialectometric Analysis of Hungarian Dialects

Help

Back »

Details of project

Identifier

108442

Type

Principal investigator

Vargha, Fruzsina Sára

Title in Hungarian

Magyar nyelvjárások dialektometriai elemzése

Title in English

Dialectometric Analysis of Hungarian Dialects

Keywords in Hungarian

dialektológia, dialektometria, magyar nyelvjárások

Keywords in English

dialectology, dialectometry, Hungarian dialects

Discipline

Linguistics (Council of Humanities and Social Sciences)	100 %
Ortelius classification: Dialectology

Panel

Linguistics

Department or equivalent

Institute of Hungarian Language and Finno-Ugrian Studies (Eötvös Loránd University)

Starting date

2013-09-01

Closing date

2016-08-31

Funding (in million HUF)

17.983

FTE (full time equivalent)

3.00

state

closed project

Summary in Hungarian

A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.
A jelen kutatás alapja többrétű. 1. Abból a (főleg Salzburgban és Groningenben végzett) dialektometriai kutatásból nyeri az ihletet, amely az utóbbi években a dialektológia egyik központi témájává vált. 2. A korábbi számítógépes dialektológiai projektekben létrehozott magyar nyelvjárási adatbázisokat aknázza ki. 3. A főbb alkalmazandó technológiák fejlesztése már megtörtént, azok a projekt rendelkezésére állnak. 4. Nagy mennyiségű adaton végzett, ígéretes előzetes kutatási eredményekre támaszkodik.

A számítógépes dialektológia új lehetőségeket kínál a hang és a lejegyzés összekapcsolására, a magyar nyelvjárási adatok elemzésére és automatikus térképezésére, elősegíti a nyelvi jelenségek területiségének kvantitatív módszerekkel történő vizsgálatát. A nyelvjárások hasonlóságának és különbözőségének aggregált adatokon történő vizsgálata, a dialektometria célja, hogy a nyelvatlaszokat hatalmas empirikus adatbázisnak tekintve alapvető rendszerszerűségeket állapítson meg. Az utóbbi években a Levenshtein algoritmus használata (a karakterláncok közti távolság mérése) lehetővé tette a megfelelően digitalizált adatok (fonetikai szimbólumokból álló betűláncok) automatikus egybevetését.

A projekt közel egymillió informatizált magyar nyelvjárási adaton végzett, a hagyományos dialektológiaiaknál jóval megbízhatóbbnak és objektívebbnek tekintett kvantitatív elemzéssel hozzájárul a magyar nyelvjárásterületek elhatárolásához és a nyelv(járás)szigetek nyelvi kapcsolatrendszerének vizsgálatához. Az eredmények várhatóan alkalmasak lesznek a nyelvföldrajz korábbi eredményeinek, a magyar nyelvjárások osztályozásának alátámasztására, pontosítására, illetve újragondolására.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.
A jelen kutatás általános célja az informatizált magyar nyelvjárási atlaszok dialektometrikus elemzése, vagyis annak vizsgálata kvantitatív módszerekkel, hogy milyen mértékű és jellegű nyelvi hasonlóság mutatható ki a magyar nyelvterületen belül az egyes települések (kutatópontok) nyelvjárása között.

A következő kutatási kérdések fogalmazhatók meg:

1. Az automatikus string edit distance módszer hitelesíthető-e azonos korpuszon végzett kutatói klasszifikációra alapuló módszerrel?

2. Milyen kérdések megválaszolására alkalmasak a különböző pontosságú lejegyzések alapján létrehozott hasonlósági mátrixok? Melyek azok a nyelvi jelenségek, amelyek (térben és időben) állandóbbak, és ellenállóbbak a nyelvjárásközi és környezetnyelvi hatásokkal szemben?

3. Hogyan lehet a nem teljesen azonos lejegyzési pontossági szinttel létrehozott atlaszokat integrálni közös dialektometriai elemzéshez?

4. Hogyan befolyásolják a környezeti nyelvi hatások (jövevényszavak) a magyar nyelvjárások közötti hasonlóság mértékét?

5. Hogyan vizsgálható a dialektometria segítségével a nyelv(járás)szigetek kapcsolatrendszere, eredete?

6. Hogyan alkalmazható a dialektometria a magyar nyelvjárásterületek elhatárolásában?

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!
A projekt új kutatási módszert honosít meg Magyarországon, a technológiai alapú dialektometriát, amely az utóbbi időben mint a nyelvjárások osztályozásának megbízható és objektív módszere az érdeklődés középpontjába került a dialektológiában.

A jelen kutatás legfőbb eredménye a magyar nyelvjárások részletes dialektometriai elemzése lesz a fenti hat kérdés megválaszolásával. Néhány előzetes feltevés, különösen a dialektometria alkalmazhatóságának igazolása a nyelvjárások osztályozásában általános következtetésekhez vezethet a tudományterületen, ezáltal a várható kutatási eredmények kiindulási pontként szolgálhatnak a jövőbeni magyar dialektológiai kutatásokhoz.

Annak érdekében, hogy a magyar nyelvjárási adatok más kutatóhelyeken kifejlesztett dialektometriai módszerekkel is elemezhetővé váljanak, a projekt vállalja a magyar egyezményes lejegyzésű atlaszadatok konvertálását IPA szerinti átírásba. A konverziós eljárás kidolgozásával a projekt megteremti a jövőbeni nemzetközi együttműködés lehetőségét a dialektológia számos területén.

Az eredmények nem csak a dialektológiában lehetnek hasznosak, hanem bármely kutatás számára, amelyben szempont lehet a különböző területi nyelvváltozatok egymásra hatása, illetve a településtörténeti (beszélőközösségek közti) kapcsolatok feltárása.

A kutatási eredmények (az internetes ismeretterjesztő változatokon keresztül) felhasználhatók az oktatásban, társadalmi hatásként hozzájárulhatnak a nyelvi sokszínűség értékként való elfogadásához, s így közvetve a nemzeti azonosságtudat és kohézió erősítéséhez.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára.
A magyar nyelvjárási atlaszok nem csupán nyelvészeti adattárak, hanem kulturális örökségünk nyelvi értékeinek hordozói. Kialakításukhoz kutatónemzedékek évtizedeken át tartó munkájára volt szükség. Az utóbbi tizenöt évben közel egymillió nyelvjárási adat (A magyar nyelvjárások atlasza és számos regionális atlasz) megfelelő digitalizálását végeztük el összehangolt számítógépes dialektológiai projektekben. A jelen kutatás célja a magyar nyelvjárások közti nyelvi hasonlóság és különbözőség vizsgálata a digitalizált nyelvjárási adatok felhasználásával, újabb, technológiai alapú kvantitatív elemzési módszerekkel. Az aggregált adatok elemzése, a dialektometria, jóval objektívebb, mint a hagyományos elemzési módszerek. A kutatás eredményeképpen többek között olyan interaktív térképek jönnek létre, amelyen egy településre kattintva megtekinthető, milyen mértékben mutat nyelvi hasonlóságot az elemzésben szereplő más településekkel (az ismeretterjesztő térképek előzetes változatát a Petőfi Irodalmi Múzeum “Nyelvet öltünk!” című vándorkiállítása már be is mutatta: http://bihalbocs.hu/dialektologia_demo/rokonok.html). Az előzetes eredmények alapján a módszer alkalmas arra, hogy egymástól sok évszázada elszakadt beszélőközösségek közti kapcsolatokat is megmutasson (például a Mezőség és az északi csángók, illetve Székelyföld és a Dunántúl egyes részei között). Az eredmények várhatóan új megvilágításba helyezik a magyar dialektusok összevetésére irányuló eddigi kutatások megállapításait, és biztosabb ismeretekhez vezetnek.

Summary

Summary of the research and its aims for experts
Describe the major aims of the research for experts.
The present project has several foundations. 1. It is inspired by dialectometric research (carried out mainly in Salzburg and Groningen), which has in recent years become a central topic in dialectology. 2. It will exploit the available Hungarian dialect databases created in several former computational dialectology projects. 3. The main technologies that will be used in the analysis have been already developed and are available to the project. 4. Preliminary research has been carried out on a huge quantity of data with promising results.

Computational dialectology offers new possibilities in the time aligned transcription, analysis and automatic mapping of Hungarian dialect data, it favours quantitative methods and research on the spatial distribution of the investigated phenomena. The research of dialect similarities and dissimilarities based on the analysis of aggregate data, called dialectometry, aims to abstract a basic pattern from a linguistic atlas seen as a huge empirical database. Lately the application of the Levenshtein algorithm (a string edit distance measurement) made possible the automatic comparison of words (strings of phonetic symbols) stored in appropriately digitised data sets.

The project contributes to the demarcation of Hungarian dialect areas and to the research of dialect enclaves exploiting a corpus of approximately one million data items and using a method considered highly objective as compared to classical ones. The results are expected to corroborate, to refine or to modify findings of dialect geography and classification of the Hungarian dialects.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.
The general aim of the project is the dialectometric analysis of duly digitised Hungarian dialect atlases, thus the research of linguistic similarities and dissimilarities between Hungarian dialects with quantitative methods.

The following research questions can be formulated:

1. Could the automatic string edit distance analysis be validated by a manual classification of linguistic variables in the same corpus?

2. What kind of linguistic questions could be answered by the comparison of different similarity matrices generated from narrow and broader transcriptions? What kind of linguistic phenomena are more constant and more resistant (in time and space) to influences from the neighbouring dialects or languages?

3. How can linguistic atlases be integrated for dialectometric analysis when they are different in transcription narrowness?

4. How can loan-words borrowed from the surrounding language environment influence the outcome of the dialectometric analysis?

5. How can dialectometry be used for the investigation of the linguistic relations in the case of language or dialect enclaves?

6. How can dialectometric analysis be involved in the determination of dialect areas?

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.
The project will naturalise in Hungary the new, technologically based dialectometric approach that has recently moved into the center of attention in dialectology and is seen as a reliable and highly objective method in the field of dialect classification.

The main result of the present research will be a detailed dialectometric analysis of Hungarian dialects while answering the questions 1 to 6 mentioned above. The confirmation of some assumptions, especially the applicability of dialectometry in dialect classification might have general implications in the field and means that the expected findings might be a reference point for Hungarian dialect research in the future.

In order to make Hungarian data analysable with dialectometric techniques developed in other research laboratories too, a conversion method of Hungarian narrow transcriptions to IPA symbols will be elaborated. As a result, all entries of our databases will be converted to IPA symbols. This way the project creates a solid basis for future international cooperation in many fields of dialectology.

Findings can be useful not only for dialectologists, but for any researcher who is interested in the mutual influences of language varieties, or in the historical relationships between localities (local speech communities).

A simplified version of the interactive dialectometric maps will be published on the Internet for lay people and for educational purposes. The results can also favour a better acceptance of linguistic diversity within the same language, therefore they can indirectly contribute to the enhancement of national cohesion and self-confidence.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others.
Hungarian dialect atlases are not only research tools for linguists, they are also carriers of our linguistic cultural heritage. Generations of researchers contributed to the collection and publication of the data the present project will use. In the last fifteen years nearly one million data items from The Atlas of Hungarian Dialects and several regional Hungarian linguistic atlases have been appropriately digitised in a series of interrelated computational dialectology projects. The aim of the present project is the research of linguistic similarities and dissimilarities between Hungarian dialects with new, technologically based quantitative methods on digitised Hungarian dialect databases. The analysis of aggregate data, called dialectometry, makes dialect classification more objective as compared to traditional approaches. Expected results include interactive maps created to visualise linguistic similarities for every investigation point (locality) of the main Hungarian dialect atlases. (For a simplified version of such a map see http://www.bihalbocs.hu/dialektometria_demo.html, presented at the "Nyelvet öltünk!" exhibition organised by the Petőfi Literary Museum.) According to preliminary results this method is appropriate to reveal distant relationships (in space and time) between linguistic communities (for example between Hungarian dialects of Moldavia and the Transylvanian Mezőség, or between certain areas of Székelyland and Transdanubia (the western part of Hungary). The expected results can shade a new light on the findings of previous Hungarian comparative dialectology researche and lead to a more accurate knowledge of relations between Hungarian dialects.

Final report

Results in Hungarian

A kutatás legfőbb eredménye a magyar nyelvjárások részletes dialektometriai elemzése, vagyis annak meghatározása kvantitatív módszerekkel, hogy milyen mértékű és jellegű a nyelvi hasonlóság a magyar nyelvterületen belül az egyes települések (kutatópontok) nyelvjárása között. A projekt új kutatási módszert honosít meg Magyarországon, a számítógépes dialektológia eredményeire építő dialektometriát, amely az utóbbi időben mint a nyelvjárások osztályozásának megbízható és objektív módszere az érdeklődés középpontjába került a dialektológiában. A közel egymillió informatizált magyar nyelvjárási adaton végzett, a hagyományos dialektológiaiaknál jóval megbízhatóbbnak és objektívebbnek tekintett kvantitatív elemzés hozzájárul a magyar nyelvjárásterületek elhatárolásához és a nyelv(járás)szigetek nyelvi kapcsolatrendszerének vizsgálatához. Az eredmények egyészt alátámasztják a nyelvföldrajz korábbi eredményeit, a magyar nyelvjárások osztályozását, de alkalmasak annak pontosítására is. Ezáltal a kutatási eredmények kiindulási pontként szolgálhatnak a jövőbeni magyar dialektológiai kutatásokhoz. Az eredményeket számos már megjelent vagy megjelenés előtt álló tanulmány adja közre, valamit elkészült a magyar nyelvjárások dialektometriai elemzésének monografikus feldolgozása is. Az előadások, publikációk, ismeretterjesztő internetes anyagok elérhetők a kutatás honlapján: http://frufru.web.elte.hu/dialektometria.html.

Results in English

The most important result of the project is the dialectometric analysis of computerized Hungarian dialect atlases, thus the determination of linguistic similarities and dissimilarities between Hungarian dialects with quantitative methods. The project naturalized in Hungary a new computational research method, dialectometry, that has recently moved into the center of attention in dialectology and is seen as a more reliable and highly objective method in the field of dialect classification. The project contributes to the demarcation of Hungarian dialect areas and to the research of dialect enclaves, exploiting a corpus of approximately one million data instances and using a method considered highly objective as compared to classical ones. The results corroborate, refine or modify previous findings of Hungarian dialect geography and classification of Hungarian dialects. Findings can be considered as a reference point for Hungarian dialect research in the future. The results have been (or will be) published in several scientific papers and the most important findings are presented in detail in a monograph that is to be published subsequently. Papers presented at scholarly meetings, published as journal articles or book chapters, as well as online educational materials, are available at the projects’s website: http://frufru.web.elte.hu/dialektometria.html.

Full text

https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=108442

Decision

Yes

List of publications

Vargha Fruzsina Sára: A romániai magyar nyelvjárások atlasza informatizált térképlapjainak kvantitatív nyelvföldrajzi vizsgálata, Magyar Nyelv 112., 2016

Vargha Fruzsina Sára: Nyelvatlaszok a szekrényben, In: Benő Attila, Fazakas Emese, Kádár Edit (szerk.) „…hogy legyen a víznek lefolyása…”: Köszöntő kötet Szilágyi N. Sándor tiszteletére. Kolozsvár, Erdélyi Múzeum-Egyesüle, 2013

Vargha Fruzsina Sára: Mennyire hasonlítanak egymásra a magyar nyelvjárások? Pillangó, pillancs, lepe., Élet és tudomány, 69. évf. 11. sz., 2014

Vargha Fruzsina Sára: The impact of phonetic narrowness on the dialectometry of Hungarian., Methods in Dialectology XV, Groningen, 2014

Vargha Fruzsina Sára: Lexikai, fonológiai, fonetikai stabilitás (és relevancia) a magyar nyelvjárásokban, É. Kiss Katalin – Hegedűs Attila – Pintér Lilla (szerk.) Nyelvelmélet és dialektológai 3. PPKE BTK Elméleti Nyelvészeti Tanszék – Magyar Nyelvészeti Tanszék, Budapest–Pil, 2015

Vargha Fruzsina Sára: Atlaszintegrálás és kvantitatív adatelemzés, Bárth János – Bodó Csanád – Kocsis Zsuzsanna (szerk.) A nyelv dimenziói. Tanulmányok Juhász Dezső tiszteletére. ELTE BTK, Budapest. 242–249., 2015

Vargha Fruzsina Sára: Linguistic self-hatred and distance from standard Hungarian, Sociolinguistics Symposium 21, 2016

Back »