Variation in Romani morphology (with special regard to the varieties spoken in Hungary)  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
111961
Type K
Principal investigator Kálmán, László
Title in Hungarian Variáció a romani morfológiában (különös tekintettel a Magyarországon beszélt változatokra)
Title in English Variation in Romani morphology (with special regard to the varieties spoken in Hungary)
Keywords in Hungarian romani, variáció, morfológia, analógia, használatalapú modellek
Keywords in English Romani, variation, morphology, analogy, usage-based models
Discipline
Linguistics (Council of Humanities and Social Sciences)100 %
Ortelius classification: Grammar
Panel Linguistics
Department or equivalent HUN-REN Hungarian Research Centre for Linguistics
Participants Baló, András Márton
Starting date 2014-09-01
Closing date 2017-08-31
Funding (in million HUF) 14.306
FTE (full time equivalent) 3.60
state closed project
Summary in Hungarian
A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.

A kutatás célja empirikus adatok vizsgálata révén elméleti magyarázattal szolgálni a romani inflexiós morfológiában fellelhető variációra és arra, vajon miért látszik elmosódni a romanit a világ nyelvei között egyedivé tevő jegye, valamint megmutatni, hogy ezek a jelenségek legjobban analógiás hatások és morfológiai konstrukciók feltételezésével modellálhatók.

A romani nyelvészetben „tematikusságnak” nevezett, egyedülálló jegy a lexikon öröklött és kölcsönzött részei között fennálló merev kettősség. Az öröklött (főként az európai időszak előtti) szavak ind morfológiai („tematikus”) minták szerint ragozódnak, míg a kölcsönzött szavak (az európai rész) a görögből kölcsönzött („atematikus”) minták szerint. Magyarország azon kevés helyek egyike, ahol e szigorú kettősség felbomlását a legjobban lehet vizsgálni, ugyanis éppen az itt beszélt centrális és oláh cigány dialektuscsoportokban figyelhető ez meg a legjobban.

A jelenség tüneteként morfológiai variáció jelentkezik, ami azt jelenti, hogy egy nyelvi egységhez egynél több megvalósulás tartozik; ezek a megvalósulások versengő minták formájában, beszélőn belüli vagy beszélők közötti variációként jelennek meg, szociolingvisztikai és stiláris tényezőktől függetlenül. A variációt analógiás megközelítésből, a konstrukciós morfológiába ágyazva szándékozunk vizsgálni, memória alapú tanulási modellek segítségével, ugyanis ez tűnik a legmegfelelőbbnek a nyelvi viselkedés megjóslására.

A vizsgálandó, fő kutatási témák:

1. a szabályosság és a defektivitás fokozatos volta a romani főnév- és igeragozásban;
2. a tematikus és atematikus rész közötti interakció mértéke;
3. a szószint alatti morfémákra bontás szükségessége.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.

Alapfeltevésünk az, hogy a különböző morfológiai minták gyakorisága meghatározó szerepet játszik az egyazon nyelvi egységhez tartozó, alternatív alakok megjelenésében. Érdeklődésünk tárgya a nyelven belüli variáció, amely földrajzi, társadalmi és stiláris tényezőktől független. Amikor variáció jelentkezik, az kettő vagy több analógiás forrás versengésének eredménye. Ez szemmel látható a romani ige- és főnévragozásban, ahol a jelenséget még érdekesebbé teszi, hogy a lexikon öröklött (“tematikus”) és kölcsönzött (“atematikus”) részei között fennálló, szigorú morfológiai kettősség megbomlani látszik.

Elméleti célkitűzésünk a nyelvi viselkedés megjóslásával formalizálni, milyen befolyással van ez a kettősség a variációra és a defektivitásra, és elkészíteni az elmosódásban közrejátszó analógiás hatások kvantitatív elemzését.

Kutatásunk fő területei:

1. az igerendszer, a tematikus igeragozás és a kölcsönige-beillesztés közti kölcsönhatás, valamint az eredetileg kölcsönigék beillesztésére szolgáló toldalék kiesésével megjelenő új, derivációs igeosztályok;
2. a látszólag bonyolult és túlburjánzó főnévragozás, valamint a függő tőre vonatkozó, ellentmondásos információk és a hímnemű főnévragozáson belüli, fokozatosan jelentkező elkülönülés.

A kutatásban az alábbi kérdésekre keressük a választ:

1. Hogyan adhatunk számot bizonyos romani igék és főnevek különböző alakjairól morfológiai konstrukciók segítségével?
2. Milyen szerepet játszik az analógia és a gyakoriság ezen konstrukciók megválasztásában?
3. Mi befolyásolja a különböző paradigmák használatát, és van-e paradigmán belüli variáció?
4. Hogyan adhatunk számot a fokozatosan defektív paradigmákról?

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!

Projektünk számos tekintetben innovatív. Az egyik újdonság az elméleti megközelítés beemelése a romani nyelvészetbe, amit hosszú ideig elhanyagoltak, és a gondolatra mindössze egy-két évtizede kezdtek felfigyelni. Újszerű, analógia alapú nézőpontból fogjuk vizsgálni a bőséges variációt, az állandóan tapintható nyelvi változást, valamint azt, hogy megbomlani látszik a lexikon öröklött és kölcsönzött részeinek morfológiája közti, egyedi és szigorú határ.

Újdonságnak számít az is, hogy egy használat alapú elméleti keretet tervezünk tanulmányozni és alkalmazni. Úgy tűnik, hogy a szociolingvisztikai és dialektális tényezők mellett variáció létezhet egy nyelvváltozaton belül is, és ezért a korábban feltételezettnél több figyelmet kíván. Az analógiás megközelítés előnye, hogy magyarázattal tud szolgálni a nyelvhasználatban fellépő variációra, illetve alternációra és meg tudja mutatni azok szisztematikus voltát. Ezeket a hagyományos generatív megközelítések a performancia tartományába sorolják és nem foglalkoznak velük részletesen. A nyelvészeten belül ez a terület és ez az irány csak a közelmúltban kezdett az érdeklődés homlokterébe kerülni. A romaniban tapasztalható analógiás jelenségeket élőnyelvi korpuszok és újonnan gyűjtött adatok kiterjedt tanulmányozása révén szándékozunk vizsgálni és formális elemzést készíteni a különböző minták gyakorisága alapján, amely tanulási algoritmusokból álló számítógépes modellek segítségével elemezhető. A kutatás tisztán elméleti jelentősége mellett a romani morfológiának egy a tudomány jelenlegi állásával összhangban levő leírása is megszületik.

Az elméleti újszerűség mellett a kutatásnak gyakorlati és társadalmi haszna is van. A hazánkban és hazánkon kívül már létező romani nyelvű anyag vizsgálatán túl további élőnyelvi adatok gyűjtését tervezzük Magyarországon különféle dialektusokból, amely újabb, megbízható romani nyelvi adatforrást biztosítana. Mind az adatbázis, mind a morfológiai leírás alapul szolgálhat a romani dialektusokkal foglalkozó vagy új, romani nyelvű tananyagot készítő tudósoknak és diákoknak. A javasolt kutatásunkra alapozó további kutatások pedig hozzájárulhatnak a roma közösségek jobb megértéséhez szociolingvisztikai és szociálantropológiai tekintetben.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára.

Két célkitűzésünk van. Az egyik a romani nyelv tanulmányozása elméleti nyelvészeti szempontból, különös tekintettel az öröklött és kölcsönzött szavak közti éles határra, amely a világ nyelvei között egyedi jelenségnek számít. A romani ind eredetű nyelv, amelyet Európa-szerte használnak, és négy fő dialektuscsoportja közül kettőt beszélnek Magyarországon is. Ezek az oláh cigány dialektusok, ahova többek között a lovári is tartozik, és a centrális dialektusok, például a kárpáti vagy romungró. A romani anyanyelvi beszélők száma Magyarországon folyamatosan csökken, és az UNESCO a határozottan veszélyeztetett nyelvek közé sorolja, úgyhogy ezek talán az utolsó pillanatok, amikor tanulmányozhatjuk a nyelvet; ezért a projekt része lenne nagy mennyiségű, új, élő nyelvi adat felgyűjtése és archiválása. Kutatásunkból megszületik a romani morfológiának egy a tudomány jelenlegi állásával összhangban levő leírása. A másik célkitűzésünk tovább kutatni és bizonyítékkal szolgálni arra, milyen szerepet játszik az analógia és a minták gyakorisága a nyelvhasználatban. Ezt a romaniban tapasztalható variáción keresztül szeretnénk vizsgálni. Variációról akkor beszélünk, amikor egy nyelvi egység egynél több alakban jelentkezik. Érdeklődésünk középpontjában az egy nyelvváltozaton belüli variáció áll, ami független földrajzi, társadalmi és stiláris tényezőktől. Pusztán arról van szó, hogy ugyanaz a dolog különböző módokon valósul meg. Memória alapú tanulási modellek használatával szeretnénk számot adni a létezéséről, hogy milyen szerepet játszanak benne az analógiás hatások, és hogyan lehet a legkönnyebben és legjobban leírni és elemezni.
Summary
Summary of the research and its aims for experts
Describe the major aims of the research for experts.

The aim of the research is to provide an explanation for the the variation seen in the inflectional morphology of Romani and the apparent blurring of a cross-linguistically unique feature of Romani through the examination of empirical data and show that they can best be modelled by positing morphological constructions and analogical effects.

The unparalleled feature, called “thematicity” in Romani linguistics, refers to the rigid dichotomy between the inherited and borrowed parts of the lexicon. The inherited (mostly pre-European) words are inflected according to Indo-Aryan morphological patterns (“thematic”), whereas the borrowed words (the European component) are inflected according to patterns borrowed from Greek (“athematic”). Hungary is one of the few locations where its erosion can best be examined, as it is most conspicuous in the two Romani dialects spoken here: the Central and Vlax dialects.

The symptom of the phenomenon is morphological variation, that is, when one linguistic unit has got more than one realisation; these realisations appear either as intra- or inter-speaker variation, independently of sociolinguistic or stylistic factors and are represented by competing patterns. We aim to examine this variation from an analogical approach, using memory-based learning models and embedded in construction morphology, as this seems to be the most appropriate for predicting linguistic behaviour.

The main research topics to be examined are:

1. the gradient nature of regularity and defectiveness in Romani conjugation and declension;
2. the extent of interaction between the thematic and the athematic component;
3. the necessity of sub-word-level parsing.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.

Our basic hypothesis is that the frequency of different morphological patterns play a definitive role in the appearance of alternative forms for the same linguistic unit. We are interested in language-internal variation, which is independent of geographical, social or stylistic factors. When variation occurs, it is a result of the competition of two or more analogical sources. This is ostensible in Romani inflection, where the phenomenon is made even more interesting by the apparent erosion of the strict morphological dichotomy between the inherited (“thematic”) and borrowed (“athematic”) parts of the lexicon.

Our theoretical objective is, by predicting linguistic behaviour, to formalise how variation and defectiveness have been influenced by this dichotomy and to provide a quantitative analysis of analogical effects that might contribute to its blurring.

Our main areas of study are:

1. the verbal system, the interference between the thematic inflection and loan-verb adaptation, and the appearance of new, derivational verb classes with the elision of the original loan-verb adaptation marker;
2. the seemingly complicated and abundant declension and the contradictory information regarding the oblique stem, as well as the the gradient diversification within the masculine declension.

Our research questions are:

1. How can we account for the different forms of certain Romani verbs and nouns with morphological constructions?
2. What roles do analogy and frequency play in the choice of these constructions?
3. What influences the use of the different paradigms and is there intra-paradigmatic variation?
4. How can we account for gradient defective paradigms?

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.

Our research project is innovative from several aspects. One is the introduction of a theoretical approach to Romani linguistics, which was neglected for a long time, and the idea only began to gain attention one or two decades ago. We will look at the abundant variation, the constantly palpable language change and the apparent erosion of the unique and strict split between the morphology of the inherited and the borrowed parts of the lexicon from a new, analogy-based perspective.

The fact that we are planning to elaborate on a theoretical framework which is usage-based is novel, too. It seems that variation, apart from sociolinguistic and dialectal factors, can also be language-internal, and therefore needs more attention than previously deemed necessary. The advantage of an analogical approach is that it can provide explanation for and show the systematic nature of variation and alternation in language use, which traditional generative approaches treat as part of performance and do not deal with in detail. This is an area and a direction within linguistics which has only started to attract interest recently. We aim to examine the analogical phenomena in Romani through extensive studies of real-life corpora and newly collected data and carry out a formal analysis based on the frequency of different patterns, which can be analysed by using computational models consisting of learning algorithms. Besides the purely theoretical significance, this will also yield a state-of-the-art description of Romani morphology.

Apart from the theoretical novelties, there are also practical and social benefits to the research. In addition to the examination of Romani language material already existing both internationally and nationally, the collection of more real-life data in Hungary from various dialects would provide a new source of reliable Romani language data. Both the data and the morphological description can serve as a basis for academics and students dealing with the dialects of Romani or preparing new teaching material in Romani. Further research based on our proposed research can, in turn, contribute to a better understanding of the sociolinguistic and social anthropological aspects of Romani communities.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others.

We have got two objectives. One of them is to study the Romani language from a theoretical linguistic aspect, with special regard to the split between inherited and borrowed words, which is a unique feature among the languages of the world. Romani is an Indo-Aryan language spoken all over Europe, and two of its four main dialect branches are represented in Hungary as well. These are the Vlax dialects, where Lovari belongs among others, and the Central dialects, for example Romungro. The number of native speakers of Romani in Hungary is constantly diminishing, and it is considered a definitely endangered language by UNESCO, so it might happen that these are the last moments when we can study the language; therefore, the project would also involve the collection and archiving of a fair amount of new, real-life linguistic data. Our research would also yield a state-of-the-art description of Romani morphology. Our other objective is to investigate further and provide evidence for the roles analogy and the frequency of patterns play in language use. We would like to study this through the phenomenon of variation in Romani. Variation occurs when one linguistic unit is realised in more than one different form. We are interested in language-internal variation, which is independent of geographical, social or stylistic factors, it is purely the same thing expressed in different ways, or different outputs for the same input. Using memory-based learning models for testing, we would like to find out how we can account for its existence, what role analogical effects might play in it, and how it can best and easily be described and analysed.





 

Final report

 
Results in Hungarian
1. Korpusznyelvészeti eredmény, hogy megkezdtük a Magyarországon beszélt romani változatok feltérképezését, és lefektettük egy adatbázis alapjait. Beszélt nyelvi anyagot gyűjtöttünk vettünk fel és írtunk át a ma használatos romani összes létező változatából. Terepmunkánk alapján állíthatjuk, hogy a nyelvátadás határozottan visszaszorulóban van. Másfelől azt is megállapíthatjuk, hogy a történetileg Magyaroszág területén jelenlevő összes dialektus él még. 2. Az elméleti nyelvészeti eredmény az alaktani ingadozást, a konstrukciós morfológiát és az analógiát érinti, valamint kapcsolatukat a gyenge pontok fogalmával. Az ingadozásról sémák segítségével adhatunk számot, amelyeket úgy fejlesztettünk tovább, hogy körkörös ábrázolást javasoltunk, ahol minden egyes információ (hangtani, mondattani és szemantikai) két irányban kapcsolódik a másik két információhoz. A gyenge pont egy olyan séma, ahol legalább az egyik megfeleltetés nem kölcsönösen egyértelmű. 3. Megállapításaink kapcsolódnak a szigorú különbségtételre az öröklött és kölcsönzött szókincs között a romaniban, az alaktani paradigmákat illetően. Az -es-/-en- mintát eszerint az öröklött szókincsre alkalmazzák, míg az -os-/-on- mintát a kölcsönzött szavakra használják. Azt állapítottuk meg, hogy jelentős mértékű variáció van azoknál az elemeknél, amelyek nem tartoznak az indo-árja szókincshez, mind a lexikonban, mind egyes, konkrét elemek esetében, beleértve az újabb és a spontán kölcsönzéseket is.
Results in English
1. A corpus linguistic result is that we began the investigation of the Romani varieties spoken in Hungary and laid the foundations of an archive. We collected, recorded and transcribed up-to-date, spoken Romani language material in all the existing varieties. Based on our fieldwork, we can claim that the transmission of the language is definitely on the decrease. On the other hand, we can also say that all dialects that have been present historically in the territory of Hungary are still alive. 2. A theoretical linguistic result concerns morphological variation, construction morphology and analogy and their relationship to the notion of weak points. We can account for variation by way of schemata, improved by the addition of a circular representation, where every kind of information (phonological, syntactic and semantic) is connected bidirectionally to the other two through correspondences. A weak point is a schema where at least one of the correspondences is not mutually unambiguous. 3. Our findings are also related to the distinction between the inherited and borrowed vocabulary in Romani in terms of morphological paradigms. The -es-/-en- pattern has been said to apply to the inherited vocabulary, while the -os-/-on- pattern is used for borrowed words. We find that there is considerable variation regarding those items which do not belong to the Indo-Aryan vocabulary, both across the lexicon and in case of particular items, including recent and ad hoc borrowings.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=111961
Decision
Yes





 

List of publications

 
Baló András Márton: The nominal morphology of Lovari from an analogical perspective., Acta Linguistica Hungarica 62 (4), 395-414., 2015
Baló András Márton: The nominal morphology of Lovari from an analogical perspective., S. Augendre et al. (eds.) Proceedings of the Décembrettes 8th International Conference on Morphology., 2014
Baló András Márton: Analogy in Lovari Morphology, Budapest: Eötvös Loránd Tudományegyetem, 2016
Baló András Márton (Lakatos Péter közreműködésével): Morfológiai kölcsönzés és újrahasznosítás a romani nyelvben, Általános Nyelvészeti Tanulmányok, 28. Budapest: Akadémiai., 2016
Baló András Márton: Oláh cigány dialektusok Magyarországon, Cserti Csapó Tibor (szerk.) Romológia „akkor és most” VI. Pécs: PTE BTK NTI Romológia és Nevelésszociológia Tanszék, 2017
Baló András Márton: Variation in the nominal morphology of Northern Vlax Romani, közlésre elfogadva, 2017
Baló András Márton: Nominal oblique patterns in Romani, 7th Cambridge Conference on Language Endangerment, Cambridge, Anglia, 2017
Baló András Márton: The presence and role of the Romani language in the identity formation of young Roma, NAIRS Conference, Stockholm, Svédország, 2017
Baló András Márton: Variation in Lovari morphology, Prague Linguistics, Prága, Csehország, 2017
Baló András Márton: Vlax Romani tribes in Hungary – do they actually speak different dialects?, 12th International Conference on Romani Linguistics, Stockholm, Svédország, 2016
Baló András Márton: Recycled markers and competing constructions in Romani morphology, AnaMorphoSys, Lyon, Franciaország, 2016




Back »