Typological Database of the Ugric Languages  Page description

Help  Print 
Back »

 

Details of project

 
Identifier
104249
Type K
Principal investigator Havas, Ferenc
Title in Hungarian Az ugor nyelvek tipológiai adatbázisa
Title in English Typological Database of the Ugric Languages
Keywords in Hungarian uráli nyelvek, ugor nyelvek, tipológia, adatbázis
Keywords in English Uralic languages, Ugric languages, typology, database
Discipline
Linguistics (Council of Humanities and Social Sciences)100 %
Ortelius classification: Comparative linguistics
Panel Linguistics
Department or equivalent Institute of Hungarian Language and Finno-Ugrian Studies (Eötvös Loránd University)
Participants Csepregi, Márta
Farkasné Gulyás, Nikolett
Starting date 2012-10-01
Closing date 2015-09-30
Funding (in million HUF) 17.922
FTE (full time equivalent) 5.05
state closed project
Summary in Hungarian
A kutatás összefoglalója, célkitűzései szakemberek számára
Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára.

Az ugor nyelvek tipológiai adatbázisának tervezete az általános nyelvtipológia és az uralisztika tematikus metszéspontjában lokalizálható alapkutatás. A létrehozandó adatbázis felhasználható lesz mind a finnugrisztika, mind a nyelvtipológia kutatói számára. Az ugor nyelvekről először nyújt teljes tipológiai jellemzést morfológiai–szintaktikai szinten, lehetővé teszi tipológiai jegyek összefüggésének feltárását és e nyelvek összehasonlító tipológiai vizsgálatát a világ nyelveinek körében. Az adatbázis paraméterkészlete és digitális informatikai rendszere minta és kiindulás lehet a jövőbeni hasonló projektumokhoz, végső soron az egész uráli nyelvcsalád tipológiai adatbázisának létrehozásához. A vizsgálandó nyelvek/dialektusok a magyar, a manysi (északi nyelvjárásának képviseletében) valamint a hanti egy keleti és egy nyugati (északi) nyelvjárása, a szurguti és a szinjai. A vizsgálandó nyelvi jelenségek a morfonológiától a szintaxisig terjednek. A tipológiai adatbázis egy online módon működő digitális rendszer, elvét tekintve egy virtuális táblázat, melyben a sorok a tipológiai paraméterek, az oszlopok pedig a feldolgozott dialektusok. Egy sor és egy oszlop metszéspontjában található cella egy konkrét paraméter értéke egy konkrét dialektusban, háttér-információkkal (a kutatás megállapításai az adott vonatkozásban, elemzett nyelvi példákkal). A kész adatbázis felhasználói működtetésének lényegét a táblázatban történő keresés lehetősége adja, amely egyidejűleg irányulhat egy vagy több dialektusra, paraméterre vagy paraméterértékre.

Mi a kutatás alapkérdése?
Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek.

1. Melyek a feldolgozott három uráli nyelv (négy nyelvjárás) tipológiailag értelmezett morfológiai és szintaktikai jellemzői, ennek alapján hogyan határozható meg e nyelvjárások pozíciója a világ nyelveinek tipológiailag értelmezett rendszerében általában, és közelebbről az ugor nyelvek között? 2. Hogyan dolgozható ki elméletileg, és szerkeszthető meg gyakorlatilag egy, a kutatók számára kezelhető, releváns összefüggéseket feltáró és a más nyelvekre vonatkozó, már létező digitális feldolgozásokkal kompatibilis tipológiai adatbázis (paraméterek, paraméterértékek, kombinatív összevetési mechanizmusok), mely egyrészt mintát és gyakorlati kiindulást jelenthet a további (végső soron az összes) uráli nyelv hasonló feldolgozása számára, másrészt revelatív és kezelhető bázist jelent a világ nyelveinek összevetésére irányuló nemzetközi nyelvtipológiai kutatás számára?

Mi a kutatás jelentősége?
Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának!

A nyelvtipológia mint a nyelvi diverzitás tanulmányozására irányuló összehasonlító nyelvészeti kutatás ma a nemzetközi nyelvészet egyik legdinamikusabban fejlődő kutatási iránya. Bár a nyelvészetben korábban főleg a genetikai nyelvészettől való függetlenségén volt a hangsúly, újabban specifikus jelentőségre tesz szert az ún. intragenetikus tipológia, mely a rokon nyelvek tipológiai jellemzésére, különbségeik feltárására irányul.
Az uralisztikában mind ez ideig a genetikai összehasonlítás volt túlsúlyban, az egyes uráli nyelvek tipológiai elemzésére, még inkább tipológiai jellegű összevetésére jóval kevesebb kutatás irányult. Ugyanakkor a nemzetközi tipológia gyakran az uráli nyelvek elégtelen ismeretében próbálta meghatározni e nyelvek tipológiai jellemzőit. Az uráli nyelvek uralisták általi rendszeres tipológiai leírása ezért ma a legidőszerűbb feladat e diszciplina számára, annál is inkább, mivel e nyelvek egy része (például a tervezett kutatásban is érintett manysi) ma már a veszélyeztetett nyelvek körébe tartozik.
A legfontosabb feladatnak az uráli nyelvek tipológiai adatbázisának létrehozását tekintjük, minthogy ez szolgáltatja minden további tipológiai egybevetés alapanyagát. A feladat volumene azonban azt teszi szükségessé, hogy a kutatás először is az uráli nyelvcsaládon belüli kisebb nyelvcsoportokkal kezdődjék. A jelen projektum az uráli nyelvcsalád finnugor ágának ugor alágára irányul: a vizsgálandó nyelvek/dialektusok a magyar, a manysi (északi nyelvjárásának képviseletében) valamint a hanti egy keleti és egy nyugati (északi) nyelvjárása, a szurguti és a szinjai.
A cél tehát az ugor nyelvek online tipológiai adatbázisának elkészítése. Az adatbázis felhasználható lesz mind a finnugrisztika, mind a nyelvtipológia kutatói számára. Az ugor nyelvekről először nyújt teljes tipológiai jellemzést morfológiai–szintaktikai szinten, lehetővé teszi tipológiai jegyek összefüggésének feltárását és e nyelvek összehasonlító tipológiai vizsgálatát a világ nyelveinek körében. Az adatbázis paraméterkészlete és digitális informatikai rendszere egyszersmind minta és kiindulás lehet a jövőbeni hasonló projektumokhoz, végső soron az egész uráli nyelvcsalád tipológiai adatbázisának létrehozásához.

A kutatás összefoglalója, célkitűzései laikusok számára
Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára.

Az emberi nyelvről alkotott ismereteink egyfelől az egyes nyelvek beható tanulmányozásából, másfelől a különböző nyelvek összehasonlításából származnak. A nyelvhasonlításnak három iránya van: vizsgálhatjuk a nyelvek rokonságát, a földrajzilag együttélő nyelvek jellegzetes hasonlóságait, illetve a világ nyelveinek szerkezeti felépítését általában, létező és lehetséges típusaik feltárása céljából. Ez utóbbi megközelítés a nyelvtipológia, ma a nemzetközi nyelvészet egyik legdinamikusabban fejlődő kutatási iránya. A világ nyelveinek tipológiai feldolgozottsága azonban ma még nagyon különböző mértékű. Nem kielégítő az uráli, közelebbről a finnugor nyelvcsaládba tartozó nyelvek ezirányú vizsgálata sem. Ez a projektum éppen e nyelvcsalád egyik önálló ága, az ugor nyelvek leíró és összehasonlító tipológiai elemzésére irányul, mégpedig egy internetes tipológiai adatbázis létrehozását célozva. A vizsgálandó nyelvek/dialektusok a magyar, a manysi (vogul) egy, valamint a hanti (osztják) két nyelvjárása. Maga az adatbázis lényegében egy virtuális táblázat, amelynek oszlopai a dialektusok, sorai pedig a tipológiai paraméterek: azok a nyelvi funkciók, melyeknek különböző típusú megoldásai figyelhetők meg a világ nyelveiben (például hogy milyen nyelvtani eszközökkel fejezi ki egy nyelv a birtokviszonyt, vagy mi a mondatrészek alapvető sorrendje). Több mint 200 ilyen paraméter értékeit határozzuk meg a vizsgált nyelvekben. A kész adatbázis nemcsak e nyelvek teljes tipológiai jellemzését adja az uralisztika és a nemzetközi nyelvtipológia számára, hanem keresőprogramja révén eddig nem ismert összefüggésekre deríthet fényt a különböző paraméterértékek között.
Summary
Summary of the research and its aims for experts
Describe the major aims of the research for experts.

The Ugric typological database to be created would serve as the intersection of general linguistic and Uralic-specific typology, and it will be accessible to both researchers in the field of Finno-Ugric studies and linguistic typology. It will first provide complete typological analysis of the Ugric languages in terms of morphology and syntax, and it will make it possible to explore the relationships between these languages and the rest of the world’s languages in terms of their typological features. The parameter values of the database and the pattern of the digital information system can be the starting point for similar future projects and ultimately for the creation of a complete database of the Uralic languages. The languages analyzed in the database are Hungarian, Mansi (Vogul; northern dialect), and Khanty (Ostyak; the western and eastern (northern) dialects Surgut and Synja). The linguistic features in consideration range from morphophonology to syntax. The typological database is available online in a table format, with the rows listing the typological parameters, and the columns showing the dialects analyzed. At the intersection of a row and a column is a cell providing the specific parameter values of a particular dialect, as well as background information (examples from the languages analyzed). Users will be able to simultaneously search the database for multiple dialects, parameters, or parameter values.

What is the major research question?
Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments.

1. What are the typologically defined morphological and syntactic features of the three analyzed Uralic languages (four dialects in total), and how do these dialects fit into both the typology of the world’s languages and the Uralic family? 2. How can a database compatible with already existing digital analysis (parameters, parameter values, combinative contrastive mechanisms) be created in theory and practice for researchers to analyze relevant relationships between languages? We consider whether the database could not only establish a pattern and a practical starting point for further investigation of Uralic languages, but also serve as a useful resource for international typological research on the world’s languages.

What is the significance of the research?
Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field.

Linguistic typology, as the comparative study of linguistic diversity, is one of the fastest developing directions of research today. In the past, work in typology emphasized the field's independence from genetic linguistics. In recent years, a new area of research, called intragenetic typology, has grown in importance. Intragenetic typology analyzes related languages in terms of their shared features and differences.
Until now, the field of Uralic studies has been dominated by genetic comparison, while significantly less research has focused on analysis of the individual Uralic languages and, in particular, comparative typology. Despite a lack of knowledge about Uralic languages, international typology has often tried to determine the typological features of these languages. A thorough analysis of Uralic typology is thus the timeliest task for Uralic linguists. The endangered status of a number of Uralic languages (such as Mansi, from among the languages in the database) makes the task even timelier.
The most important task is the creation of the Uralic language typological database, as it provides all the basic material for further typological collection. However, the volume of the task makes it necessary to begin with the smaller groups within the Uralic language family first. The current project focuses on the Ugric branch of the Finno-Ugric family: the languages and dialects to be analyzed are Hungarian, Mansi (represented by the northern dialect), and Khanty (the eastern Surgut dialect and the western (northern) Synja dialect).
Our goal is therefore the preparation of an online typological database of Uralic languages. The database will be accessible to not only Finno-Ugric linguists but also researchers of linguistic typology. It will both offer complete typological analysis of the Ugric languages in terms of morphology and syntax and make it possible to do comparative analysis with the rest of the world’s languages. The parameters and programming framework of the database can offer an example and starting point for similar future projects, and serve as the launching point of what will ultimately be a typological database of the entire Uralic family.

Summary and aims of the research for the public
Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others.

Our knowledge of human language comes from both the analysis of individual languages and the comparative analysis of different languages. There are three directions of comparative linguistics: we can look at the genetic relationship between languages, the similarities between coexisting languages in a particular geographic area, and the existing, and possible structures of the world’s languages. The latter approach is linguistic typology, which is one of the fastest growing areas of research in linguistics. The world’s languages have been analyzed typologically to varying degrees, and so far, there has been insufficient analysis of the Uralic family, and more specifically, the Finno-Ugric languages. This project focuses on one particular branch, the Ugric family, and its goal is the creation of an Internet database. The languages and dialects to be analyzed are Hungarian, one dialect of Mansi (Vogul), and two dialects of Khanty (Ostyak). The database is a virtual table in which the columns list the dialects, and the rows show the typological parameters: the ways in which different linguistic functions are expressed in the world’s languages (for example, what grammatical tools are used to express possession in a particular language, or what the basic word order is). The database analyzes the given language according to over 200 such parameter values. The finished database will not only offer a complete typological analysis of these languages for the fields of Uralic linguistics and international linguistic typology, but it will also be able to discover currently unknown relationships between the various languages, using a search program with different parameter values.





 

Final report

 
Results in Hungarian
A kutatás célja az ugor nyelvek online tipológiai adatbázisának elkészítése volt. A terv teljes mértékben megvalósult. Informatikai értelemben elkészült az adatbázis, melynek online jelenlétén és minden kutató általi szabad használhatóságán túl lényeges tulajdonsága, hogy mind terjedelmi, mind tartalmi tekintetben korlátlanul bővíthető. Tekintettel a leendő felhasználók feltételezhető munkanyelvére, az adatbázis három nyelven működik (magyar, angol, orosz). Tartalmilag négy ugor nyelvváltozatot (magyar, északi manysi, szurguti és szinjai hanti) dolgoztunk fel morfonológiai, morfológiai, szintagmatikai és szintaktikai szinten, mind szerkezeti, mind szórendi szempontból – összesen több mint 200 tipológiai jegy (paraméter) vonatkozásában. Munkánk során a szakirodalom és a korábbi adatbázisok feldolgozásán túl célirányos terepmunkát végeztünk a három obi-ugor nyelv területén, illetve anyanyelvi szakértők bevonásával tisztáztunk eddig nem kutatott kérdéseket. Így az adatbázis mind a kutatott nyelvek tipológiai jellemzőinek megállapításával, mind példa- és kommentáranyagában jelentős mértékben tartalmaz a finnugrisztika, különösen a kis finnugor nyelvek anyanyelvi és egyéb kutatói számára is új ismereteket. Az adatbázis megtekinthető és használható a következő internetes címen: http://utdb.elte.hu.
Results in English
The aim of the project was creating an online typological database for the Ugric languages. The plan has been carried out entirely. From an IT point of view, it is an advantageous feature of the online database that, beyond being freely accessible for any researcher as it stands, it is open to be extended in the future without limits, both in scope and content. In view of the presumable working languages of its users, the database operates in three languages: Hungarian, English and Russian. As far as its content is concerned, four target varieties of Ugric have been tackled, namely Hungarian, North Mansi, Surgut Khanty and Sinya Khanty. The linguistic levels explored were morphonology, morphology, morphosyntax and syntax, both from a structural and a word-order-related perspective. The number of typological features (parameters) dealt with exceeds 200. In our investigation, we did not only make use of existing literature and databases but carried out field work ourselves on the territories of the three Ob-Ugric languages, and involved native specialists in order to clear up some unexplored details of their language. Identifying typological features and providing a large amount of examples of the languages under investigation, the database entails plenty of new knowledge for both native and non-native researchers of Finno-Ugric languages, especially the minor ones. The database is accessible and open to use at http://utdb.elte.hu.
Full text https://www.otka-palyazat.hu/download.php?type=zarobeszamolo&projektid=104249
Decision
Yes





 

List of publications

 
Havas Ferenc ‒ Csepregi Márta ‒ F. Gulyás Nikolett ‒ Németh Szilvia ‒ Czentnár András: Az ugor nyelvek tipológiai adatbázisa, http://utdb.elte.hu, 2015
Csepregi Márta: Marking the agent on non-finite verb forms in Surgut Khanty., Mantila, Harri et al (eds): Congressus Duodecimus Internationalis Fenno-Ugristarum. Book of Abstracts. University of Oulu, 2015. 234–235., 2015
F. Gulyás Nikolett: 3Pl and non-finite impersonal constructions: A functional approach., CIFU 12, Oulu, 2015. augusztus 19., 2015
Havas Ferenc ‒ Csepregi Márta ‒ F. Gulyás Nikolett ‒ Németh Szilvia ‒ Czentnár András: Presentation of the typological database of the Ugric languages., CIFU 12, Oulu, 2015. augusztus 18. (előadás), 2015
Havas Ferenc ‒ Csepregi Márta ‒ F. Gulyás Nikolett ‒ Németh Szilvia ‒ Czentnár András: Презентация типологической базы данных угорских языков., CIFU 12, Oulu, 2015. augusztus 19. (előadás), 2015
F. Gulyás Nikolett ‒ Yulia Speshilova: Impersonals and passives in contemporary Udmurt., Finnisch-Ugrische Mitteilungen 38: 59–91., 2014
F. Gulyás Nikolett – Németh Szilvia: Nyelvészeti terepmunka Szibériában a XXI. században., Nyelvtudományi Társaság felolvasóülése, Budapest (2014.10.28), 2014
Csepregi Márta: Multi-functional participles in Surgut-Khanty., Nobufimi Inaba et al. (szerk): Juuret marin murteissa, latvus yltää Uraliin. Juhlakirja Sirkka Saarisen 60-vuotispäiväksi 21. 12. 2014. Mémoires de la Société Finno-Ougri, 2014
Csepregi Márta: Többfunkciós morfémakapcsolatok a szurguti hantiban (közlésre elfogadva), NyK 109, 2013
F. Gulyás Nikolett: Towards a classification of impersonal constructions in Komi: a functional-typological approach, Csepregi Márta–Kubínyi Kata–Jari Sivonen (szerk.): Grammatika és kontextus. Új szempontok az uráli nyelvek kutatásában III. Uralisztikai tanulmányok 20. Budapest. 31–49., 2013
Csepregi Márta: Evidentiaali hantin murteissa [Evidencialitás a hanti nyelvjárásokban], Grammar and Context IV. Tartu, 2013. június 6-8. 34., 2013
F. Gulyás Nikolett: Nothing personal: subject demotion in impersonal constructions of some Finno-Ugric languages, Subject: cognitive, typological and functional approaches. Tieteiden talo, Helsinki, 2013. szeptember 12., 2013
F. Gulyás Nikolett: Typological Database of the Ugric Languages: An Introduction, Department of Finnish, Finno-Ugrian and Scandinavian Studies, Helsinki, 2013. szeptember 16., 2013
F. Gulyás Nikolett: Ugrilaiskielten typologinen tietokanta. Pirteet ja arvot [Az ugor nyelvek tipológiai adatbázisa. Paraméterek és értékek]., Department of Finnish, Finno-Ugrian and Scandinavian Studies, Helsinki, 2013. szeptember 18., 2013
F. Gulyás Nikolett: How to define impersonal constructions: A case study on Khanty, International Symposium of Graduate Students of Finno-Ugric Linguistics. Kääriku, 2013. október 5., 2013




Back »