Strukturális hatások keresztosztályozott adatokban
 106154 |
K |
Rudas Tamás |
Strukturális hatások keresztosztályozott adatokban |
Structural effects in cross-classified data |
kontingencia tábla, okság, paraméterezés, variációs függetlenség, kezelési besorolás, grafikus modell |
contingency table, causality, parameterization, variation independence, treatment allocation, graphical model |
Szociológia (Bölcsészet- és Társadalomtudományok Kollégiuma) | 50 % | Ortelius tudományág: Szociológia | Közgazdaságtudomány (Bölcsészet- és Társadalomtudományok Kollégiuma) | 50 % | Ortelius tudományág: Statisztika |
Társadalom |
Empírikus Tanulmányok Intézete (Eötvös Loránd Tudományegyetem) |
Klimova Anna Németh Renáta
2013-01-01 |
2016-12-31 |
8.236 |
1.60 |
lezárult projekt |
magyar összefoglaló A kutatás összefoglalója, célkitűzései szakemberek számára Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára. A kutatás célja statisztikai modellek és becslési eljárások fejlesztése, hatások, különösen oksági hatások kvantifikálására kategoriális adatokban. A modellek definíciója és a hatások becslése az együttes eloszlások megfelelő paraméterezésén alapul. A kategoriális adatok grafikus, marginális és relációs elemzésére vonatkozó új eredményekre támaszkodva variációsan független paraméterek alkalmazásával fogjuk a kezelési besorolás és a kezelés hatását szétválasztani. Nyilvánvaló, hogy ez a szeparálás lehetséges véletlenítést alkalmazó tervezett kísérletek esetében és nem lehetséges megfigyeléses vizsgálatoknál. Ismeretes, hogy ez a szétválasztás szintén lehetséges olyan adatgyűjtési eljárásoknál, amelyeknél a kísérleti besorolás erősen elhanyagolható. Ezekben az esetekben a propensity score alapú illesztést széles körben használják. Ezekre az adatgyűjtési eljárásokra olyan paraméterezést fogunk kifejleszteni, amelyben a kísérleti személyek jellemzőinek nincs sem közvetlen sem közvetett hatása a megfigyelt válaszra, csak a kezelés közvetlen hatása létezik. Azzal a kérdéssel is foglalkozni fogunk, hogy vajon léteznek-e más adatgyűjtési eljárások, amelyek rendelkeznek ezzel a szétválaszthatósági tulajdonsággal. Ezek meghatározására számos tudományos és közpolitikai célú adatgyűjtést fogunk megvizsgálni.
Mi a kutatás alapkérdése? Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek. Ez a kutatás két kérdést kíván megválaszolni. Először azt, hogyan helyezhetőek el a különböző adatgyűjtési eljárások tervezett kísérletek és a megfigyeléses vizsgálatok között. Azok az adatgyűjtési eljárások, amelyek esetében a kezelésekbe való besorolás az un. erősen elhanyagolható tulajdonsággal rendelkezik, megfelelőek oksági következtetések levonására. Azt kívánjuk eldönteni, hogy vajon minden olyan adatgyűjtési eljárás, amely oksági következtetések levonására alkalmas, rendelkezik ezzel a tulajdonsággal vagy vannak más kísérleti elrendezések, amelyek szintén a tervezett kísérlet és a megfigyeléses vizsgálat között helyezkednek el. Másodszor azt, hogyan lehet egyéni jellemzőket, kezeléseket és ezekre adott válaszokat keresztosztályozó eloszlásokat úgy paraméterezni, hogy a kezelések hatása, a személyek és besorolások különbözőségének hatásától megtisztítva, azonosítható legyen bizonyos paraméterekkel. Ilyen paraméterzések, megfelelő eljárással gyűjtött adatok esetén, alkalmasak arra, hogy kezelések oksági vagy az azoknak betudható hatását kiolvassuk az adatokból.
Mi a kutatás jelentősége? Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának! Az okság és az oksági hatások kvantifikálásának kérdései központi fontosságúak a tudományban és a közpolitikában. Az ebben a kutatásban kifejlesztésre kerülő módszerek különösen alkalmasak a szociológiában és a közpolitikai döntésekben való alkalmazásra, mivel ezeken a területeken a kezelések és az ezekre adott válaszok általában kategoriálisak. Az adatok kategoriális jellege miatt az oksággal kapcsolatos fogalmakat másként kell operacionalizálni, mint azokban az esetekben, amikor a hatások kvantitatívak. A projekt eredményei a kutatók számára explicit szabályokat fognak adni, amelyeket be kell tartaniuk, ha adataikból oksági következtetéseket kívánnak levonni. Azt reméljük, hogy az adatgyűjtési eljárások struktúrájának finomabb leírását fogjuk megállapítani, mint a tervezett kísérlet, erősen elhanyagolható allokációjú vizsgálat és megfigyeléses vizsgálat három kategóriája. Ezek az eredmények közvetlenül hasznosíthatók lesznek a társadalomstatisztikában, beleértve a hivatalos statisztikát is, és közpolitikai döntések meghozatalában olyan kísérletek tervezésére és kiértékelésére, amelyek megfelelő bizonyítékkal szolgálnak a leghatékonyabb társadalmi intervenciók kiválasztásához.
A kutatás összefoglalója, célkitűzései laikusok számára Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára. A kutatás célja olyan adatelemzési módszerek fejlesztése, amelyek különböző kezelések hatásainak tesztelésére, illetve a hatások nagyságának becslésére alkalmasak. Ezek a kérdések központi jelentőségűek a társadalomtudományokban és közpolitikai döntések bizonyítékokra alapozott meghozatalában. Egy társadalmi intervenció, például munkanélküliek átképzésére szolgáló program eredményességét értékelni kell, mielőtt az intervenció hatékonyságéról döntenek. Hasonló technikák alkalmazhatóak egy reklámkampány eredményességének értékelésében, olyan tudományos kérdések megértésében, mint például az, hogy különböző társadalmakban az apa iskolai végzettsége milyen hatással van a fia jövedelmére. Az alapvető probléma az, hogy a különböző kezeléseket (különböző átképző programokat, különböző reklámokat, különböző iskolai végzettségű apákat) más és más személyek kapják illetve választják és a megfigyelt reakciók (munkaviszony az átképzés után 6 hónappal, a reklámozott termék megvásásárlása a reklámkampány után, a fiú jövedelme) eltérése a kezelést kapók és nem kapók között részben a kezelés, de részben a kezeltek és nem kezeltek eltérésének következménye is lehet. Például, azok, akik egy bizonyos áru megvásárlását tervezik, feltehetőleg jobban odafigyelnek az árut hirdető reklámokra, ezért ha a terméket ténylegesen megvásárlók nagyobb arányban emlékeznek vissza a hirdetése, mint azok, akik nem vásárolták meg a terméket, nem jelenti azt, hogy azért vásároltak, mert látták a hirdetést. A kutatás olyan eljárásokat fejleszt, amelyek lehetővé teszik a kétféle hatás elválasztását, ezek kvantifikálását és jellemzik azokat az adatgyűjtési eljárásokat, amelyek mellett ez a szeparáció lehetséges.
| angol összefoglaló Summary of the research and its aims for experts Describe the major aims of the research for experts. This research aims at developing statistical models and estimation techniques to quantify effects, in particular causal effects, in categorical data. The definition of such models and the quantification of the effects rely on appropriately defined parameterizations of the joint distribution. Recent advances in graphical, marginal and relational modeling of categorical data will be used to separate the effects of treatment allocation and that of treatment, using parameterizations that consist of variation independent parameters. Obviously, such a separation is possible in the case of designed experiments with random allocation and is not possible in observational studies. Data collection designs that make such a separation possible include designs with strongly ignorable treatment assignment, where propensity score matching is widely used. For such designs, a parameterization of the joint distribution, without direct or indirect effect of the characteristics of the individuals on response, and with a direct effect of treatment on response, will be developed. It is also a question to be addressed, whether further designs with such separability exists. To identify such designs, several scientific and policy oriented data collection exercises will be investigated.
What is the major research question? Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments. The research aims to answer two questions. First, how data collection designs can be positioned between designed experiments and observational studies? Designs with strongly ignorable treatment assignment are in between these and are appropriate to make causal inferences. We seek to decide, whether or not all designs that are appropriate for causal inference are characterized by strongly ignorable treatment assignment, or there are other such designs between designed experiments and observational studies. Second,how such parameterizations of joint distributions of cross-classifications containing individual characteristics, treatments and responses can be constructed, so that the effect of treatments, net of the effects of individuals or of the treatment assignments, can be identified with some of the parameters. Such parameterizations, in case of appropriate data collection designs, may be used to read off the causal or attributable effects of treatments.
What is the significance of the research? Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field. The questions of causality and the quantification of causal effects are of central importance in science and in policy making. The methods to be developed in this research will be specially suited to applications in sociology and policy making, where the choice between treatments and the possible outcomes or responses are mostly categorical. This categorical nature of the data requires the concepts of causality to be operationalized differently from cases when the effects are quantitative. The results of this project will provide researchers with explicit rules to observe in their data collection designs if causal conclusions are aimed at. It is hoped, that a finer description of the structure of data collection procedures will be achieved than the three types of designed experiment, designs with strongly ignorable treatment assignment and observational study. In social statistics, including official statistics and in policy making, the results will be directly applicable to design and evaluate experiments that can provide the necessary evidence to select the most efficient methods of social interventions.
Summary and aims of the research for the public Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others. This research develops methods for data analysis that are appropriate for testing the existence of effects of various treatments and to estimating the magnitude of such effects. These questions are of central importance in the social sciences and also in evidence based policy making. The effects of a social intervention, for example providing retraining to unemployed people, should be carefully evaluated before a decision can be made about the efficacy of that intervention. Similar techniques are relevant in assessing the results of commercial campaigns or in understanding scientific questions, like how, in different societies, a father’s educational level may affect his son’s income. The key problem here is that different treatments (e.g., different retraining programs, or commercials in tv, or different fathers) are given to or received by different individuals and the difference in the observed response (e.g., employment 6 months after retraining, or purchasing of goods after the campaign, or income of the son) is partly due to the different treatments but also to the differences among the individuals who received them. For example, those who are interested in buying a product, may pay more attention to commercials promoting it, so the fact that those who buy the product can recall having seen the commercial in larger fractions than those who do not buy it, does not imply that consumers buy the product because of having seen the commercial. This research will develop methods that can separate these two kinds of effects, can quantify the net effect of treatment on response, and will characterize data collection designs, based on which such a separation is possible.





