How to Approach the Unreachable? – Pilot analysis of unit non-response and ineligible populations in empirical surveys by re-connecting with special questionnaires and methods –
125162 |
K |
Tóth, István György |
Megközelíthetetlen csoportok vizsgálata - Pilot kutatás az empirikus felmérésekből kimaradó elérhetetlen, vagy válaszmegtagadó népességről, azok speciális feltérképezésével – |
How to Approach the Unreachable? – Pilot analysis of unit non-response and ineligible populations in empirical surveys by re-connecting with special questionnaires and methods – |
kutatásmódszertan, survey statisztika |
survey methodology, applied statistics, survey design |
Economics (Council of Humanities and Social Sciences) | 60 % | Ortelius classification: Statistics | Sociology (Council of Humanities and Social Sciences) | 40 % | Ortelius classification: Macrosociology |
Economics |
Branyiczki, Réka Szeitl, Blanka
2017-09-01 |
2020-02-29 |
12.924 |
1.63 |
closed project |
Summary in Hungarian A kutatás összefoglalója, célkitűzései szakemberek számára Itt írja le a kutatás fő célkitűzéseit a témában jártas szakember számára. A kutatás célja az, hogy meghatározzuk a kvantitatív empirikus vizsgálatok érvényességi körét és annak korlátait, azaz azt, hogy milyen társadalmi jellemzőkkel bírnak azok, akik általában nem vesznek részt a vizsgálatokban. A visszautasítás és az elérhetetlenség általában véve erősödik az elmúlt 20 évben Magyarországon. Egyre nagyobb probléma az, hogy jóval több személyt kell felkeresni a minta teljesüléséhez, ami a címlistás és a véletlensétás kutatásokra egyaránt igaz. A vizsgálatok érvényességi köre mindig csorbát szenved, mivel bizonyos társadalmi csoportok, rétegek részlegesen, vagy teljesen kimaradnak a teljes lakosságra kiterjedő felvételekből. Ezek alapján habár elméletben teljesülnek a véletlen mintavétel feltételei, a gyakorlatban egyre kevésbé beszélhetünk valódi véletlen mintáról, így a kapott kutatási eredmények még az utólagos rétegzés korrekciói után is torzíthatnak. A válaszmegtagadási valószínűségek nem véletlenszerűen alakulnak, hanem jól körülhatárolható, speciális sajátosságokkal rendelkező csoportokra jellemzőek, azaz nem mindenkinek ugyanakkora az esélye arra, hogy ha bekerül a mintába, akkor a nemválaszolók csoportjába kerül. Demográfiai-szociológiai jellemzőket tekintve minél jobban elválik a válaszadók és a megtagadók köre, annál kevésbé tekinthető egy lakossági felvétel általános érvényűnek. Kutatásunk eredményei a társadalomtudományi adatfelvételek teljes egészére hasznosíthatóak lesznek: lehetőség nyílik olyan mintavételi és súlyozási technikák alkalmazására, melyek a nemválaszoló és az elérhetetlen magyar lakosság részletes jellemzését is figyelembe veszik, így a mintákból származó becslések és következtetések pontosabbak lesznek.
Mi a kutatás alapkérdése? Ebben a részben írja le röviden, hogy mi a kutatás segítségével megválaszolni kívánt probléma, mi a kutatás kiinduló hipotézise, milyen kérdéseket válaszolnak meg a kísérletek. Alapkérdésünk az, hogy hogyan jellemezhetők azok a háztartások/személyek, amelyek az empirikus adatfelvételek által nem érhetőek el? Minden társadalomtudományi adatfelvétel törekszik a vizsgálatok teljeskörűségére, illetve az adatokból származó becslések torzítatlanságára, az viszont egyértelmű, hogy mivel a válaszadás nem kötelező, a teljeskörűség sem biztosított. Továbbá, mivel nem tudjuk, hogy pontosan milyen társadalmi dimenziók szerint kellene korrigálni a szerzett adatokat (jellemzően alapvető demográfiai változók szerint súlyozunk, amik egyáltalán nem biztos, hogy szignifikáns kapcsolatban állnak a válaszmegtagadással és az elérhetetlenséggel), becsléseink torzíthatnak. A probléma az empirikus adatgyűjtést alkalmazó tudományágak mindegyikében jelentkezik. Kutatásunk pilot vizsgálatként megteszi az első lépést az információhiány leküzdésében: eredményeink alapján megválaszolhatóak lesznek azok a kérdések, hogy milyen módszerű vizsgálatok esetében mely társadalmi csoportok kimaradására számíthatunk, illetve elkezdhetünk alternatív mintavételi, adatfelvételi és adat-korrekciós technikákat készíteni, tesztelni.
Mi a kutatás jelentősége? Röviden írja le, milyen új perspektívát nyitnak az alapkutatásban az elért eredmények, milyen társadalmi hasznosíthatóságnak teremtik meg a tudományos alapját. Mutassa be, hogy a megpályázott kutatási területen lévő hazai és a nemzetközi versenytársaihoz képest melyek az egyediségei és erősségei a pályázatának! Kutatásunk jelentősége az empirikus adatfelvételeket alkalmazó tudományágak esetében sokrétű: célunk az, hogy az adatgyűjtések hatékonyságát (ebből következően időigényét, illetve költséghatékonyságát) általánosságban növeljük, a felmérések reprezentativitását jobban biztosítjuk, az adatfelvételek érvényességi köre pontosan meghatározható legyen, továbbá mindezek által pontosítsuk az adatokból származó becsléseket megbízhatóságát. A survey statisztikával, illetve a mintavétellel foglalkozó nemzetközi intézetek körében már jó ideje központi kérdés az effektív mintanagyság és az ehhez kapcsoló mutatók alkalmazása, melyek a háztartások elérhetőségének és válaszadási hajlandóságának mutatóival dolgoznak és a vizsgálatok minőségi szempontjai közül kulcsfontosságúaknak tekinthetőek. Magyarországon még nem készült olyan átfogó vizsgálat, mely a survey-ekből kimaradó, elérhetetlen népesség vizsgálatával foglalkoznak. Jelen pályázatunk egy ilyen magyarországi felmérés pilot vizsgálatát ajánlja. Kutatásunk két szempont alapján is új perspektívát nyújt: egyrészt először használjuk fel a Tárki elmúlt 5 évében felgyűlt elérhetetlen/válaszmegtagadó címeket elemzési céllal, melyek a kutatás eredményei között készülő kötet értékes módszertani/statisztikai elemzéseinek ad alapot, mely önmagában is innovációnak számít. Másrészt pilotkutatásunk új módszertani nézőpontot nyithat meg, az ilyen érdeklődésű kutatók számára, hiszen eredményeink új kérdéseket, adatfelvételi technikai innovációkat és további kutatási lehetőségeket rejthetnek magukban.
A kutatás összefoglalója, célkitűzései laikusok számára Ebben a fejezetben írja le a kutatás fő célkitűzéseit alapműveltséggel rendelkező laikusok számára. Ez az összefoglaló a döntéshozók, a média, illetve az érdeklődők tájékoztatása szempontjából különösen fontos az NKFI Hivatal számára. Empirikus adatfelvételeket a tudományterületek közül legfőképpen a közgazdaságtan, a pszichológia és a szociológia használ. Minden esetben a magyar lakosságon belül mintát veszünk, így annak csak egy adott részéhez jutunk el a vizsgálat kérdőívével. Feltételezzük azt, hogy az általunk használt algoritmusok segítségével reprezentatív mintához jutunk, így az adatokból származó becsléseinket a teljes magyar lakosságra általánosíthatjuk. Az elmúlt 20 évben azonban folyamatosan és jelentősen növekszik azoknak az aránya, akiket a kérdezőbiztosok nem tudnak elérni, vagy a kiválasztott személy megtagadja a válaszadást. Habár az adatok javítása súlyozási és utólagos rétegzési eljárásokkal javíthatóak, egyre kevésbé beszélhetünk reprezentatív, általánosítható felmérésekről. Kutatási tervünk arra ad választ, hogy milyen társadalmi jellemzőkkel bírnak azok a személyek/háztartások akik jellemzően „kimaradnak” a felvételekből, így megállapíthatjuk a felmérések érvényességi körét, pontosíthatjuk a mintavételi eljárásokat, illetve javíthatunk az adatok utólagos korrekcióján is. A felméréshez a Tárki saját adathalmazát használjuk, mely az elmúlt 5 évben végzett adatfelvételek címlistáit tartalmazza. A kutatás pilot vizsgálatnak minősül, azaz feltételezésünket először kisebb léptékben teszteljük, ami komoly és megbízható alapot adhat egy később nagyobb volumenű, teljeskörű vizsgálathoz. Pályázatunk célja olyan módszertani elemzések és vizsgálatok készítése, melyen keresztül a magyar társadalom megismerhetősége pontosabb, az adatfelvételekből származó becslések pedig megbízhatóbbakká válnak.
| Summary Summary of the research and its aims for experts Describe the major aims of the research for experts. The aim of the research is to define and measure the limit of quantitative empirical researches, more specifically the social characteristics of those who do not take part in the survey. In general, in the past 20 years, rejection (non-response), and inaccessibility (no-contact) are growing tendencies in Hungary. The fact that much more persons have to be sampled in order to reach the effective sample size both at the random-walk and address-based surveys is a growing problem. The validity of the analyses always fail because certain groups of the society partly or fully missing from data collections targeting the entire population. Thus, even though all criterion and set of rules of probability sampling are fulfilled in theory, in general, we cannot really talk about random sample in practice, the research results are biased even after correction of the stratification/weighting. The probability of refusing answer is not random but rather specific to well-definable groups with special characteristics, therefore not every selected respondent has the same chance to be part of surveys. Regarding demographic and social characteristics, the more the groups of answerers and rejecters differ, the less general validity a data collection has. The results of our research will be able to be used in all kinds of social science data collections: new sampling and weighting procedures will be applied which take into account the not answering and inaccessible Hungarian citizens’ detailed characterization, and therefore the estimations and conclusions from the samples will be more accurate.
What is the major research question? Describe here briefly the problem to be solved by the research, the starting hypothesis, and the questions addressed by the experiments. Our main question is how to characterize and describe those households/persons, that are inaccessible for empirical data collections. Every social science data collection aims for comprehensive analysis and the representativeness of its estimations from data, but clearly, comprehensiveness is not ensured since responding is not obligatory. Moreover, since we do not know which social dimensions we need to base the data correction (generally we weight on the basis of demographic variables, which is not necessarily in a significant relation to rejection and inaccessibility), our estimations may be biased. This problem can be found in all the social sciences that apply empirical data collection. As a pilot analysis, our research takes the first step to overcome lack of information, based on our results we will be able to understand which social groups are missing from which research methods, moreover we may start to develop and test alternative sampling, data collection and data correction techniques.
What is the significance of the research? Describe the new perspectives opened by the results achieved, including the scientific basics of potential societal applications. Please describe the unique strengths of your proposal in comparison to your domestic and international competitors in the given field. The importance of our research regarding sciences that use empirical data collection has various aspects: our aim is to increase the efficiency of data collections in general (thus lessen time and budget), to ensure the better representativeness of surveys, to be able to define the validity of data collections better and due to these results, to increase the reliability of estimations from data. Institutions working with survey statistics and sampling have been dealing with the issue of the effective sample size and the application of indicators related to it, which work with the accessibility and response tendency of households and therefore that have key importance regarding the quality aspects of the analyses. So far, no comprehensive research has been conducted in Hungary that deals with inaccessible population which is missing from the surveys. Our proposal offers such a pilot analysis in Hungary. Our research offers new perspectives in two aspects: on the one hand, we use the inaccessible/rejecting addresses from the past 5 years from Tárki’s database for analytical use for the first time, which give basis for the valuable methodological/statistical analysis of the study that will be one of the deliverables of the research, which is an innovation in itself. On the other hand, our pilot research may explore a new methodological viewpoint for interested researchers since the results may present new questions, innovations in data collection techniques and further research possibilities.
Summary and aims of the research for the public Describe here the major aims of the research for an audience with average background information. This summary is especially important for NRDI Office in order to inform decision-makers, media, and others. Mostly economics, psychology and sociology use empirical data collections. In each case, we take a sample within the Hungarian population, practically we visit only a properly selected part of it. We assume that from sampling algorithms we obtain a representative sample and therefore we can generalize our estimations on the entire Hungarian population. However, in the past 20 years the proportion of those who are inaccessible by or not answering to the questionnaires is continuously and significantly growing. Although the data can be corrected by weighting and post-stratification, we less can talk about representative surveys that can be used for generalization. Our research proposal explores the social characteristics of those persons/households who are generally missing from the surveys, therefore the validity of surveys can be defined, the procedures of sampling can become more accurate, and the quality of subsequent correction of data can become better. For the survey, we use Tárki’s own databank which contains the address list of the past 5 years. The research qualifies as a pilot analysis and therefore we firstly test our assumptions in small scale, which can give serious and reliable basis for a bigger, comprehensive analysis. The aim of our research proposal is to develop methodological analyses and examinations whereby the understanding of the Hungarian population becomes more accurate, and the estimations from the data collections become more reliable
