Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
2007–2013 m. Ţmogiškųjų išteklių plėtros veiksmų programos 3 prioriteto
„Tyrėjų gebėjimų stiprinimas“ VP1-3.1-ŠMM-02-V priemonės
„Mokslininkų ir kitų tyrėjų kvalifikacijos ir kompetencijų tobulinimas
(mokslo duomenų bazės, e. dokumentai)“
Projekto „Lietuvos HSM duomenų archyvo (LiDA) plėtra“ mokymai EMPIRINIŲ DUOMENŲ IŠTEKLIAI IR DUOMENŲ ANALIZĖ INTERNETE
„LiDA empirinių duomenų ištekliai“
2012 11 09, Kaunas www.lidata.eu
dr. Ligita Šarkutė, dr. Giedrius Žvaliauskas
Antrinė duomenų analizė
• Antrinė duomenų analizė – tai analizė, kai tyrėjai analizuoja duomenis, surinktus kitų tyrėjų ir institucijų.
• Antrinės duomenų analizės privalumai:
- Santykinai maži kaštai (atvira prieiga prie duomenų);
- Santykinai greita analizė;
- Duomenų patikimumas;
- Duomenų palyginamumas (laiko, regionų, šalių atžvilgiu).
• Antrinės duomenų analizės trūkumai:
- Reikalauja aukštos tyrėjo kompetencijos ir statistinės analizės išmanymo;
- Ne visada tinka tyrėjo iškeltai problemai analizuoti.
Socialinių mokslų duomenų archyvai – antrinės analizės šaltinis
KAS YRA LIDA?
Kas yra LiDA? Lietuvos humanitarinių ir socialinių mokslų duomenų
archyvas (LiDA) yra virtuali skaitmeninė empirinių HSM duomenų
kaupimo, ilgalaikio saugojimo ir sklaidos infrastruktūra.
Svarbiausi LiDA tikslai:
- sukurti atvirą prieigą mokslininkams ir kitiems tyrėjams prie empirinių
duomenų,
-propaguoti duomenų saugojimą ir mainus,
- skatinti ir padėti atlikti empirinius tyrimus,
-inicijuoti ir vykdyti aukščiausios metodologinės kokybės tarptautinius
tyrimus,
- tobulinti studentų, mokslininkų ir kitų tyrėjų duomenų analizės
gebėjimus,
-bendradarbiauti su analogiškais archyvais Europoje ir pasaulyje,
užtikrinant platesnį ir žinojimu grindžiamą empirinių duomenų naudojimą
Lietuvos humanitariniuose ir socialiniuose moksluose.
LiDA istorija
• 2006 m. Politikos ir viešojo administravimo institutas (PVAI) pradėjo vykdyti Europos socialinio fondo ir LR Švietimo ir mokslo ministerijos finansuojamą projektą „Empirinių duomenų ir informacijos humanitarinių ir socialinių mokslų tyrimams kaupimas ir valdymas: Lietuvos HSM duomenų archyvas (LiDA)“, kuris tapo Lietuvos humanitarinių ir socialinių mokslų (HSM) duomenų archyvo lopšiu. Per dvejus pirmuosius gyvavimo metus LiDA sukūrė plačią ir sparčiai gausėjančią duomenų kolekciją ir pagrindinėms Lietuvos mokslo ir studijų institucijoms pradėjo teikti prieigą prie visame pasaulyje žinomų HSM duomenų išteklių.
LiDA istorija
• Nuo 2008 m. empirinių duomenų prieinamumą Lietuvos vartotojams LiDA ženkliai išplėtė per nacionalinę narystę Tarpuniversitetiniame politinių ir socialinių tyrimų konsorciume (Inter-University Consortium for Political and Social Research ) arba kitaip – ICPSR. Nacionalinėje ICPSR narystėje dalyvauja Kauno technologijos universitetas, Vilniaus universitetas, Mykolo Romerio universitetas, Vytauto Didžiojo universitetas, Klaipėdos universitetas, Šiaulių universitetas ir Lietuvos socialinių tyrimų centras.
LiDA istorija
• Naujas LiDA vystymo etapas prasidėjo 2009 m. pradėjus vykdyti ES struktūrinių fondų lėšomis finansuojamą projektą „Lietuvos HSM duomenų archyvo (LiDA) plėtra“.
• Nuo 2010 m. LiDA saugo Lietuvos mokslo tarybos finansuojamų tyrimų duomenis taip pradėdamas praktiškai įgyvendinti principą, kad už viešas lėšas sukurti empiriniai duomenys būtų prieinami antrinei duomenų analizei visiems akademinės bendruomenės nariams.
HSM duomenų gyvavimo ciklas (angl. lifecycle)
Kaip aprašomi duomenys?
11
Kas yra metaduomenys?
• Metaduomenys – tai struktūriškai apibrėžta informacija, kuri apibūdina tam tikrą dokumentą arba informacinį išteklių, nurodo jo buvimo vietą. Tai palengvina dokumento ar kito informacinio ištekliaus suradimą, naudojimą ir valdymą. Kitaip sakant, tai duomenys apie duomenis.
Duomenų dokumentavimo standartas DDI
• LiDA saugomi duomenys yra dokumentuoti pagal DDI standartą.
• DDI (angl. Data Documentation Initiative) yra XML metaduomenų standartas, skirtas socialinių mokslų duomenims aprašyti.
• DDI standarto pirmoji versija sukurta 2000 m.
• DDI naudoja HSM duomenų archyvai, statistikos agentūros, universitetai, Pasaulio bankas, tyrimų centrai etc.
• Metaduomenų parengimui LiDA naudoja 1.2.2 versiją.
• Kiekvienas apklausų duomenų rinkinys yra aprašytas (dokumentuotas) lietuvių ir anglų kalbomis.
Pagrindinės DDI dalys
• Dokumento aprašas: šioje dalyje pateikiama informacija apie tyrimo dokumentaciją, t.y. DDI dokumentą. Nurodomi jo autoriai, versijos, saugojimo vieta ir pan.
• Studijos aprašas: šioje dalyje pateikiama pagrindinė informacija apie patį tyrimą, t.y. pavadinimas, atlikimo data, aprėptis, tyrimo aktoriai, užsakovai ir jį atlikusieji ir t.t.
• Duomenų laikmenos aprašas: šioje dalyje apibendrintai aprašoma pati duomenų laikmena, t.y. nurodoma, kokie tyrimo duomenys joje saugomi ir koks jų formatas (skaitinis/tekstinis), kas ir kokias atliko tikrinimo ar pirminio apdorojimo procedūras, apibūdinama duomenų laikmenos sutvarkymo būsena, pateikiama bendra informacija apie trūkstamus duomenis.
• Kintamųjų aprašas: šioje dalyje aprašomi kintamieji, jų grupės, žymės, tipai, klausimai, interviuerio instrukcijos ir kt.
• Kita susijusi medžiaga: šioje dalyje pateikiamos nuorodos į su tyrimu susijusią informaciją, .t.y tyrimo autorių informacijos šaltinius, originalią tyrimo dokumentaciją, tyrimo klausimynus ir korteles, tyrimo duomenų pagrindu sukurtas publikacijas ir kt.
DDI 2.1 versijos XML schema
http://www.lidata.eu/index_search_results_download.php?pid=LiDA:quant.LiDA_ISSP_0235
15
Duomenų ir metaduomenų saugojimo formatai
• Metaduomenys saugojami DDI document (*.xml) formatu.
• Duomenys gali būti kaupiami ir saugojami įvairiais formatais: SPSS System (*.sav), SPSS Portable (*.por), SPSS Syntax (*.sps), SAS (*.spl), Stata (*.dta), Statistica (*.sta), NSDsat (*.nsf), dBase (*.dbf), DIF (*.dif), Text (*.txt) ir kitais, PDF (*.pdf) ir kt.
17
http://www.nesstar.com/
Duomenų ir
metaduomenų tvarkymas:
konvertavimas,
redagavimas ir
publikavimas Nesstar
Serveryje
Duomenų ir metaduomenų
talpinimas, informacijos
pateikimas vartotojams
Duomenų ir
metaduomenų,
patalpintų Nesstar
Serveryje, analizė ir
sklaida internete
18
“Nesstar Publisher” programos langas
LiDA duomenų prieinamumas
• Prieiga prie LiDA saugomų duomenų rinkinių ir su jais susijusios informacijos nekomerciniais tikslais (mokslinių tyrimų, savišvietos ir mokymo) yra nemokama.
• Duomenys prieinami visiems registruotiems vartotojams, jeigu depozitoriaus nenurodytos griežtesnės duomenų naudojimo sąlygos. Jeigu depozitorius yra nurodęs griežtesnes duomenų naudojimo sąlygas, vartotojas apie tai informuojamas atskiru pranešimu.
LiDA (http://www.lidata.eu)
Kaip prisiregistruoti?
Registracija LiDA portale http://www.lidata.eu/index_reg.php
Kaip surasti reikiamus duomenis?
http://www.lidata.eu
Duomenų katalogai
Apklausų duomenys
Visų apklausų duomenų rinkinių peržiūra
Tyrimo aprašo peržiūra
Tyrimo dokumentacijos peržiūra
Kintamųjų peržiūra
Kintamųjų peržiūra
Kintamųjų peržiūra
Reikšminiai žodžiai
Reikšminiai žodžiai
Duomenų atsisiuntimas
Duomenų atsisiuntimas
Duomenų peržiūra Nesstar kataloge
Duomenų peržiūra Nesstar kataloge
Duomenų peržiūra Nesstar kataloge
Duomenų peržiūra Nesstar kataloge
Duomenų eksportavimas iš Nesstar katalogo
Peržiūra pagal autorių
Peržiūra pagal autorių
Peržiūra pagal temas
Peržiūra pagal temas
Peržiūra pagal tyrimų rinkinius
Peržiūra pagal tyrimų rinkinius
Peržiūra pagal depozitorių
Peržiūra pagal depozitorių
Peržiūra pagal finansavimo šaltinius
Nauji duomenys
Istoriniai duomenys (istorinė statistika)
Peržiūra pagal šaltinius
Istoriniai duomenys (istorinė statistika)
Peržiūra pagal istorinių duomenų
rinkinių grupes
Tyrimo aprašo peržiūra
Duomenų lentelė
Duomenų grafikas
Duomenys apie Lietuvos politinę sistemą
Seimo nariai (2008-2012 m.)
Seimo frakcijos (2008-2012 m.)
Seimo komitetai (2008-2012 m.)
Plenarinio posėdžių stenograma
Duomenys apie Seimo narius, 1990-
2004 m.
2008-2012 m. kadencijos Seimo
komitetai
2004-2008 m., 2008-2012 m.
kadencijos Seimo frakcijos
Lietuvos partijų manifestų
nuo 1992 m. kolekcija
Kokybinių tyrimų duomenys
Peržiūra Nesstar kataloge
Nesstar katalogas
Duomenų paieškos galimybės
• Norėdami surasti jus dominantį apklausų duomenų rinkinį galite pasinaudoti paieška. Paiešką galima atlikti ir pasitelkiant kintamųjų paiešką arba kontroliuojamą žodyną (HASSET tezaurą).
Duomenų paieška
Duomenų paieška pagal konkretų lauką
Duomenų paieška kataloguose
Kintamųjų paieška
Kintamųjų paieška
Tyrimų paieškos pavyzdys
Tyrimų paieškos rezultatai
Kintamųjų paieškos pavyzdys
Kintamųjų paieškos rezultatai
Tezauras • Tezauras – informacijos tvarkybos ir paieškos įrankis: tam tikroje srityje
vartotinų žodžių ir žodžių junginių sąrašas drauge su jų ryšiais, variantais, sinonimais bei tezauro naršymo priemonėmis. Toks kontroliuojamas žodynas – tai sistemingas ir struktūruotas žodžių ir žodžių junginių sąrašas, kurio tikslas – kuo vienareikšmiškiau atspindėti dokumentų sistemoje esančių dokumentų konceptualų turinį ir palengvinti atliekamas paieškos užklausas.
• Lietuvos HSM duomenų archyvo dvikalbio tezauro pagrindas – adaptuotas lietuvių kalbai Jungtinės Karalystės duomenų archyvo (angl. United Kingdom Data Archive, toliau UKDA) Humanitarinių ir socialinių mokslų elektroninis tezauras (angl. Humanities and Social Science Electronic Thesaurus, toliau HASSET). UKDA HASSET rengė savo tikslams, todėl šio žodyno turinys ir aprėptis atspindi UKDA poreikius ir išteklius. Plačiausiai ir išsamiausiai pristatytos pagrindinės socialinių mokslų sritys: politika, sociologija, ekonomika, švietimas, teisė, nusikalstamumas, demografija, sveikata, užimtumas. Terminai žymi mokslines sąvokas, fizinius objektus, objektų savybes, procesus, veiksmus ir pan.
Paieška su tezauru
Tyrimų paieškos su tezauru rezultatai