View
4
Download
0
Category
Preview:
Citation preview
WPROWADZENIE Cele i zakres seminariów
Andrzej Młodak
Urząd Statystyczny w Poznaniu,
Ośrodek Statystyki Małych Obszarów
Metodologia nowoczesnej statystyki
działalności gospodarczej
Cele seminariów
Zaprezentowanie najistotniejszych z praktycznego punktu widzenia elementów projektowania i prowadzenia badań z zakresu statystyki działalności gospodarczej
Pogłębienie wiedzy z zakresu nowoczes-nych metod i narzędzi oceny oraz doskona-lenia jakości danych statystycznych dostar-czanych przez podmioty gospodarcze
Podstawa seminariów: wyniki projektu MeMoBuSt (Methodology for Modern Business Statistics) prowadzonego w ESSnet.
MEETS a MeMoBuSt
Projekt MeMoBuSt stanowi jeden z elementów MEETS (Modernisation of European Enterprise and Trade Statistics) – programu modernizacji europejskiej statystyki przedsiębiorstw i handlu, ustanowionego mocą decyzji Parlamentu Europejskiego i Rady z dnia 16 grudnia 2008 r. na lata 2009 – 2013.
Realizacja MEETS odbywała się na platformie ESSnet (sieć współpracy w ramach ESS).
Inicjatywa MEETS
Ogromny zakres MEETS: 2009 – ok. 5 mln EUR,
2010 – ok. 10 mln EUR,
25 projektów.
Przykłady projektów, w których strona polska brała udział:
MeMoBuSt – modernizacja statystyki działalności gospodarczej
Data Integration – wypracowanie metod rozwiązywania problemów oraz oceny precyzji w zakresie integracji danych statystycznych
Small Area Estimation – synteza wiedzy dotyczącej estymacji dla małych obszarów oraz doskonalenie jej narzędzi.
Cele operacyjne MeMoBuSt
Cel główny: opracowanie podręcznika metodologicznego z zakresu statystyki działalności gospodarczej
Zastąpił publikację pod red. A. Willeboordse (1997), która była dalece niewystarczająca:
dotyczy raczej tylko realiów niderlandzkich
zawiera nieaktualne uregulowania prawne
nie ma kluczowych specyfikacji i analiz
brak problemu identyfikacji statusu LEA
nie porusza kwestii obciążeń odpowiedzi
rekomenduje przestarzałe narzędzia IT.
Cele operacyjne MeMoBuSt
Szczegółowe założenia operacyjne: objęcie zasięgiem całej dziedziny statystyki
przedsiębiorczości
uwzględnienie różnych rodzajów badań i potrzeb użytkowników
analiza metod weryfikacyjnych, redukcji obciążeń i integracji danych
łatwa dostępność podręcznika w formie elektronicznej
wykorzystanie treści nowego podręcznika jako materiału do szkoleń w ramach ESS
możliwość przeprowadzenia nowych studiów z zakresu objętego podręcznikiem.
Cele operacyjne MeMoBuSt
Uczestnicy projektu: Holandia (CBS – Centraal Bureau voor de Statistiek, Statistics
Netherlands) – koordynator projektu
Grecja (El–Stat – Hellenic Statistical Authority) – tylko w I fazie
Polska (GUS – US Poznań)
Norwegia (SSB – Statistics Norway, Centralny Urząd Statystyczny Norwegii)
Szwajcaria (FCSO – Federalny Urząd Statystyczny)
Szwecja (SCB – Statistics Sweden, Centralny Urząd Statystyczny Szwecji)
Węgry (HCSO – Hungarian Central Statistical Office, Węgierski Centralny Urząd Statystyczny)
Włochy (ISTAT – Instituto Nazionale di Statistica, Narodowy Instytut Statystyczny)
Założenia projektu MeMoBuSt
Podręcznik obejmuje poszczególne fazy Podstawowego Modelu Prowadzenia Statystyki Działalności Gospodarczej GSBPM (ang. Generic Statistical Business Process Model).
GSBPM wykorzystano w kontekście projektowania, przeprowadzania, oceny efektów i rozpoznawania reakcji respondentów badań.
http://www1.unece.org/stat/platform/display/metis/The+Generic+Statistical+Business+Process+Model – wersja 5.0 (XII 2013), wówczas 4.0 (IV 2009).
Założenia projektu MeMoBuSt
Konstrukcja schematu GSBPM 2013
Założenia projektu MeMoBuSt
Standard SDMX (ang. Statistical Data and Metadata eXchange)
standardy techniczne i statystyczne tworzone przez konsorcjum BIS, ECB, EUROSTAT, IMF, OECD, UN, Bank Światowy do efektywnej wymiany oraz współdzielenia danych i metadanych statystycznych.
Powszechny Słownik Metadanych (ang. Metadata Common Vocabulary – MCV)
specjalne repozytorium SDMX zawierające idee i odpowiednie definicje dotyczące strukturalnych i referencyjnych metadanych.
Czas trwania projektu: etap I: 28 grudnia 2010 r. – 27 czerwca 2012 r.,
etap II: 27 wrzesień 2012 r. – 26 marca 2014 r.
Struktura podręcznika
Zagadnienia kluczowe (według Eurostat-u):
projektowanie – schemat i koordynacja badań
gromadzenie danych – nowe techniki i źródła danych dla redukcji kosztów i obciążeń
estymacja – szacunki w obliczu luk w danych, prognozy, predykcja danych przeszłych.
Elementy struktury treści rozdziały
moduły tematyczne
moduły metod
Struktura podręcznika
Przedmowa
Wprowadzenie
Obserwacje ogólne Metody i jakość
Modele zarządzania jakością i ryzykiem
Dane o przebiegu procesów
Różne rodzaje badań
Europejski System Statystyczny (ESS)
GSBPM: Podstawowy Model Prowadzenia Statystyki Działalności Gospodarczej
Potrzeby użytkowników Specyfikacja potrzeb użytkowników w zakresie statystyki
działalności gospodarczej
Struktura podręcznika
Ogólne projektowanie badań
Badania powtarzalne
Projektowanie formularzy Moduł główny
Projektowanie formularza elektronicznego
Edycja podczas gromadzenia danych
Testowanie formularza
Struktura podręcznika
Rejestry i operaty statystyczne Główny moduł tematyczny.
Operaty losowania i jednostki badania w badaniach gospodarczych
Tworzenie i aktualizacja rejestrów statystycznych celem wspierania badań gospodarczych
Operaty losowania do badań gospodarczych
Projektowanie rejestrów statystycznych i operatów do badań
Jednostki statystyczne a rejestr działalności gospodarczej
Jakość rejestrów i operatów statystycznych
Struktura podręcznika
Dobór jednostek statystycznych
Dynamika zbiorowości przedsiębiorstw
Dobór prób Główny moduł tematyczny
Losowanie zbilansowane dla warstwowania wielostronnego
Losowanie podróbek dla wstępnych szacunków
Koordynacja losowania prób
Koordynacja losowania prób z wykorzystaniem schematu losowania prostego ze stałymi liczbami losowymi
Koordynacja losowania prób z wykorzystaniem schematu Poissona ze stałymi liczbami losowymi
Dobór liczb losowych gdy rozważa się koordynację losowania opartą na różnych typach jednostek.
Struktura podręcznika
Gromadzenie danych Główny moduł tematyczny
Projektowanie gromadzenia danych – część I: wybór odpowiedniej metody gromadzenia danych
Projektowanie gromadzenia danych – część II: strategie w zakresie kontaktu
Gromadzenie danych środkami mieszanymi
Techniki i narzędzia
Alokacja CATI
Gromadzenie i wykorzystanie danych wtórnych
Odpowiedzi Przetwarzanie odpowiedzi
Obciążenie odpowiedzi
Struktura podręcznika
Mikrofuzja Mikrofuzja – fuzja danych na poziomie mikro
Parowanie obiektów (łączenie rekordów)
Parowanie identyfikatorów obiektów
Nieważone parowanie charakterystyk obiektów
Ważone parowanie charakterystyk obiektów
Probabilistyczne łączenie rekordów
Podejście Fellegi–Suntera i Jaro do łączenia rekordów
Parowanie statystyczne
Metody parowania statystycznego
Rozwiązywanie konfliktów w mikrodanych
Rozdział proporcjonalny
Metody minimalnego korygowania
Korygowanie uogólnionym ilorazem
Struktura podręcznika
Kodowanie Główny moduł tematyczny
Jak zbudować bazę informacyjną
Kodowanie ręczne
Kodowanie automatyczne na zbiorach przekodowanych
Kodowanie automatyczne oparte na sieciach semantycznych
Kodowanie ze wsparciem komputerowym
Różne strategie kodowania
Pomiar jakości kodowania
Struktura podręcznika
Edycja danych statystycznych Główny moduł tematyczny
Edycja dedukcyjna
Edycja selektywna
Edycja automatyczna
Edycja ręczna
Makroedycja
Edycja danych administracyjnych
Edycja danych długookresowych
Struktura podręcznika
Imputacja Główny moduł tematyczny
Imputacja dedukcyjna
Imputacja oparta na modelach
Imputacja oparta na dawcach
Imputacja dla danych długookresowych
Metoda Little – Su
Imputacja w obliczu ograniczeń edycyjnych.
Struktura podręcznika
Ważenie i estymacja Główny moduł tematyczny
Projektowanie estymacji – pewne zagadnienia praktyczne
Kalibracja
Uogólniony estymator regresyjny (GREG)
Problem istnienia danych odstających
Estymacja wstępna z wykorzystaniem metod opartych na projekcie badania
Estymacja wstępna z wykorzystaniem metod opartych na modelu
Estymacja dla małych obszarów
Estymacja syntetyczna dla małych obszarów
Estymacja złożona dla małych obszarów
Estymacja EBLUP na poziomie obszarów w zakresie estymacji dla małych obszarów
Estymacja EBLUP na poziomie jednostek w zakresie estymacji dla małych obszarów
Metody estymacji dla małych obszarów w przypadku szeregów czasowych
Estymacja dla danych administracyjnych
Struktura podręcznika
Aspekty jakościowe Jakość statystyk
Rewizje oficjalnej statystyki gospodarczej
Makrointegracja Główny moduł tematyczny
Integracja ręczna
Metoda RAS
Metoda Stone’a
Metoda Dentona
Metoda Chow–Lina dla dezagregacji tymczasowej
Asymetria w statystyce – europejski rejestr ponadnarodowy
Struktura podręcznika
Dopasowanie sezonowe Wprowadzenie i opis ogólny
Dopasowanie sezonowe dla czasowych szeregów gospodarczych
Zagadnienie dopasowania sezonowego
Kontrola ujawniania danych Główny moduł tematyczny
Metody kontroli ujawniania danych dla tablic ilościowych
Rozpowszechnianie danych
Ocena Ocena statystycznych danych gospodarczych
Cechy podręcznika
Wykorzystanie doświadczeń różnych krajów, np.
dorobek niderlandzkiego projektu Method Series,
ocena obciążenia respondentów (ang. Perceive Response Burden) – rozwiązanie stosowane w Szwecji,
oprogramowanie CherryPi służące do automatyzacji edycji danych gospodarczych (Niderlandy),
wyniki badania satysfakcji użytkowników informacji statystycznych według ich grup oraz kategorii tychże informacji (Grecja).
Cechy podręcznika
Strona internetowa projektu http://www.cros-portal.eu/content/handbook-methodology-
modern-business-statistics
pierwszy kontakt czytelnika z modułem obywa się poprzez streszczenie
każdy moduł podręcznika zawarty jest w osobnym pliku pdf, opatrzonym metryczką
zawiera nie tylko tekst stworzonego podręcznika ale i związany z nim słownik oraz najważniejszą dokumentację projektu.
Polski wkład do projektu
Prace prowadził Urząd Statystyczny w Poznaniu przy wsparciu CIS GUS
Polska jako lider i autor Projektowanie formularzy
Odpowiedzi
Polska jako autor (lub współautor) Obserwacje ogólne (lider – Holandia) o moduł poświęcony różnym rodzajom badań statystycznych
Ważenie i estymacja (lider – Włochy) o kalibracja
o problem istnienia obserwacji odstających
o estymacja syntetyczna dla małych obszarów
o estymacja złożona dla małych obszarów
Polski wkład do projektu
Polska jako recenzent (współrecenzent) potrzeby użytkowników (lider – Grecja, w II fazie – Holandia),
główny moduł tematyczny
dobór prób (lider – Norwegia) – Losowanie zbilansowane dla warstwowania wielostronnego
gromadzenie danych (lider – Włochy) – gromadzenie i wykorzystanie danych wtórnych
rozpowszechnianie danych (lider – Holandia) – główny moduł tematyczny
Założenia seminariów
Seminaria obejmują wybrane aspekty badań gospodarczych ujęte w podręczniku, przydatne w codziennej pracy statystycznej. Selekcji dokonano uwzględniając ocenę potrzeb w tym zakresie oraz zakres czasowy.
Z uwagi na polskie realia w niektórych przypadkach poruszono pewne dodatkowe zagadnienia, istotne w przypadku praktyki naszych badań statystycznych.
Prelegenci
mgr Paweł Lańduch starszy informatyk w Ośrodku Statystyki Krótkookresowej
Urzędu Statystycznego w Poznaniu, doktorant w Kolegium Analiz Ekonomicznych Szkoły Głównej Handlowej w Warszawie
dr hab. Andrzej Młodak konsultant w Ośrodku Statystyki Małych Obszarów Urzędu
Statystycznego w Poznaniu, prof. nadzw. Państwowej Wyższej Szkoły Zawodowej im. Prezydenta Stanisława Wojciechowskiego w Kaliszu
Tematyczny zakres seminariów
Czynniki rozwojowe i projektowanie badań
Ogólne zasady projektowania badań (Paweł Lańduch)
Dynamika zbiorowości przedsiębiorstw (Paweł Lańduch)
Projektowanie i testowanie formularzy (Paweł Lańduch)
Przetwarzanie i kontrola ujawniania danych
Mikrofuzja (Andrzej Młodak)
Edycja i podstawy imputacji danych (Andrzej Młodak)
Kontrola ujawniania danych (Paweł Lańduch)
Dalsze plany
Tematy przygotowywane przez mgr Monikę Natkowską (kierownika Oddziału w Kaliszu Urzędu Statystycznego w Poznaniu):
Podstawowe modele statystyki działalności gospodarczej: Model Jakości i Ryzyka w Odniesieniu do Obiektów (OQRM) oraz GSBPM
Potrzeby użytkowników
Gromadzenie danych
Przetwarzanie i obciążenie odpowiedzi.
Inne zagadnienia Ramowa Regulacja Integrująca Statystykę Działalności
Gospodarczej (FRIBS) a projekt MeMoBuSt (P. Lańduch)
Rejestry i operaty statystyczne (P. Lańduch)
Spójność i porównywalność danych (A. Młodak)
Pozostałe aspekty udostępniania i publikacji danych (A. Młodak).
Literatura uzupełniająca
Snijkers G., Haraldsen G., Jones J., Willimack D. (2013), Designing and Conducting Business Surveys, Wiley Series in Survey Methodology, John Wiley & Sons, Inc., Hoboken, New Jersey.
De Waal T., Pannekoek J., Scholtus S, (2011), Handbook of Statistical Data Editing and Imputation, Wiley Handbooks in Survey Methodology, John Wiley & Sons, Inc., Hoboken, New Jersey.
Hundepool A., Domingo-Ferrer J., Franconi L., Giessing S., Nordholt E. S., Spicer K., de Wolf P.-P. (2012), Statistical Disclosure Control, Wiley Series in Survey Methodology, John Wiley & Sons, Inc. Hoboken, New Jersey.
Recommended