Narzędzia użytkownika

Narzędzia witryny


ewdprocedurypobieraniewyskalowanych

VI. Łączenie wyników wyskalowanych w zbiory do obliczania EWD

  1. Przy pomocy funkcji pobierz_wyniki_wyskalowane(rodzajEgzaminu, lata, …) z pakietu EWDdane (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji pobierz_oszacowania_uczniow() z⁠ pakietu ZPD) pobierane są do repozytorium skalowanieEgzaminów dane nt. wyskalowanych wyników egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia, które osoby i szkoły powinny zostać uwzględnione przy estymacji modeli EWD.
  2. W ramach skryptów służących do estymacji modeli EWD (p. obliczanie wskaźników). jednorazowo wywołuje się funkcję przygotuj_dane_do_ewd(katalogZDanymi, typSzkolu, lataDo, liczbaRocznikow, wydluzenie) z pakietu EWDdane, przy czym:
    • Argument katalogZDanymi wskazuje na katalog, w którym zostały zapisane wyniki surowe egzaminów (jednoroczne modele EWD gimnazjów) lub katalog, w którym zostały zapisane wyskalowane wyniki egzaminów (trzyletnie modele EWD gimnazjów, LO i T oraz jednoroczne modele EWD LO i T).
    • Argument typSzkoly przyjmuje wartości 'gimn.', 'LO' lub 'T'.
    • Argument lataDo wskazuje na ostatni rocznik absolwentów, który ma być zawarty w zbiorze (w ogólności funkcji można podać go jako wektor - wtedy utworzonych zostanie wiele zbiorów, każdy dla innego z podanych okresów).
    • Argumenty liczbaRocznikow i wydluzenie wskazują odpowiednio, jak wiele roczników ma obejmować zbiór (w szczególności 1 dla jednorocznych wskaźników EWD lub 3 dla trzyletnich wskaźników EWD) oraz jaka jest maksymalna liczba lat, o którą może być wydłużony tok kształcenia uczniów, którzy znajdą się w zbiorze (np. 0 - bez wydłużonych, 1 - maksymalnie drugoroczni).
    • W przygotowanym zbiorze (zbiorach) znajdą się tylko te osoby, które w zbiorach danych kontekstowych oznaczone są jako należące do populacji wzorcowej na wyjściu (zmienna populacja_wy), w odniesieniu do egzaminu przeprowadzanego na koniec danego etapu kształcenia (w odpowiednim roku) i jako należące do populacji wzorcowej na wejściu (zmienna populacja_we), w odniesieniu do egzaminu przeprowadzanego na koniec poprzedniego etapu kształcenia (w odpowiednim roku).
    • W przygotowanym zbiorze (zbiorach) znajdą się uczniowie (spełniający warunek opisany powyżej) wszystkich szkół, w tym dla dorosłych, specjalnych itp., z tym że ich łatwą identyfikację umożliwia zmienna pomin_szkole znajdująca się (obok innych zmiennych charakteryzujących szkoły) w przygotowanym zbiorze (zbiorach).

Sposób przechowywania (zapisu) wyników wyskalowanych

Wyniki surowe egzaminów pobierane są do repozytorium skalowanieEgzaminow/dane wyskalowane i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:

  • Wszystkie rodzaje egzaminów przechowywane są w⁠ jednym katalogu, bez podziału na podkatalogi.
  • Każdy rocznik danego egzaminu przechowywany jest w oddzielnym pliku o⁠ nazwie postaci: 'nazwa egzaminu rocznik.RData'.
  • Każdy plik w formacie RData zawiera pojedynczą ramkę danych, w której przechowywane są wyskalowane wyniki wszystkich części danego egzaminu z danego roku:
    • Nazwa ramki jest postaci: [sgm]Wyskalowane.
    • Struktura ramki danych jest niemal taka sama, jak struktura wartości zwracanej przez funkcję pobierz_oszacowania_uczniow() z⁠ pakietu ZPD (w stosunku do wspomnianej funkcji w ramce danych brak jest kolumn id_testu, estymacja i id_szkoly).
    • Ma przypisaną klasę (oprócz 'data.frame'): 'wynikiWyskalowane'.
    • Ma przypisany atrybut 'skale', będący ramką danych o strukturze takiej samej, jak struktura wartości zwracanej przez funkcję pobierz_skale() z⁠ pakietu ZPD. Zawiera ona informacje o skalach, do których przypisane są wyskalowane wyniki.
    • Ma przypisany atrybut 'dataPobrania'.

Sposób przechowywanie (zapisu) danych o⁠ uczniach (i⁠ szkołach)

Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/dane surowe i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:

  • Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'.
  • W każdym pliku znajduje się obiekt o nazwie postaci 'prefiksKontekstowe' gdzie 'prefiks' przyjmuje wartości: 's' - sprawdzian, 'g' - egzamin gimnazjalny, 'm' - matura. Obiekt ten:
    • Jest ramką danych, zwracaną przez funkcję pobierz_dane_kontekstowe.
    • Ma przypisaną klasę (oprócz 'data.frame'): 'daneKontekstowe'.
    • Ma przypisany atrybut 'dataPobrania'.
ewdprocedurypobieraniewyskalowanych.txt · ostatnio zmienione: 2016/11/03 14:48 przez t.zoltak