To jest stara wersja strony!
III. Pobieranie wyników surowych i danych o uczniach
Przy pomocy funkcji pobierz_wyniki_surowe(rodzajEgzaminu, lata, …) z pakietu EWDdane (która w istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji pobierz_czesc_egzaminu() z pakietu ZPD) pobierane są do repozytorium skalowanieEgzaminów dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia, które osoby zaliczają się podczas skalowania do populacji wzorcowej.
Egzamin gimnazjalny 2005
Egzamin gimnazjalny z 2005 r. stanowi ciężki przypadek. Na potrzeby wyliczania EWD występuje on tylko i wyłącznie jako egzamin, który pisali drugoroczni uczniowie techników, zdający maturę w 2010 r. Jest to niewielka grupa (niecałe 9 tys. osób), której wyniki zostały pozyskane z OKE. Jednak aby mieć lepszą podstawę do szacowania parametrów modelu skalowania oraz móc wyniki wyskalowane przedstawić na skali standardowej, w której punktem odniesienia są wszyscy zdający, musimy wykorzystać wyniki populacyjne, pochodzące z CKE. W związku z tym w 2015 r. wykonana została następująca procedura:
Pobrano dane surowe z CKE (dla egzaminu gimnazjalnego 2005 funkcja pobierz_wyniki_surowe() domyślnie pobiera dane CKE), a następnie wyskalowano na nich model i zapisano wyniki do bazy.
Następnie do zapisanych już danych surowych ręcznie zostały pobrane i dopisane dane z OKE. Skalowanie odpalone zostało powtórnie na połączonych danych, przy czym, jako że parametry modelu i oszacowania umiejętności dla danych CKE były już zapisane w bazie, oznaczało to wyliczenie oszacowań jedynie dla danych z OKE. Dopisano je do bazy.
Na przyszłość poleca się egzaminu gimnazjalnego 2005 nie ruszać.
Sposób przechowywania (zapisu) wyników surowych
Wyniki surowe egzaminów pobierane są do repozytorium skalowanieEgzaminow/dane surowe i przechowywane tam w plikach formatu RData w następującej strukturze:
Wszystkie rodzaje egzaminów przechowywane są w jednym katalogu, bez podziału na podkatalogi.
Każdy rocznik danego egzaminu przechowywany jest w oddzielnym pliku o nazwie postaci: 'nazwa egzaminu rocznik.RData'.
Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu:
Ich nazwy odpowiadają prefiksom tych części w bazie, w tablicy sl_czesci_egzaminow.
Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję
pobierz_czesc_egzaminu() z pakietu
ZPD.
Mają przypisane klasy (oprócz 'data.frame'): 'czescEgzaminu' i 'wynikiSurowe'.
Mają przypisany atrybut 'dataPobrania'.
Sposób przechowywanie (zapisu) danych o uczniach (i szkołach)
Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/dane surowe i przechowywane tam w plikach formatu RData w następującej strukturze:
Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'.
W każdym pliku znajduje się obiekt o nazwie postaci 'prefiksKontekstowe' gdzie 'prefiks' przyjmuje wartości: 's' - sprawdzian, 'g' - egzamin gimnazjalny, 'm' - matura. Obiekt ten:
Jest ramką danych, zwracaną przez funkcję pobierz_dane_kontekstowe.
Ma przypisaną klasę (oprócz 'data.frame'): 'daneKontekstowe'.
Ma przypisany atrybut 'dataPobrania'.