Narzędzia użytkownika

Narzędzia witryny


ewdprocedurypobieraniesurowych

III. Pobieranie wyników surowych i danych o⁠ uczniach

Przy pomocy funkcji pobierz_wyniki_surowe(rodzajEgzaminu, lata, …) z pakietu EWDdane (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji pobierz_czesc_egzaminu() z⁠ pakietu ZPD) pobierane są do repozytorium skalowanieEgzaminów dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia, które osoby zaliczają się podczas skalowania do populacji wzorcowej.

Sposób przechowywania (zapisu) wyników surowych

Wyniki surowe egzaminów pobierane są do repozytorium skalowanieEgzaminow/dane surowe i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:

 • Wszystkie rodzaje egzaminów przechowywane są w⁠ jednym katalogu, bez podziału na podkatalogi.
 • Każdy rocznik danego egzaminu przechowywany jest w oddzielnym pliku o⁠ nazwie postaci: 'nazwa egzaminu rocznik.RData'.
 • Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu:
  • Ich nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy sl_czesci_egzaminow.
  • Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję pobierz_czesc_egzaminu() z⁠ pakietu ZPD.
  • Mają przypisane klasy (oprócz 'data.frame'): 'czescEgzaminu' i 'wynikiSurowe'.
  • Mają przypisany atrybut 'dataPobrania'.

Sposób przechowywanie (zapisu) danych o⁠ uczniach (i⁠ szkołach)

Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/dane surowe i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:

 • Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'.
 • W każdym pliku znajduje się obiekt o nazwie postaci 'prefiksKontekstowe' gdzie 'prefiks' przyjmuje wartości: 's' - sprawdzian, 'g' - egzamin gimnazjalny, 'm' - matura. Obiekt ten:
  • Jest ramką danych, zwracaną przez funkcję pobierz_dane_kontekstowe.
  • Ma przypisaną klasę (oprócz 'data.frame'): 'daneKontekstowe'.
  • Ma przypisany atrybut 'dataPobrania'.

Egzamin gimnazjalny 2005

Egzamin gimnazjalny z 2005 r. stanowi ciężki przypadek. Na potrzeby wyliczania EWD występuje on tylko i wyłącznie jako egzamin, który pisali drugoroczni uczniowie techników, zdający maturę w 2010 r. Jest to niewielka grupa (niecałe 9 tys. osób), której wyniki zostały pozyskane z OKE. Jednak aby mieć lepszą podstawę do szacowania parametrów modelu skalowania oraz móc wyniki wyskalowane przedstawić na skali standardowej, w której punktem odniesienia są wszyscy zdający, musimy wykorzystać wyniki populacyjne, pochodzące z CKE. W związku z tym w 2015 r. wykonana została następująca procedura:

 1. Pobrano dane surowe z CKE (dla egzaminu gimnazjalnego 2005 funkcja pobierz_wyniki_surowe() domyślnie pobiera dane CKE), a następnie wyskalowano na nich model i zapisano wyniki do bazy.
 2. Następnie do zapisanych już danych surowych ręcznie zostały pobrane i dopisane dane z OKE. Skalowanie odpalone zostało powtórnie na połączonych danych, przy czym, jako że parametry modelu i oszacowania umiejętności dla danych CKE były już zapisane w bazie, oznaczało to wyliczenie oszacowań jedynie dla danych z OKE. Dopisano je do bazy.

Na przyszłość poleca się egzaminu gimnazjalnego 2005 w wersji z OKE nie ruszać.

ewdprocedurypobieraniesurowych.txt · ostatnio zmienione: 2017/08/05 15:59 przez t.zoltak