Różnice między wybraną wersją a wersją aktualną.
Both sides previous revision Poprzednia wersja Nowa wersja | Poprzednia wersja | ||
ewdprocedurypobieraniesurowych [2015/05/26 21:54] t.zoltak [Pobieranie i przechowywanie wyników surowych] |
ewdprocedurypobieraniesurowych [2017/08/05 15:59] (aktualna) t.zoltak [Egzamin gimnazjalny 2005] |
||
---|---|---|---|
Linia 1: | Linia 1: | ||
=====III. Pobieranie wyników surowych i danych o uczniach===== | =====III. Pobieranie wyników surowych i danych o uczniach===== | ||
- | ====Pobieranie i przechowywanie wyników surowych==== | + | Przy pomocy funkcji **//pobierz_wyniki_surowe(rodzajEgzaminu, lata, ...)//** z pakietu [[ewdpakiety#ewddane|EWDdane]] (która w istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji //pobierz_czesc_egzaminu()// z pakietu [[r_zpd|ZPD]]) pobierane są do repozytorium //skalowanieEgzaminów// dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia, które osoby zaliczają się podczas skalowania do populacji //wzorcowej//. |
+ | |||
+ | |||
+ | ====Sposób przechowywania (zapisu) wyników surowych==== | ||
Wyniki surowe egzaminów pobierane są do repozytorium //skalowanieEgzaminow/dane surowe// i przechowywane tam w plikach formatu RData w następującej strukturze: | Wyniki surowe egzaminów pobierane są do repozytorium //skalowanieEgzaminow/dane surowe// i przechowywane tam w plikach formatu RData w następującej strukturze: | ||
Linia 9: | Linia 12: | ||
* Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu: | * Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu: | ||
* Ich nazwy odpowiadają prefiksom tych części w bazie, w tablicy //sl_czesci_egzaminow//. | * Ich nazwy odpowiadają prefiksom tych części w bazie, w tablicy //sl_czesci_egzaminow//. | ||
- | * Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję //pobierz_czesc_egzaminu()// z pakietu ZPD. | + | * Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję //pobierz_czesc_egzaminu()// z pakietu [[r_zpd|ZPD]]. |
- | * Mają przypisane klasy "czescEgzaminu" i "wynikiSurowe". | + | * Mają przypisane klasy (oprócz 'data.frame'): 'czescEgzaminu' i 'wynikiSurowe'. |
- | * Mają przypisany atrybut "dataPobrania". | + | * Mają przypisany atrybut 'dataPobrania'. |
+ | |||
+ | ====Sposób przechowywanie (zapisu) danych o uczniach (i szkołach)==== | ||
+ | |||
+ | Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/dane surowe i przechowywane tam w plikach formatu RData w następującej strukturze: | ||
+ | |||
+ | * Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'. | ||
+ | * W każdym pliku znajduje się obiekt o nazwie postaci 'prefiksKontekstowe' gdzie 'prefiks' przyjmuje wartości: 's' - sprawdzian, 'g' - egzamin gimnazjalny, 'm' - matura. Obiekt ten: | ||
+ | * Jest ramką danych, zwracaną przez funkcję //pobierz_dane_kontekstowe//. | ||
+ | * Ma przypisaną klasę (oprócz 'data.frame'): 'daneKontekstowe'. | ||
+ | * Ma przypisany atrybut 'dataPobrania'. | ||
+ | |||
+ | ====Egzamin gimnazjalny 2005==== | ||
+ | |||
+ | Egzamin gimnazjalny z 2005 r. stanowi ciężki przypadek. Na potrzeby wyliczania EWD występuje on tylko i wyłącznie jako egzamin, który pisali //drugoroczni// uczniowie techników, zdający maturę w 2010 r. Jest to niewielka grupa (niecałe 9 tys. osób), której wyniki zostały pozyskane z OKE. Jednak aby mieć lepszą podstawę do szacowania parametrów modelu skalowania oraz móc wyniki wyskalowane przedstawić na skali standardowej, w której punktem odniesienia są wszyscy zdający, musimy wykorzystać wyniki populacyjne, pochodzące z CKE. W związku z tym w 2015 r. wykonana została następująca procedura: | ||
- | Służy do tego funkcja //nazwa_funkcji(rodzajEgzaminu, lata)// z pakietu EWDdane, która w istocie jest prostym „zapętleniem” odwołującym się do funkcji //pobierz_czesc_egzaminu()// z pakietu ZPD. | + | - Pobrano dane surowe z CKE (dla egzaminu gimnazjalnego 2005 funkcja //pobierz_wyniki_surowe()// domyślnie pobiera dane CKE), a następnie wyskalowano na nich model i zapisano wyniki do bazy. |
+ | - Następnie do zapisanych już danych surowych //ręcznie// zostały pobrane i dopisane dane z OKE. Skalowanie odpalone zostało powtórnie na połączonych danych, przy czym, jako że parametry modelu i oszacowania umiejętności dla danych CKE były już zapisane w bazie, oznaczało to wyliczenie oszacowań jedynie dla danych z OKE. Dopisano je do bazy. | ||
- | ====Pobieranie i przechowywanie danych o uczniach (i szkołach)==== | + | Na przyszłość poleca się egzaminu gimnazjalnego 2005 w wersji //z OKE// nie ruszać. |