Narzędzia użytkownika

Narzędzia witryny


ewdprocedurypobieraniesurowych

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
ewdprocedurypobieraniesurowych [2015/05/31 15:00]
t.zoltak [Pobieranie i⁠ przechowywanie wyników surowych]
ewdprocedurypobieraniesurowych [2017/08/05 15:59] (aktualna)
t.zoltak [Egzamin gimnazjalny 2005]
Linia 1: Linia 1:
 =====III. Pobieranie wyników surowych i danych o⁠ uczniach===== =====III. Pobieranie wyników surowych i danych o⁠ uczniach=====
  
-Przy pomocy funkcji **//​pobierz_wyniki_surowe(rodzajEgzaminu,​ lata, ...)//** z pakietu EWDdane (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ZPD) pobierane są do repozytorium //​skalowanieEgzaminów//​ dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia,​ które osoby zaliczają się podczas skalowania do populacji //​wzorcowej//​.+Przy pomocy funkcji **//​pobierz_wyniki_surowe(rodzajEgzaminu,​ lata, ...)//** z pakietu ​[[ewdpakiety#​ewddane|EWDdane]] (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ​[[r_zpd|ZPD]]) pobierane są do repozytorium //​skalowanieEgzaminów//​ dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia,​ które osoby zaliczają się podczas skalowania do populacji //​wzorcowej//​. 
 + 
 ====Sposób przechowywania (zapisu) wyników surowych==== ====Sposób przechowywania (zapisu) wyników surowych====
  
Linia 10: Linia 12:
   * Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu:   * Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu:
     * Ich nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//​.     * Ich nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//​.
-    * Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ZPD.+    * Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ​[[r_zpd|ZPD]].
     * Mają przypisane klasy (oprócz '​data.frame'​):​ '​czescEgzaminu'​ i '​wynikiSurowe'​.     * Mają przypisane klasy (oprócz '​data.frame'​):​ '​czescEgzaminu'​ i '​wynikiSurowe'​.
     * Mają przypisany atrybut '​dataPobrania'​.     * Mają przypisany atrybut '​dataPobrania'​.
  
-====Pobieranie i przechowywanie danych o⁠ uczniach (i⁠ szkołach)====+====Sposób ​przechowywanie ​(zapisu) ​danych o⁠ uczniach (i⁠ szkołach)==== 
 + 
 +Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/​dane surowe i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:​ 
 + 
 +  * Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'​. 
 +  * W każdym pliku znajduje się obiekt o nazwie postaci '​prefiksKontekstowe'​ gdzie '​prefiks'​ przyjmuje wartości: '​s'​ - sprawdzian, '​g'​ - egzamin gimnazjalny,​ '​m'​ - matura. Obiekt ten: 
 +    * Jest ramką danych, zwracaną przez funkcję //​pobierz_dane_kontekstowe//​. 
 +    * Ma przypisaną klasę (oprócz '​data.frame'​):​ '​daneKontekstowe'​. 
 +    * Ma przypisany atrybut '​dataPobrania'​. 
 + 
 +====Egzamin gimnazjalny 2005==== 
 + 
 +Egzamin gimnazjalny z 2005 r. stanowi ciężki przypadek. Na potrzeby wyliczania EWD występuje on tylko i wyłącznie jako egzamin, który pisali //​drugoroczni//​ uczniowie techników, zdający maturę w 2010 r. Jest to niewielka grupa (niecałe 9 tys. osób), której wyniki zostały pozyskane z OKE. Jednak aby mieć lepszą podstawę do szacowania parametrów modelu skalowania oraz móc wyniki wyskalowane przedstawić na skali standardowej,​ w której punktem odniesienia są wszyscy zdający, musimy wykorzystać wyniki populacyjne,​ pochodzące z CKE. W związku z tym w 2015 r. wykonana została następująca procedura:​ 
 + 
 +  - Pobrano dane surowe z CKE (dla egzaminu gimnazjalnego 2005 funkcja //​pobierz_wyniki_surowe()//​ domyślnie pobiera dane CKE), a następnie wyskalowano na nich model i zapisano wyniki do bazy. 
 +  - Następnie do zapisanych już danych surowych //​ręcznie//​ zostały pobrane i dopisane dane z OKE. Skalowanie odpalone zostało powtórnie na połączonych danych, przy czym, jako że parametry modelu i oszacowania umiejętności dla danych CKE były już zapisane w bazie, oznaczało to wyliczenie oszacowań jedynie dla danych z OKE. Dopisano je do bazy. 
 + 
 +Na przyszłość poleca się egzaminu gimnazjalnego 2005 w wersji //z OKE// nie ruszać.
  
ewdprocedurypobieraniesurowych.1433077246.txt.gz · ostatnio zmienione: 2015/05/31 15:00 przez t.zoltak