Narzędzia użytkownika

Narzędzia witryny


ewdprocedurypobieraniesurowych

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
Ostatnia wersja Both sides next revision
ewdprocedurypobieraniesurowych [2015/05/31 14:59]
t.zoltak [III. Pobieranie wyników surowych i danych o⁠ uczniach]
ewdprocedurypobieraniesurowych [2015/12/21 23:31]
t.zoltak [Sposób przechowywanie (zapisu) danych o⁠ uczniach (i⁠ szkołach)]
Linia 1: Linia 1:
 =====III. Pobieranie wyników surowych i danych o⁠ uczniach===== =====III. Pobieranie wyników surowych i danych o⁠ uczniach=====
  
-Przy pomocy funkcji **//​pobierz_wyniki_surowe(rodzajEgzaminu,​ lata, ...)//** z pakietu EWDdane (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ZPD) pobierane są do repozytorium //​skalowanieEgzaminów//​ dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia,​ które osoby zaliczają się podczas skalowania do populacji //​wzorcowej//​. +Przy pomocy funkcji **//​pobierz_wyniki_surowe(rodzajEgzaminu,​ lata, ...)//** z pakietu ​[[ewdpakiety#​ewddane|EWDdane]] (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ​[[r_zpd|ZPD]]) pobierane są do repozytorium //​skalowanieEgzaminów//​ dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia,​ które osoby zaliczają się podczas skalowania do populacji //​wzorcowej//​. 
-====Pobieranie i⁠ przechowywanie ​wyników surowych====+ 
 + 
 +====Sposób przechowywania (zapisu) ​wyników surowych====
  
 Wyniki surowe egzaminów pobierane są do repozytorium //​skalowanieEgzaminow/​dane surowe// i⁠ przechowywane tam w plikach formatu RData w następującej strukturze: Wyniki surowe egzaminów pobierane są do repozytorium //​skalowanieEgzaminow/​dane surowe// i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:
Linia 10: Linia 12:
   * Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu:   * Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu:
     * Ich nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//​.     * Ich nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//​.
-    * Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ZPD.+    * Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ​[[r_zpd|ZPD]].
     * Mają przypisane klasy (oprócz '​data.frame'​):​ '​czescEgzaminu'​ i '​wynikiSurowe'​.     * Mają przypisane klasy (oprócz '​data.frame'​):​ '​czescEgzaminu'​ i '​wynikiSurowe'​.
     * Mają przypisany atrybut '​dataPobrania'​.     * Mają przypisany atrybut '​dataPobrania'​.
  
-**Realizacja**funkcja **//pobierz_wyniki_surowe(rodzajEgzaminu,​ lata, ...)//** z pakietu EWDdanektóra w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji ​//pobierz_czesc_egzaminu()// z⁠ pakietu ZPD.+====Sposób przechowywanie (zapisu) danych o⁠ uczniach (i⁠ szkołach)==== 
 + 
 +Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/​dane surowe i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:​ 
 + 
 +  ​Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'​. 
 +  ​W każdym pliku znajduje się obiekt o nazwie postaci '​prefiksKontekstowe'​ gdzie '​prefiks'​ przyjmuje wartości'​s'​ - sprawdzian, '​g'​ - egzamin gimnazjalny,​ '​m'​ - matura. Obiekt ten: 
 +    ​Jest ramką danych, zwracaną przez funkcję ​//pobierz_dane_kontekstowe//​. 
 +    * Ma przypisaną klasę ​(oprócz 'data.frame'​):​ '​daneKontekstowe'​. 
 +    * Ma przypisany atrybut '​dataPobrania'​. 
 + 
 +====Egzamin gimnazjalny 2005==== 
 + 
 +Egzamin gimnazjalny z 2005 r. stanowi ciężki przypadek. Na potrzeby wyliczania EWD występuje on tylko i wyłącznie jako egzamin, który pisali ​//drugoroczni//​ uczniowie technikówzdający maturę w 2010 r. Jest to niewielka grupa (niecałe 9 tys. osób), której wyniki zostały pozyskane z OKE. Jednak aby mieć lepszą podstawę do szacowania parametrów modelu skalowania oraz móc wyniki wyskalowane przedstawić na skali standardowej,​ w której punktem odniesienia są wszyscy zdający, musimy wykorzystać wyniki populacyjne,​ pochodzące z CKE. W związku z tym w 2015 r. wykonana została następująca procedura:​ 
 + 
 +  - Pobrano dane surowe z CKE (dla egzaminu gimnazjalnego 2005 funkcja ​//pobierz_wyniki_surowe()// domyślnie pobiera dane CKE), a następnie wyskalowano na nich model i zapisano wyniki do bazy. 
 +  - Następnie do zapisanych już danych surowych //​ręcznie//​ zostały pobrane i dopisane dane OKE. Skalowanie odpalone zostało powtórnie na połączonych danych, przy czym, jako że parametry modelu i oszacowania umiejętności dla danych CKE były już zapisane w bazie, oznaczało to wyliczenie oszacowań jedynie dla danych z OKE. Dopisano je do bazy.
  
-====Pobieranie i przechowywanie danych o⁠ uczniach (i⁠ szkołach)====+Na przyszłość poleca się egzaminu gimnazjalnego 2005 nie ruszać.
  
ewdprocedurypobieraniesurowych.txt · ostatnio zmienione: 2017/08/05 15:59 przez t.zoltak