Narzędzia użytkownika

Narzędzia witryny


ewdprocedurypobieraniesurowych

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
Ostatnia wersja Both sides next revision
ewdprocedurypobieraniesurowych [2015/05/26 21:45]
t.zoltak [Pobieranie i⁠ przechowywanie wyników surowych]
ewdprocedurypobieraniesurowych [2015/12/21 23:31]
t.zoltak [Sposób przechowywanie (zapisu) danych o⁠ uczniach (i⁠ szkołach)]
Linia 1: Linia 1:
 =====III. Pobieranie wyników surowych i danych o⁠ uczniach===== =====III. Pobieranie wyników surowych i danych o⁠ uczniach=====
  
-====Pobieranie i⁠ przechowywanie ​wyników surowych====+Przy pomocy funkcji **//​pobierz_wyniki_surowe(rodzajEgzaminu,​ lata, ...)//** z pakietu [[ewdpakiety#​ewddane|EWDdane]] (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji //​pobierz_czesc_egzaminu()//​ z⁠ pakietu [[r_zpd|ZPD]]) pobierane są do repozytorium //​skalowanieEgzaminów//​ dane nt. wyników surowych egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia,​ które osoby zaliczają się podczas skalowania do populacji //​wzorcowej//​. 
 + 
 + 
 +====Sposób przechowywania (zapisu) ​wyników surowych====
  
 Wyniki surowe egzaminów pobierane są do repozytorium //​skalowanieEgzaminow/​dane surowe// i⁠ przechowywane tam w plikach formatu RData w następującej strukturze: Wyniki surowe egzaminów pobierane są do repozytorium //​skalowanieEgzaminow/​dane surowe// i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:
  
-  ​Wszystkie rodzaje egzaminów przechowywane są w⁠ jednym katalogu, bez podziału na podkatalogi. +  ​Wszystkie rodzaje egzaminów przechowywane są w⁠ jednym katalogu, bez podziału na podkatalogi. 
-  ​Każdy rocznik danego egzaminu przechowywany jest w oddzielnym pliku o⁠ nazwie postaci: '//​nazwa egzaminu rocznik.RData//'​. +  ​Każdy rocznik danego egzaminu przechowywany jest w oddzielnym pliku o⁠ nazwie postaci: '//​nazwa egzaminu rocznik.RData//'​. 
-  ​Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu, których ​nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//​, a⁠ struktura ​ramek jest taka sama, jak struktura wartości ​działania funkcji ​//​pobierz_czesc_egzaminu()//​ z⁠ pakietu ZPD.+  ​Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu
 +    * Ich nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//​
 +    * Ich wewnętrzna ​struktura jest taka sama, jak struktura wartości ​zwracanej przez funkcję ​//​pobierz_czesc_egzaminu()//​ z⁠ pakietu ​[[r_zpd|ZPD]]. 
 +    * Mają przypisane klasy (oprócz '​data.frame'​):​ '​czescEgzaminu'​ i '​wynikiSurowe'​. 
 +    * Mają przypisany atrybut '​dataPobrania'​. 
 + 
 +====Sposób przechowywanie (zapisu) danych o⁠ uczniach (i⁠ szkołach)==== 
 + 
 +Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/​dane surowe i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:​ 
 + 
 +  * Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'​. 
 +  * W każdym pliku znajduje się obiekt o nazwie postaci '​prefiksKontekstowe'​ gdzie '​prefiks'​ przyjmuje wartości: '​s'​ - sprawdzian, '​g'​ - egzamin gimnazjalny,​ '​m'​ - matura. Obiekt ten: 
 +    * Jest ramką danych, zwracaną przez funkcję //​pobierz_dane_kontekstowe//​. 
 +    * Ma przypisaną klasę (oprócz '​data.frame'​):​ '​daneKontekstowe'​. 
 +    * Ma przypisany atrybut '​dataPobrania'​. 
 + 
 +====Egzamin gimnazjalny 2005==== 
 + 
 +Egzamin gimnazjalny z 2005 r. stanowi ciężki przypadek. Na potrzeby wyliczania EWD występuje on tylko i wyłącznie jako egzamin, który pisali //​drugoroczni//​ uczniowie techników, zdający maturę w 2010 r. Jest to niewielka grupa (niecałe 9 tys. osób), której wyniki zostały pozyskane z OKE. Jednak aby mieć lepszą podstawę do szacowania parametrów modelu skalowania oraz móc wyniki wyskalowane przedstawić na skali standardowej,​ w której punktem odniesienia są wszyscy zdający, musimy wykorzystać wyniki populacyjne,​ pochodzące z CKE. W związku z tym w 2015 r. wykonana została następująca procedura:
  
-Służy do tego funkcja //nazwa_funkcji(rodzajEgzaminu,​ lata)// z pakietu EWDdanektóra w⁠ istocie jest prostym „zapętleniem” odwołującym się do funkcji ​//pobierz_czesc_egzaminu()// z⁠ pakietu ZPD.+  - Pobrano dane surowe z CKE (dla egzaminu gimnazjalnego 2005 funkcja //pobierz_wyniki_surowe()// domyślnie pobiera dane CKE)a następnie wyskalowano na nich model i zapisano wyniki do bazy. 
 +  - Następnie do zapisanych już danych surowych ​//ręcznie// zostały pobrane i dopisane dane OKE. Skalowanie odpalone zostało powtórnie na połączonych danych, przy czym, jako że parametry modelu i oszacowania umiejętności dla danych CKE były już zapisane w bazie, oznaczało to wyliczenie oszacowań jedynie dla danych z OKE. Dopisano je do bazy.
  
-====Pobieranie i przechowywanie danych o⁠ uczniach (i⁠ szkołach)====+Na przyszłość poleca się egzaminu gimnazjalnego 2005 nie ruszać.
  
ewdprocedurypobieraniesurowych.txt · ostatnio zmienione: 2017/08/05 15:59 przez t.zoltak