Narzędzia użytkownika

Narzędzia witryny


ewdprocedurypobieraniesurowych

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Nowa wersja
Poprzednia wersja
Ostatnia wersja Both sides next revision
ewdprocedurypobieraniesurowych [2015/05/26 21:44]
t.zoltak utworzono
ewdprocedurypobieraniesurowych [2015/12/21 23:31]
t.zoltak [Sposób przechowywanie (zapisu) danych o⁠ uczniach (i⁠ szkołach)]
Linia 1: Linia 1:
 =====III. Pobieranie wyników surowych i danych o⁠ uczniach===== =====III. Pobieranie wyników surowych i danych o⁠ uczniach=====
  
-====Pobieranie i⁠ przechowywanie ​wyników surowych====+Przy pomocy funkcji **//​pobierz_wyniki_surowe(rodzajEgzaminu,​ lata, ...)//** z pakietu [[ewdpakiety#​ewddane|EWDdane]] (która w⁠ istocie jest dosyć prostym „zapętleniem” odwołującym się do funkcji //​pobierz_czesc_egzaminu()//​ z⁠ pakietu [[r_zpd|ZPD]]) pobierane są do repozytorium //​skalowanieEgzaminów//​ dane nt. wyników surowych ​egzaminów oraz informacje kontekstowe - tj. informacje o uczniach i szkołach, użyteczne np. do stwierdzenia,​ które osoby zaliczają się podczas skalowania do populacji //​wzorcowej//​.
  
-Wyniki surowe egzaminów pobierane są do repozytorium //​skalowanieEgzaminow/​dane_surowe//​ i⁠ przechowywane tam w plikach formatu RData w następującej strukturze: 
  
-  - Wszystkie rodzaje egzaminów przechowywane są w⁠ jednym katalogu, bez podziału na podkatalogi. +====Sposób przechowywania ​(zapisuwyników surowych====
-  - Każdy rocznik danego egzaminu przechowywany jest w oddzielnym pliku o⁠ nazwie postaci: '//​nazwa egzaminu rocznik.RData//'​. +
-  - Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu, których nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//,​ a⁠ struktura ramek jest taka sama, jak struktura wartości działania funkcji //​pobierz_czesc_egzaminu()// z⁠ pakietu ZPD.+
  
-Służy ​do tego funkcja ​//nazwa_funkcji(rodzajEgzaminu,​ lata)// z pakietu EWDdane, która ​w⁠ istocie jest prostym „zapętleniem” odwołującym się do funkcji //​pobierz_czesc_egzaminu()//​ z⁠ pakietu ZPD.+Wyniki surowe egzaminów pobierane są do repozytorium ​//skalowanieEgzaminow/dane surowe// i⁠ przechowywane tam plikach formatu RData w następującej strukturze:
  
-====Pobieranie i przechowywanie danych o⁠ uczniach (i⁠ szkołach)====+  * Wszystkie rodzaje egzaminów przechowywane są w⁠ jednym katalogu, bez podziału na podkatalogi. 
 +  * Każdy rocznik danego egzaminu przechowywany jest w oddzielnym pliku o⁠ nazwie postaci: '//​nazwa egzaminu rocznik.RData//'​. 
 +  * Każdy plik w formacie RData zawiera ramki danych z wynikami poszczególnych części egzaminu: 
 +    * Ich nazwy odpowiadają prefiksom tych części w⁠ bazie, w⁠ tablicy //​sl_czesci_egzaminow//​. 
 +    * Ich wewnętrzna struktura jest taka sama, jak struktura wartości zwracanej przez funkcję //​pobierz_czesc_egzaminu()//​ z⁠ pakietu [[r_zpd|ZPD]]. 
 +    * Mają przypisane klasy (oprócz '​data.frame'​):​ '​czescEgzaminu'​ i '​wynikiSurowe'​. 
 +    * Mają przypisany atrybut '​dataPobrania'​. 
 + 
 +====Sposób ​przechowywanie ​(zapisu) ​danych o⁠ uczniach (i⁠ szkołach)==== 
 + 
 +Informacje kontekstowe pobierane są do repozytorium skalowanieEgzaminow/​dane surowe i⁠ przechowywane tam w plikach formatu RData w następującej strukturze:​ 
 + 
 +  * Każdy rodzaj egzaminu opisuje jeden plik, w którym zawarte są dane dotyczące wszystkich lat. Nazwy plików są postaci: 'nazwa egzaminu - kontekstowe.RData'​. 
 +  * W każdym pliku znajduje się obiekt o nazwie postaci '​prefiksKontekstowe'​ gdzie '​prefiks'​ przyjmuje wartości: '​s'​ - sprawdzian, '​g'​ - egzamin gimnazjalny,​ '​m'​ - matura. Obiekt ten: 
 +    * Jest ramką danych, zwracaną przez funkcję //​pobierz_dane_kontekstowe//​. 
 +    * Ma przypisaną klasę (oprócz '​data.frame'​):​ '​daneKontekstowe'​. 
 +    * Ma przypisany atrybut '​dataPobrania'​. 
 + 
 +====Egzamin gimnazjalny 2005==== 
 + 
 +Egzamin gimnazjalny z 2005 r. stanowi ciężki przypadek. Na potrzeby wyliczania EWD występuje on tylko i wyłącznie jako egzamin, który pisali //​drugoroczni//​ uczniowie techników, zdający maturę w 2010 r. Jest to niewielka grupa (niecałe 9 tys. osób), której wyniki zostały pozyskane z OKE. Jednak aby mieć lepszą podstawę do szacowania parametrów modelu skalowania oraz móc wyniki wyskalowane przedstawić na skali standardowej,​ w której punktem odniesienia są wszyscy zdający, musimy wykorzystać wyniki populacyjne,​ pochodzące z CKE. W związku z tym w 2015 r. wykonana została następująca procedura:​ 
 + 
 +  - Pobrano dane surowe z CKE (dla egzaminu gimnazjalnego 2005 funkcja //​pobierz_wyniki_surowe()//​ domyślnie pobiera dane CKE), a następnie wyskalowano na nich model i zapisano wyniki do bazy. 
 +  - Następnie do zapisanych już danych surowych //​ręcznie//​ zostały pobrane i dopisane dane z OKE. Skalowanie odpalone zostało powtórnie na połączonych danych, przy czym, jako że parametry modelu i oszacowania umiejętności dla danych CKE były już zapisane w bazie, oznaczało to wyliczenie oszacowań jedynie dla danych z OKE. Dopisano je do bazy. 
 + 
 +Na przyszłość poleca się egzaminu gimnazjalnego 2005 nie ruszać.
  
ewdprocedurypobieraniesurowych.txt · ostatnio zmienione: 2017/08/05 15:59 przez t.zoltak