Pobieramy informacje o uczniach (dysleksja, bycie laureatem, itp.) w kontekście testu o id_testu 1436 (matura podstawowa z języka polskiego 2013):
library(ZPD) src = polacz() uczniowieTesty = pobierz_dane_uczniowie_testy(src) # odfiltrowujemy dane dla testu 1436 uczniowieTesty_m_pol_p_13 = uczniowieTesty %>% filter(id_testu == 1436)
Jeśli nie znamy id_testu testu, dla którego chcemy pobrać dane, możemy dokonać złączenia z grupą danych testy (lub inną, która zawiera zmienne umożliwiające nam wygodne odfiltrowanie danych). Poprzedni przykład przybrałby wtedy postać:
library(ZPD) src = polacz() uczniowieTesty = pobierz_dane_uczniowie_testy(src) testy = pobierz_testy(src) # złącz obydwie grupy danych razem = left_join(uczniowieTesty, testy) # odfiltrowujemy maturę podstawową z polskiego 2013 w wygodny sposób razem = razem %>% filter(rodzaj_egzaminu == 'matura', czesc_egzaminu == 'j. polski podstawowa', rok == 2013)
W bazie znajdują się (na październik 2015 r.) dane dla blisko 50 mln par {uczeń, test}. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę danych):
W związku z tym zalecane jest:
library(ZPD) src = polacz() wyniki = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2009, FALSE) uczniowieTesty = pobierz_dane_uczniowie_testy(src) zlaczone = left_join(wyniki, uczniowieTesty) zlaczone = zlaczone %>% collect()
library(ZPD) src = polacz() uczniowieTesty = pobierz_dane_uczniowie_testy(src) %>% collect() save(uczniowieTesty, file = 'uczniowieTesty.RData') # można teraz szybko wczytać dane uczniów poleceniem: load('uczniowieTesty.RData')
Do analizy wyników egzaminów/testów potrzebne są często dane kontekstowe. Grupa danych uczniowieTesty może dostarczyć takich informacji o dysleksji, byciu laureatem konkursu przedmiotowego, pierwszym lub kolejnym podchodzeniu do egzaminu, stąd często pobierając wyniki egzaminów/testów możemy chcieć do nich dołączyć grupę danych uczniowieTesty.
Sprowadza się to do:
W wypadku dołączania tych samych informacji z grupy danych uczniowieTesty do dużej liczby egzaminów/testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz tutaj.
Dołączamy do wyników sprawdzianu 2010 (z danych EWD) wszystkie informacje z grupy danych uczniowieTesty:
library(ZPD) src = polacz() # pobieramy grupę danych uczniowie uczniowieTesty = pobierz_dane_uczniowie_testy(src) # pobieramy grupę danych wyniki - sprawdzian 2010 EWD s_10 = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2010, TRUE) # złączamy obydwie grupy danych s_10_razem = inner_join(s_10, uczniowieTesty) # pobieramy dane z serwera s_10_razem = s_10_razem %>% collect()
Analogicznie do dołączania danych kontekstowych do wyników egzaminacyjnych/testów (patrz punkt wyżej), przy czym pobrane wyniki egzaminów/testów zastępujemy pobranymi oszacowaniami umiejętności uczniów (patrz opis grupy oszacowania).