Pobieramy informacje o uczniach z rocznika 1994:
library(ZPD) src = polacz() uczniowie = pobierz_uczniow(src) # odfiltrowujemy uczniow z rocznika 1994 uczniowie_94 = uczniowie %>% filter(rocznik == 1994)
W bazie znajdują się (na koniec 2014 r.) dane ok 17 mln uczniów. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę danych):
W związku z tym zalecane jest:
library(ZPD) src = polacz() wyniki = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2009, FALSE) uczniowie = pobierz_uczniow(src) zlaczone = left_join(wyniki, uczniowie) zlaczone = zlaczone %>% collect()
library(ZPD) src = polacz() uczniowie = pobierz_uczniow(src) %>% collect() save(uczniowie, file = 'uczniowie.RData') # można teraz szybko wczytać dane uczniów poleceniem: load('uczniowie.RData')
Do analizy wyników egzaminów/testów potrzebne są często dane kontekstowe. Grupa danych uczniowie może dostarczyć takich informacji o płci o roczniku urodzenia uczniów, stąd często pobierając wyniki egzaminów/testów możemy chcieć do nich dołączyć grupę danych uczniowie.
Sprowadza się to do:
W wypadku dołączania tych samych informacji z grupy danych uczniowie do dużej liczby egzaminów/testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz tutaj.
Dołączamy do wyników sprawdzianu 2010 (z danych EWD) wszystkie informacje z grupy danych uczniowie:
library(ZPD) src = polacz() # pobieramy grupę danych uczniowie uczniowie = pobierz_uczniow(src) # pobieramy grupę danych wyniki - sprawdzian 2010 EWD s_10 = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2010, TRUE) # złączamy obydwie grupy danych s_10_razem = inner_join(s_10, uczniowie) # pobieramy dane z serwera m_10_razem = s_10_razem %>% collect()
Analogicznie do dołączania danych kontekstowych do wyników egzaminacyjnych/testów (patrz punkt wyżej), przy czym pobrane wyniki egzaminów/testów zastępujemy pobranymi oszacowaniami umiejętności uczniów (patrz opis grupy oszacowania).