Pobieramy dane o liceach ogólnokształcących w województwie podlaskim w 2012 roku.
library(ZPD) src = polacz() szkoly = pobierz_szkoly(src) # odfiltrowujemy jedynie licea ogólnokształcące w 2012 roku w województwie podlaskim lo_podlaskie_12 = szkoly %>% filter(typ_szkoly == 'LO', rok == 2012, wojewodztwo_szkoly == 'podlaskie')
Jeśli interesują nas wyniki egzaminacyjne jedynie dla pewnej grupy szkół (np. z danego województwa, powiatu, itp.), możemy odfiltrować je posiłkując się grupą danych szkoły:
Pobieramy wyniki matury podstawowej z matematyki jedynie dla liceów ogólnokształcących w województwie podlaskim:
library(ZPD) src = polacz() # pobieramy grupę danych szkoły szkoly = pobierz_szkoly(src) # odfiltrowujemy jedynie licea ogólnokształcące w 2012 roku w województwie podlaskim lo_podlaskie_12 = szkoly %>% filter(typ_szkoly == 'LO', rok == 2012, wojewodztwo_szkoly == 'podlaskie') # pobieramy grupę danych wyniki - matura podstawowa z matematyki 2012 m_mat_12 = pobierz_wyniki_egzaminu(src, 'matura', 'matematyka podstawowa', 2012, TRUE) # złączamy obydwie grupy danych m_mat_lo_podlaskie_12 = inner_join(m_mat_12, lo_podlaskie_12) # pobieramy dane z serwera m_mat_lo_podlaskie_12 = m_mat_lo_podlaskie_12 %>% collect()
Analogicznie, jak przy odfiltrowywaniu wyników egzaminacyjnych (patrz wyżej), możemy chcieć odfiltrować pobierane z bazy oszacowania umiejętności uczniów - patrz grupa danych oszacowania.
Do analizy wyników egzaminów/testów potrzebne są często dane kontekstowe. Grupa danych szkoły może dostarczyć takich informacji, jak:
stąd często pobierając wyniki egzaminów/testów możemy chcieć do nich dołączyć grupę danych szkoły.
Sprowadza się to do:
W wypadku dołączania tych samych informacji z grupy danych szkoły do dużej liczby egzaminów/testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz tutaj.
Dołączamy do wyników sprawdzianu 2010 (z danych EWD) zmienne teryt_szkoly (kod TERYT gminy, w której znajduje się szkoła) oraz wielkosc_miejscowosci z grupy danych szkoły:
library(ZPD) src = polacz() # pobieramy grupę danych szkoły wybierając jedynie potrzebne zmienne szkoly = pobierz_szkoly(src) %>% select(id_szkoly, rok, teryt_szkoly, wielkosc_miejscowosci) # pobieramy grupę danych wyniki - sprawdzian 2010 EWD s_10 = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2010, TRUE) # złączamy obydwie grupy danych s_10_razem = inner_join(s_10, szkoly) # pobieramy dane z serwera s_10_razem = s_10_razem %>% collect()
Analogicznie do dołączania danych kontekstowych do wyników egzaminacyjnych/testów (patrz punkt wyżej), przy czym pobrane wyniki egzaminów/testów zastępujemy pobranymi oszacowaniami umiejętności uczniów (patrz opis grupy oszacowania).