Porównujemy trudności KTT wersji A i B arkusza sprawdzianu z 2009 roku obliczone dla danych EWD.
Aby odfiltrować interesujące parametry odwołujemy się do grup danych skale, testy, jak również kryteria oceny.
library(ZPD) src = polacz() # pobieramy skale KTT dla sprawdzianu z 2009 roku skale = pobierz_skale(src, czyKtt = TRUE, PvEap = FALSE) %>% filter(rodzaj_skali == 'ktt', rodzaj_egzaminu == 'sprawdzian', rok == 2009) %>% select(id_skali, skalowanie, id_testu) # aby odfiltrować testy z danymi EWD musimy sięgnąć do grupy danych "testy" testyEwd = pobierz_testy(src) %>% filter(dane_ewd == TRUE) %>% select(id_testu, arkusz) # złączamy jedno z drugim - mamy już potrzebne dane - id_skali, skalowanie i arkusz skale = skale %>% inner_join(testyEwd) # pobieramy parametry parametry = pobierz_parametry(src) %>% # ograniczamy tylko do interesujących nas skalowań (jednocześnie dołączamy zmienną "arkusz") inner_join(skale) %>% # zostawiamy jedynie parametr określający trudność filter(parametr == 'mean') %>% # wybieramy jedyne interesujące nas zmienne select(arkusz, kryterium, wartosc) %>% # pobieramy na komputer collect() %>% # przekształcamy do postaci szerokiej z wersjami arkusza w kolumnach reshape2::dcast(kryterium ~ arkusz) # obliczamy różnicę trudności między wersjami arkusza parametry$roznica = abs(parametry[, 2] - parametry[, 3]) # dociągamy i złączamy intuicyjne opisy kryteriów oceny z grupy danych kryteria_oceny kryteria = pobierz_kryteria_oceny(src, testy = FALSE, skale = FALSE) %>% select(kryterium, numer_pytania, numer_kryterium) %>% distinct() %>% collect() parametry = kryteria %>% inner_join(parametry) # wyświetlamy sortując od największej różnicy parametry %>% arrange(desc(roznica))