Narzędzia użytkownika

Narzędzia witryny


r_gr_uczniowietesty

Grupa danych uczniowieTesty

Wstęp

 • Grupa danych uczniowieTesty daje dostęp do informacji o uczniach w kontekście danego testu (egzamin składa się z testów).
  • Stałe w czasie informacje o uczniach (np. płeć, rocznik) zawiera grupa danych uczniowie.
 • Ponieważ grupa danych nie zawiera żadnych (może poza rokiem) zmiennych umożliwiających jej intuicyjne odfiltrowanie, typowo jest ona złączana z grupami danych:
 • Listę zmiennych zawartych w tej grupie danych znajdziesz tutaj.

Funkcje

 • pobierz_dane_uczniowie_testy(src, daneOsobowe = FALSE), gdzie

  • src - zmienna zawierająca połączenie z bazą danych zwrócone przez funkcję polacz()
  • daneOsobowe - czy pobierać zmienne klasa i kod_ucznia (wymaga nawiązania połączenia z bazą jako użytkownik z prawami do odczytu danych osobowych)
 • filtruj_przystapienia(src, pierwsze, rodzajEgzaminu, czescEgzaminu = NULL, czyEwd, obserwacje = NULL)
  Patrz opis funkcji

Przykład

Pobieramy informacje o uczniach (dysleksja, bycie laureatem, itp.) w kontekście testu o id_testu 1436 (matura podstawowa z języka polskiego 2013):

library(ZPD)
src = polacz()
uczniowieTesty = pobierz_dane_uczniowie_testy(src)
# odfiltrowujemy dane dla testu 1436
uczniowieTesty_m_pol_p_13 = uczniowieTesty %>% filter(id_testu == 1436)

Jeśli nie znamy id_testu testu, dla którego chcemy pobrać dane, możemy dokonać złączenia z grupą danych testy (lub inną, która zawiera zmienne umożliwiające nam wygodne odfiltrowanie danych). Poprzedni przykład przybrałby wtedy postać:

library(ZPD)
src = polacz()
uczniowieTesty = pobierz_dane_uczniowie_testy(src)
testy = pobierz_testy(src)
# złącz obydwie grupy danych
razem = left_join(uczniowieTesty, testy)
# odfiltrowujemy maturę podstawową z polskiego 2013 w wygodny sposób
razem = razem %>% filter(rodzaj_egzaminu == 'matura', czesc_egzaminu == 'j. polski podstawowa', rok == 2013)

Czas pobierania danych z serwera

W bazie znajdują się (na październik 2015 r.) dane dla blisko 50 mln par {uczeń, test}. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę danych):

 • może zająć 20-30 minut minut;
 • zajmie kilkaset megabajtów pamięci operacyjnej.

W związku z tym zalecane jest:

 • albo przed pobraniem danych odfiltrować je do interesującego zakresu (np. tylko dla wybranego egzaminu/testu - patrz przykłady powyżej);
 • albo przed pobraniem danych złączyć je z inną, odpowiednio węziej zdefiniowaną, grupą danych (np. wynikami egzaminacyjnymi), co spowoduje ograniczenie ich zakresu, np.
  library(ZPD)
  src = polacz()
  wyniki = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2009, FALSE)
  uczniowieTesty = pobierz_dane_uczniowie_testy(src)
  zlaczone = left_join(wyniki, uczniowieTesty)
  zlaczone = zlaczone %>% collect()
 • albo oddzielne pobranie wszystkich danych o uczniach w kontekście poszczególnych egzaminów/testów na komputer, zapisanie ich lokalnie na dysku i wykorzystanie w dalszych analizach pobranej kopii zamiast ponownego pobierania ich z serwera:
  library(ZPD)
  src = polacz()
  uczniowieTesty = pobierz_dane_uczniowie_testy(src) %>% collect()
  save(uczniowieTesty, file = 'uczniowieTesty.RData')
  # można teraz szybko wczytać dane uczniów poleceniem: load('uczniowieTesty.RData')

Typowe zastosowania

Dołączanie danych kontekstowych do wyników egzaminacyjnych/testów

Do analizy wyników egzaminów/testów potrzebne są często dane kontekstowe. Grupa danych uczniowieTesty może dostarczyć takich informacji o dysleksji, byciu laureatem konkursu przedmiotowego, pierwszym lub kolejnym podchodzeniu do egzaminu, stąd często pobierając wyniki egzaminów/testów możemy chcieć do nich dołączyć grupę danych uczniowieTesty.

Sprowadza się to do:

 • pobrania wyników egzaminacyjnych/testów;
 • pobrania grupy danych uczniowieTesty;
 • złączenia danych ze sobą (patrz złączanie danych).

W wypadku dołączania tych samych informacji z grupy danych uczniowieTesty do dużej liczby egzaminów/testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz tutaj.

Przykład

Dołączamy do wyników sprawdzianu 2010 (z danych EWD) wszystkie informacje z grupy danych uczniowieTesty:

library(ZPD)
src = polacz()
# pobieramy grupę danych uczniowie
uczniowieTesty = pobierz_dane_uczniowie_testy(src)
# pobieramy grupę danych wyniki - sprawdzian 2010 EWD
s_10 = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2010, TRUE)
# złączamy obydwie grupy danych
s_10_razem = inner_join(s_10, uczniowieTesty)
# pobieramy dane z serwera
s_10_razem = s_10_razem %>% collect()

Dołączanie danych kontekstowych do oszacowań umiejętności uczniów

Analogicznie do dołączania danych kontekstowych do wyników egzaminacyjnych/testów (patrz punkt wyżej), przy czym pobrane wyniki egzaminów/testów zastępujemy pobranymi oszacowaniami umiejętności uczniów (patrz opis grupy oszacowania).

r_gr_uczniowietesty.txt · ostatnio zmienione: 2015/09/25 22:58 przez zozlak