Narzędzia użytkownika

Narzędzia witryny


r_gr_uczniowietesty

To jest stara wersja strony!


Grupa danych uczniowieTesty

Wstęp

  • Grupa danych uczniowieTesty daje dostęp do informacji o uczniach w kontekście danego egzaminu/testu.
    • Stałe w czasie informacje o uczniach (np. płeć, rocznik) zawiera grupa danych uczniowie.
  • Listę zmiennych zawartych w tej grupie danych znajdziesz tutaj.
  • Aby pobrać grupę danych uczniowieTesty wywołujemy funkcję

    pobierz_dane_uczniowie_testy(src), gdzie

    • src - zmienna zawierająca połączenie z bazą danych zwrócone przez funkcję polacz()

Przykład

Pobieramy informacje o uczniach (dysleksja, bycie laureatem, itp.) w kontekście testu o id_testu 1436 (matura podstawowa z języka polskiego 2013):

library(ZPD)
src = polacz()
uczniowieTesty = pobierz_dane_uczniowie_testy(src)
# odfiltrowujemy dane dla testu 1436
uczniowieTesty_m_pol_p_13 = uczniowieTesty %>% filter(id_testu == 1436)

Jeśli nie znamy id_testu testu, dla którego chcemy pobrać dane, możemy dokonać złączenia z grupą danych testy (lub inną, która zawiera zmienne umożliwiające nam wygodne odfiltrowanie danych). Poprzedni przykład przybrałby wtedy postać:

library(ZPD)
src = polacz()
uczniowieTesty = pobierz_dane_uczniowie_testy(src)
testy = pobierz_testy(src)
# złącz obydwie grupy danych
razem = left_join(uczniowieTesty, testy)
# odfiltrowujemy maturę podstawową z polskiego 2013 w wygodny sposób
razem = razem %>% filter(rodzaj_egzaminu == 'matura', czesc_egzaminu == 'j. polski podstawowa', rok == 2013)

Czas pobierania danych z serwera

W bazie znajdują się (na koniec 2014 r.) dane dla ok. 36,5 mln par {uczeń, test}. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę danych):

  • może zająć 20-30 minut minut;
  • zajmie kilkaset megabajtów pamięci operacyjnej.

W związku z tym zalecane jest:

  • albo przed pobraniem danych odfiltrować je do interesującego zakresu (np. tylko dla wybranego egzaminu/testu - patrz przykłady powyżej);
  • albo przed pobraniem danych złączyć je z inną, odpowiednio węziej zdefiniowaną, grupą danych (np. wynikami egzaminacyjnymi), co spowoduje ograniczenie ich zakresu, np.
    library(ZPD)
    src = polacz()
    wyniki = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2009, F)
    uczniowieTesty = pobierz_dane_uczniowie_testy(src)
    zlaczone = left_join(wyniki, uczniowieTesty)
    zlaczone = zlaczone %>% collect()
  • albo oddzielne pobranie danych o uczniach w kontekście poszczególnych egzaminów/testów na komputer i zapisanie ich lokalnie na dysku:
    library(ZPD)
    src = polacz()
    uczniowieTesty = pobierz_dane_uczniowie_testy(src) %>% collect()
    save(uczniowieTesty, file = 'uczniowieTesty.RData')
    # można teraz szybko wczytać dane uczniów poleceniem: load('uczniowieTesty.RData')

Typowe zastosowania

Dołączanie danych kontekstowych do wyników egzaminacyjnych/testów

Do analizy wyników egzaminów/testów potrzebne są często dane kontekstowe. Grupa danych uczniowieTesty może dostarczyć takich informacji o dysleksji, byciu laureatem konkursu przedmiotowego, pierwszym lub kolejnym podchodzeniu do egzaminu, stąd często pobierając wyniki egzaminów/testów możemy chcieć do nich dołączyć grupę danych uczniowieTesty.

Sprowadza się to do:

  • pobrania wyników egzaminacyjnych/testów;
  • pobrania grupy danych uczniowieTesty;
  • złączenia danych ze sobą (patrz złączanie danych).

W wypadku dołączania tych samych informacji z grupy danych uczniowieTesty do dużej liczby egzaminów/testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz tutaj.

Przykład

Dołączamy do wyników sprawdzianu 2010 (z danych EWD) wszystkie informacje z grupy danych uczniowieTesty:

library(ZPD)
src = polacz()
# pobieramy grupę danych uczniowie
uczniowieTesty = pobierz_dane_uczniowie_testy(src)
# pobieramy grupę danych wyniki - sprawdzian 2010 EWD
s_10 = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2010, TRUE)
# złączamy obydwie grupy danych
s_10_razem = inner_join(s_10, uczniowieTesty)
# pobieramy dane z serwera
m_10_razem = s_10_razem %>% collect()

Dołączanie danych kontekstowych do oszacowań umiejętności uczniów

Analogicznie do dołączania danych kontekstowych do wyników egzaminacyjnych/testów (patrz punkt wyżej), przy czym pobrane wyniki egzaminów/testów zastępujemy pobranymi oszacowaniami umiejętności uczniów (patrz opis grupy oszacowania).

r_gr_uczniowietesty.1422642105.txt.gz · ostatnio zmienione: 2015/01/30 19:21 przez zozlak