Narzędzia użytkownika

Narzędzia witryny


r_gr_uczniowie

To jest stara wersja strony!


Grupa danych uczniowie

Wstęp

  • Grupa danych uczniowie daje dostęp do niezmiennych w czasie informacji o uczniach.
    • Informacje o uczniach mogące się zmieniać w czasie zawiera grupa danych uczniowieTesty.
  • Listę zmiennych zawartych w tej grupie danych znajdziesz tutaj.
  • Aby pobrać grupę danych uczniowie wywołujemy funkcję

    pobierz_uczniow(src), gdzie

    • src - zmienna zawierająca połączenie z bazą danych zwrócone przez funkcję polacz()

Przykład

Pobieramy informacje o uczniach z rocznika 1994 (co oznacza uczniów urodzonych pomiędzy 1 września 1993 r. a 31 sierpnia 1994 r. - patrz opis zmiennych):

library(ZPD)
src = polacz()
uczniowie = pobierz_uczniow(src)
# odfiltrowujemy uczniow z rocznika 1994
uczniowie_94 = uczniowie %>% filter(rocznik == 1994)

Czas ściągania danych z serwera

W bazie znajdują się (na koniec 2014 r.) dane ok 17 mln uczniów. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę danych):

  • może zająć ok. 10 minut;
  • zajmie kilkaset megabajtów pamięci operacyjnej.

W związku z tym zalecane jest:

  • albo przed pobraniem danych odfiltrować je do interesującego zakresu (np. tylko wybrane roczniki - patrz przykład powyżej);
  • albo przed pobraniem danych złączyć je z inną, odpowiednio węziej zdefiniowaną, grupą danych (np. wynikami egzaminacyjnymi), co spowoduje ograniczenie ich zakresu, np.
    library(ZPD)
    src = polacz()
    wyniki = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2009, F)
    uczniowie = pobierz_uczniow(src)
    zlaczone = left_join(wyniki, uczniowie)
    zlaczone = zlaczone %>% collect()
  • albo oddzielne pobranie danych o uczniach na komputer i zapisanie ich lokalnie na dysku:
    library(ZPD)
    src = polacz()
    uczniowie = pobierz_uczniow(src) %>% collect()
    save(uczniowie, file = 'uczniowie.RData')
    # można teraz szybko wczytać dane uczniów poleceniem: load('uczniowie.RData')

Typowe zastosowania

Dołączanie danych kontekstowych do wyników egzaminacyjnych/testów

Do analizy wyników egzaminów/testów potrzebne są często dane kontekstowe. Grupa danych uczniowie może dostarczyć takich informacji o płci o roczniku urodzenia uczniów, stąd często pobierając wyniki egzaminów/testów możemy chcieć do nich dołączyć grupę danych uczniowie.

Sprowadza się to do:

  • pobrania wyników egzaminacyjnych/testów;
  • pobrania grupy danych uczniowie;
  • złączenia danych ze sobą (patrz złączanie danych).

W wypadku dołączania tych samych informacji z grupy danych uczniowie do dużej liczby egzaminów/testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz tutaj.

Przykład

Dołączamy do wyników sprawdzianu 2010 (z danych EWD) wszystkie informacje z grupy danych uczniowie:

library(ZPD)
src = polacz()
# pobieramy grupę danych uczniowie
uczniowie = pobierz_uczniow(src)
# pobieramy grupę danych wyniki - sprawdzian 2010 EWD
s_10 = pobierz_wyniki_egzaminu(src, 'sprawdzian', '', 2010, TRUE)
# złączamy obydwie grupy danych
s_10_razem = inner_join(s_10, uczniowie)
# pobieramy dane z serwera
m_10_razem = s_10_razem %>% collect()

Dołączanie danych kontekstowych do oszacowań umiejętności uczniów

Analogicznie do dołączania danych kontekstowych do wyników egzaminacyjnych/testów (patrz punkt wyżej), przy czym pobrane wyniki egzaminów/testów zastępujemy pobranymi oszacowaniami umiejętności uczniów (patrz opis grupy oszacowania).

r_gr_uczniowie.1418662995.txt.gz · ostatnio zmienione: 2014/12/15 18:03 przez zozlak