Narzędzia użytkownika

Narzędzia witryny


r_gr_uczniowie

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
Ostatnia wersja Both sides next revision
r_gr_uczniowie [2014/12/15 11:11]
zozlak [Dołączanie danych kontekstowych do oszacowań umiejętności uczniów]
r_gr_uczniowie [2015/09/25 22:01]
zozlak [Czas pobierania danych z serwera]
Linia 5: Linia 5:
   * Grupa danych //​uczniowie//​ daje dostęp do **niezmiennych w czasie** informacji o uczniach.   * Grupa danych //​uczniowie//​ daje dostęp do **niezmiennych w czasie** informacji o uczniach.
     * Informacje o uczniach mogące się zmieniać w czasie zawiera grupa danych [[r_gr_uczniowietesty|uczniowieTesty]].     * Informacje o uczniach mogące się zmieniać w czasie zawiera grupa danych [[r_gr_uczniowietesty|uczniowieTesty]].
-  ​* Listę zmiennych zawartych w tej grupie danych znajdziesz [[r_wstep#​podsumowanie_informacji_o_grupach_danych|tutaj]]. + 
-  * Aby pobrać grupę danych //​uczniowie//​ wywołujemy funkcję \\ \\ //​**pobierz_uczniow**(src)//​, gdzie \\ \\ +  ​* Listę zmiennych zawartych w tej grupie danych znajdziesz [[r_zmienne?​zm=uczniowie|tutaj]]. 
 + 
 +===== Funkcje ===== 
 + 
 +  * //​**pobierz_uczniow**(src, daneOsobowe = FALSE)// \\ Pobiera niezmienne w czasie informacje o uczniach ​\\ Parametry:
     * //src// - zmienna zawierająca połączenie z bazą danych zwrócone przez funkcję polacz()     * //src// - zmienna zawierająca połączenie z bazą danych zwrócone przez funkcję polacz()
 +    * //​daneOsobowe//​ - czy ma zostać pobrana dokłada data urodzenia ucznia (wymaga nawiązania połączenia z bazą jako użytkownik z prawami do odczytu danych osobowych)
  
 ==== Przykład ==== ==== Przykład ====
  
 Pobieramy informacje o uczniach z rocznika 1994 (co oznacza uczniów urodzonych pomiędzy 1 września 1993 r. a 31 sierpnia 1994 r. - patrz [[r_zmienne|opis zmiennych]]):​ Pobieramy informacje o uczniach z rocznika 1994 (co oznacza uczniów urodzonych pomiędzy 1 września 1993 r. a 31 sierpnia 1994 r. - patrz [[r_zmienne|opis zmiennych]]):​
-<​code>​+<​code ​rsplus>
 library(ZPD) library(ZPD)
 src = polacz() src = polacz()
Linia 20: Linia 25:
 </​code>​ </​code>​
  
-===== Typowe zastosowania ​=====+===== Czas pobierania danych z serwera ​=====
  
-==== Dołączanie ​danych ​kontekstowych do wyników egzaminacyjnych/​testów ====+W bazie znajdują się (na koniec 2014 r.) dane ok 17 mln uczniów. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę ​danych):
  
-Do analizy wyników egzaminów/​testów potrzebne są często dane kontekstowe. Grupa danych //​szkoły// ​może dostarczyć takich informacji, jak:+  * może zająć ok. 10 minut; 
 +  * zajmie kilkaset megabajtów pamięci operacyjnej.
  
-  * informacje o położeniu terytorialnym;​ +W związku z tym zalecane jest:
-  * informacje o wielkości miejscowości (w której znajduje się szkoła).+
  
-Stąd często pobierając wyniki egzaminów/​testów możemy chcieć do nich dołączyć grupę danych //szkoły//.+  * albo przed pobraniem danych odfiltrować je do interesującego zakresu (np. tylko wybrane roczniki - patrz przykład powyżej);​ 
 +  * albo przed pobraniem danych złączyć je z inną, odpowiednio wąsko zdefiniowaną,​ grupą danych (np. wynikami egzaminacyjnymi),​ co spowoduje ograniczenie ich zakresu, np. <code rsplus>​ 
 +library(ZPD) 
 +src = polacz() 
 +wyniki = pobierz_wyniki_egzaminu(src,​ '​sprawdzian',​ '',​ 2009, FALSE) 
 +uczniowie = pobierz_uczniow(src) 
 +zlaczone = left_join(wyniki,​ uczniowie) 
 +zlaczone = zlaczone %>% collect() 
 +</​code>​ 
 +  * albo oddzielne pobranie danych o uczniach na komputer, zapisanie ich lokalnie na dysku i używanie w dalszych analizach lokalnie zapisanej kopii danych (aby uniknąć wielokrotnego pobierania ich z serwera):<​code rsplus>​ 
 +library(ZPD) 
 +src = polacz() 
 +uczniowie = pobierz_uczniow(src) %>% collect() 
 +save(uczniowie,​ file = '​uczniowie.RData'​) 
 +# można teraz szybko wczytać dane uczniów poleceniem: load('​uczniowie.RData'​) 
 +</​code>​ 
 + 
 +===== Typowe zastosowania ===== 
 + 
 +==== Dołączanie danych kontekstowych do wyników egzaminacyjnych/​testów ==== 
 + 
 +Do analizy wyników egzaminów/​testów potrzebne są często dane kontekstowe. Grupa danych //​uczniowie//​ może dostarczyć takich informacji o płci o roczniku urodzenia uczniów, stąd często pobierając wyniki egzaminów/​testów możemy chcieć do nich dołączyć grupę danych //uczniowie//.
  
 Sprowadza się to do: Sprowadza się to do:
  
   * pobrania wyników egzaminacyjnych/​testów;​   * pobrania wyników egzaminacyjnych/​testów;​
-  * pobrania grupy danych //szkoły//+  * pobrania grupy danych //uczniowie//;
-    * w celu zmniejszenia rozmiarów zbioru danych zalecane jest wybranie jedynie potrzebnych zmiennych (oraz zmiennych //​id_szkoly//​ i //rok//, niezbędnych do złączenia z grupą //wyniki//);+
   * złączenia danych ze sobą (patrz [[r_zlaczenia|złączanie danych]]).   * złączenia danych ze sobą (patrz [[r_zlaczenia|złączanie danych]]).
  
-W wypadku dołączania tych samych informacji z grupy danych //szkoły// do dużej liczby egzaminów/​testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz [[r_wydajnosc|tutaj]].+W wypadku dołączania tych samych informacji z grupy danych //uczniowie// do dużej liczby egzaminów/​testów szybsze może się okazać wykonywanie złączania na własnym komputerze - patrz [[r_wydajnosc|tutaj]].
  
 === Przykład === === Przykład ===
  
-Dołączamy do wyników sprawdzianu 2010 ([[czyewd|z danych EWD]]) ​zmienne //teryt// (kod TERYT gminy, w której znajduje się szkoła) oraz //​wielkosc_miejscowosci//  ​z grupy danych //szkoły//: <​code>​+Dołączamy do wyników sprawdzianu 2010 ([[czyewd|z danych EWD]]) ​wszystkie informacje ​z grupy danych //uczniowie//: <​code ​rsplus>
 library(ZPD) library(ZPD)
 src = polacz() src = polacz()
-# pobieramy grupę danych ​szkoły wybierając jedynie potrzebne zmienne +# pobieramy grupę danych ​uczniowie 
-szkoly ​pobierz_szkoly(src) %>% select(id_szkoly,​ rok, teryt, wielkosc_miejscowosci)+uczniowie ​pobierz_uczniow(src)
 # pobieramy grupę danych wyniki - sprawdzian 2010 EWD # pobieramy grupę danych wyniki - sprawdzian 2010 EWD
 s_10 = pobierz_wyniki_egzaminu(src,​ '​sprawdzian',​ '',​ 2010, TRUE) s_10 = pobierz_wyniki_egzaminu(src,​ '​sprawdzian',​ '',​ 2010, TRUE)
 # złączamy obydwie grupy danych # złączamy obydwie grupy danych
-s_10_razem = inner_join(s_10, ​szkoly)+s_10_razem = inner_join(s_10, ​uczniowie)
 # pobieramy dane z serwera # pobieramy dane z serwera
 m_10_razem = s_10_razem %>% collect() m_10_razem = s_10_razem %>% collect()
r_gr_uczniowie.txt · ostatnio zmienione: 2015/09/25 22:09 przez zozlak