Narzędzia użytkownika

Narzędzia witryny


r_gr_uczniowietesty

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
r_gr_uczniowietesty [2015/09/25 22:07]
zozlak [Wstęp]
r_gr_uczniowietesty [2015/09/25 22:58]
zozlak [Dołączanie danych kontekstowych do wyników egzaminacyjnych/testów]
Linia 6: Linia 6:
     * Stałe w czasie informacje o uczniach (np. płeć, rocznik) zawiera grupa danych [[r_gr_uczniowie|uczniowie]].     * Stałe w czasie informacje o uczniach (np. płeć, rocznik) zawiera grupa danych [[r_gr_uczniowie|uczniowie]].
  
-  * Listę zmiennych zawartych w tej grupie danych znajdziesz [[r_zmienne?​zm=ucziowietesty|tutaj]].+  ​* Ponieważ grupa danych nie zawiera żadnych (może poza rokiem) zmiennych umożliwiających jej intuicyjne odfiltrowanie,​ typowo jest ona złączana z grupami danych: 
 +    * [[r_gr_testy|testy]] 
 +    * i/lub [[r_gr_wyniki|wyniki]] 
 +    * i/lub [[r_gr_szkoly|szkoły]] 
 + 
 +  ​* Listę zmiennych zawartych w tej grupie danych znajdziesz [[r_zmienne?​zm=uczniowietesty|tutaj]].
  
 ===== Funkcje ===== ===== Funkcje =====
Linia 44: Linia 49:
 ===== Czas pobierania danych z serwera ===== ===== Czas pobierania danych z serwera =====
  
-W bazie znajdują się (na koniec 2014 r.) dane dla ok. 36,5 mln par {uczeń, test}. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę danych):+W bazie znajdują się (na październik 2015 r.) dane dla blisko 50 mln par {uczeń, test}. Ściągnięcie ich wszystkich z bazy danych na komputer (czy to funkcją collect() czy przekształceniem pobranych danych na zwykłą ramkę danych):
  
   * może zająć 20-30 minut minut;   * może zająć 20-30 minut minut;
Linia 55: Linia 60:
 library(ZPD) library(ZPD)
 src = polacz() src = polacz()
-wyniki = pobierz_wyniki_egzaminu(src,​ '​sprawdzian',​ '',​ 2009, F)+wyniki = pobierz_wyniki_egzaminu(src,​ '​sprawdzian',​ '',​ 2009, FALSE)
 uczniowieTesty = pobierz_dane_uczniowie_testy(src) uczniowieTesty = pobierz_dane_uczniowie_testy(src)
 zlaczone = left_join(wyniki,​ uczniowieTesty) zlaczone = left_join(wyniki,​ uczniowieTesty)
 zlaczone = zlaczone %>% collect() zlaczone = zlaczone %>% collect()
 </​code>​ </​code>​
-  * albo oddzielne pobranie danych o uczniach w kontekście poszczególnych egzaminów/​testów na komputer ​zapisanie ich lokalnie na dysku:<​code rsplus>+  * albo oddzielne pobranie ​wszystkich ​danych o uczniach w kontekście poszczególnych egzaminów/​testów na komputerzapisanie ich lokalnie na dysku i wykorzystanie w dalszych analizach pobranej kopii zamiast ponownego pobierania ich z serwera:<code rsplus>
 library(ZPD) library(ZPD)
 src = polacz() src = polacz()
Linia 94: Linia 99:
 s_10_razem = inner_join(s_10,​ uczniowieTesty) s_10_razem = inner_join(s_10,​ uczniowieTesty)
 # pobieramy dane z serwera # pobieramy dane z serwera
-m_10_razem ​= s_10_razem %>% collect()+s_10_razem ​= s_10_razem %>% collect()
 </​code>​ </​code>​
  
r_gr_uczniowietesty.txt · ostatnio zmienione: 2015/09/25 22:58 przez zozlak