Narzędzia użytkownika

Narzędzia witryny


r_gr_wskazniki

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
r_gr_wskazniki [2015/01/30 15:06]
zozlak
r_gr_wskazniki [2015/09/27 11:54] (aktualna)
zozlak [Wyszukiwanie wskaźników opisujących dany typ szkoły dla danego okresu]
Linia 5: Linia 5:
   * Grupa danych przechowuje informację o wskaźnikach //PWE// i //EWD//.   * Grupa danych przechowuje informację o wskaźnikach //PWE// i //EWD//.
     * Wskaźnik identyfikowany jest przez zmienne //​rodzaj_wsk//​ (//ewd// lub //pwe//) oraz //​wskaznik//​.     * Wskaźnik identyfikowany jest przez zmienne //​rodzaj_wsk//​ (//ewd// lub //pwe//) oraz //​wskaznik//​.
-  * **Jednostką obserwacji** w grupie danych jest **identyfikator wskaźnika w połączeniu z** typem szkoły i [[czesci_egzaminu|częścią egzaminu]], których dotyczy, okresem, dla którego był wyliczany oraz [[skalowanie|skalowaniem]],​ na którym się opiera. Stąd ten sam wskaźnik (ta sama kombinacja zmiennych //​rodzaj_wsk//​ i //​wskaznik//​) może się pojawiać w zbiorze wskaźników wielokrotnie. 
-    * Taka konstrukcja umożliwia łatwe wyszukiwanie wskaźników na podstawie kryteriów takich jak //typ szkoły// i [[czesci_egzaminu|częścią egzaminu]], których wskaźniki dotyczą, okresów, dla którego były wyliczane oraz [[skalowanie|skalowań]],​ na których bazują (patrz przykłady poniżej). 
-    * Powoduje to, że w większości wypadków przed wyświetleniem danych dobrze będzie wybrać jedynie interesujące zmienne i odfiltrować duplikaty funkcją distinct() (patrz przykłady). 
  
-  * Listę zmiennych zawartych ​tej grupie danych ​znajdziesz ​[[r_gr#​podsumowanie_informacji_o_grupach_danych|tutaj]]. +  * **Jednostką obserwacji** ​w grupie danych ​jest **identyfikator wskaźnika w połączeniu z:** 
-  * Aby pobrać grupę danych ​szkoły ​wywołujemy funkcję ​\\ \\ //​**pobierz_wskazniki**(src,​ doPrezentacji = TRUE, wszystkieKolumny = FALSE)//, gdzie \\ \\ +    * typem szkoły, którego dotyczy, 
 +    * [[czesci_egzaminu|częścią egzaminu]], którego dotyczy,  
 +    * okresem, dla którego był wyliczany 
 +    * [[skalowanie|skalowaniem]],​ na którym się opiera.  
 +  * Przez to **ten sam wskaźnik** (ta sama kombinacja zmiennych //​rodzaj_wsk//​ i //​wskaznik//​) **może się pojawiać w zbiorze wskaźników wielokrotnie**. 
 +  * Taka konstrukcja umożliwia łatwe wyszukiwanie wskaźników na podstawie kryteriów takich jak //typ szkoły// i [[czesci_egzaminu|częścią egzaminu]], których wskaźniki dotyczą, okresów, dla którego były wyliczane oraz [[skalowanie|skalowań]],​ na których bazują (patrz przykłady poniżej). 
 +  * Powoduje to, że w większości wypadków przed wyświetleniem danych dobrze będzie wybrać jedynie interesujące zmienne i odfiltrować duplikaty ​funkcją distinct() (patrz przykłady). 
 + 
 +  * Listę zmiennych zawartych w tej grupie danych znajdziesz [[r_zmienne?​zm=wskazniki|tutaj]]. 
 + 
 +===== Funkcje ===== 
 + 
 +  * //​**pobierz_wskazniki**(src,​ doPrezentacji = TRUE, wszystkieKolumny = FALSE)// \\ Pobiera listę wskaźników ​\\ Parametry: ​
     * //src// - zmienna zawierająca połączenie z bazą danych zwrócone przez funkcję polacz()     * //src// - zmienna zawierająca połączenie z bazą danych zwrócone przez funkcję polacz()
     * //​doPrezentacji//​ - czy pobierać tylko wskaźniki oznaczone do publicznej prezentacji:​     * //​doPrezentacji//​ - czy pobierać tylko wskaźniki oznaczone do publicznej prezentacji:​
Linia 37: Linia 46:
 ==== Wyszukanie skalowania do pobrania oszacowań umiejętności uczniów ==== ==== Wyszukanie skalowania do pobrania oszacowań umiejętności uczniów ====
  
-Chcielibyśmy pobrać oszacowania umiejętności uczniów ​wyliczone na potrzeby obliczania ​trzyletniego wskaźnika EWD dla części humanistycznej egzaminu gimnazjalnego dla okresu 2010-2012.+Chcielibyśmy pobrać oszacowania umiejętności uczniów ​użyte przy wyliczaniu ​trzyletniego wskaźnika EWD dla części humanistycznej egzaminu gimnazjalnego dla okresu 2010-2012. Aby pobrać oszacowania umiejętności uczniów musimy znać //​id_skali//​ oraz //​skalowanie//,​ z którego pochodzą - informację tą odnajdujemy w grupie danych //​wskaźniki//​.
  
 <code rsplus> <code rsplus>
 library(ZPD) library(ZPD)
 src = polacz() src = polacz()
-pobierz_wskazniki(src) %>​% ​collect() %>%+# pobieramy całą grupę danych wskazniki 
 +wskGh12 = pobierz_wskazniki(src) %>% 
 +  # odfiltrowujemy wyłączenie wskaźniki ewd dla części humanistycznej egzaminu, obejmujące okres 3 lat  
 +  # i wyliczone dla okresu, którego ostatnim rokiem był rok 2012;
   filter(rodzaj_wsk == '​ewd',​ czesc_egzaminu == '​humanistyczna',​ okres == 3, rok_do == 2012) %>%   filter(rodzaj_wsk == '​ewd',​ czesc_egzaminu == '​humanistyczna',​ okres == 3, rok_do == 2012) %>%
 +  # ograniczamy się do interesujących nas zmiennych - wskaznik, id_skali, skalowanie, opis_wsk
   select(wskaznik,​ id_skali, skalowanie, opis_wsk) %>%   select(wskaznik,​ id_skali, skalowanie, opis_wsk) %>%
-  distinct() %>% +  ​# odfiltrowujemy ewd. duplikaty (aby otrzymać bardziej przejrzysty wynik) 
-  ​as.data.frame()+  ​distinct() 
 +   
 +# wyświetlamy wynik 
 +wskGh12 ​%>​% ​ as.data.frame() 
 + 
 +# mając listę skalowań, możemy pobrać oszacowania 
 +oszacowaniaGh12 = pobierz_oszacowania_uczniow(src) %>%  
 +  semi_join(wskGh12) %>% 
 +  collect()
 </​code>​ </​code>​
- 
-  * pobieramy grupę danych //​wskazniki//​ 
-  * odfiltrowujemy wyłączenie wskaźniki //ewd// dla części humanistycznej egzaminu, obejmujące okres 3 lat i wyliczone dla okresu, którego ostatnim rokiem był rok 2012; 
-  * ograniczamy się do interesujących nas zmiennych - //wskaznik, id_skali, skalowanie, opis_wsk//; 
-  * odfiltrowujemy ewd. duplikaty (aby otrzymać bardziej przejrzysty wynik); 
-  * konwertujemy na ramkę danych R (aby mieć pewność, że zostaną wyświetlone wszystkie wiersze) 
- 
 ==== Wyszukiwanie wskaźników opisujących dany typ szkoły dla danego okresu ==== ==== Wyszukiwanie wskaźników opisujących dany typ szkoły dla danego okresu ====
  
Linia 62: Linia 76:
 library(ZPD) library(ZPD)
 src = polacz() src = polacz()
-pobierz_wskazniki(src,​ NA) %>​% ​collect() %>%+# pobieramy grupę danych wskazniki 
 +# NA jako drugi argument pozwoli pobrać również wskaźniki nieprzeznaczone do publicznej prezentacji 
 +pobierz_wskazniki(src,​ NA) %>% 
 +  # odfiltrowujemy wyłączenie wskaźniki dla LO, które obejmują okres zawierający 2013 rok
   filter(typ_szkoly == '​LO',​ rok_do >= 2013, rok_do - okres < 2013) %>%   filter(typ_szkoly == '​LO',​ rok_do >= 2013, rok_do - okres < 2013) %>%
 +  # ograniczamy się do interesujących nas zmiennych - rodzaj_wsk, wskaznik, okres, wsk_do_prezentacji,​ rok_do, opis_wsk
   select(rodzaj_wsk,​ wskaznik, okres, wsk_do_prezentacji,​ rok_do, opis_wsk) %>%   select(rodzaj_wsk,​ wskaznik, okres, wsk_do_prezentacji,​ rok_do, opis_wsk) %>%
 +  # odfiltrowujemy ew. duplikaty (aby otrzymać bardziej przejrzysty wynik)
   distinct() %>%   distinct() %>%
 +  # wyświetlamy wynik
   as.data.frame()   as.data.frame()
 </​code>​ </​code>​
- 
-  * pobieramy grupę danych //​wskazniki//​ - NA jako drugi argument pozwoli pobrać również wskaźniki nieprzeznaczone do publicznej prezentacji;​ 
-  * odfiltrowujemy wyłączenie wskaźniki dla //LO//, które obejmują okres zawierający 2013 rok; 
-  * ograniczamy się do interesujących nas zmiennych - //​rodzaj_wsk,​ wskaznik, okres, wsk_do_prezentacji,​ rok_do, opis_wsk//; 
-  * odfiltrowujemy ewd. duplikaty (aby otrzymać bardziej przejrzysty wynik); 
-  * konwertujemy na ramkę danych R (aby mieć pewność, że zostaną wyświetlone wszystkie wiersze) 
- 
r_gr_wskazniki.1422626788.txt.gz · ostatnio zmienione: 2015/01/30 15:06 przez zozlak