Pobieranie zestawień wartości wskaźników EWD możliwe jest w łatwy sposób przy użyciu funkcji pobierz_wartosci_wskaznikow_ewd() z pakietu EWDdane. Funkcja zapisuje plik w formacie .csv (domyślnie w kodowaniu windows-1250), domyślnie z bardzo opisowymi, zrozumiałymi dla każdego odbiorcy, nazwami kolumn.
Aby można było jej użyć, trzeba jednak wcześniej:
Jeśli czynności te zostały wykonane, pozostaje uruchomić R i wykonać kod:
library(EWDdane) pobierz_wartosci_wskaznikow_ewd(typ_szkoly, lata, nazwa_pliku)
Uwaga! Funkcja poza wyrzuceniem na konsolę komunikatów, że to i tamto właśnie pobiera lub wylicza wyrzuci na nią (czasem nawet kilkakrotnie) również komunikat: Auto-disconnecting postgres connection (liczba, liczba). Jest to (niestety) zupełnie normalne, nie świadczy o żadnych błędach i nie należy się tym przejmować.
Zapewne coś zmieniło się w strukturze bazy danych i konieczne jest zainstalowanie nowej wersji pakietów. Wykonaj w R polecenie:
devtools::install_github('zozlak/ZPD') devtools::install_github('tzoltak/EWDdane') library(EWDdane)
i spróbuj ponownie pobrać dane.
Pliki wynikowe zapisywane w katalogu Moje dokumenty.
Wskaźniki gimnazjalne 2013-2011
pobierz_wartosci_wskaznikow_ewd('gimn.', 2013, '~/wskazniki gimnazjalne 2013-2011.csv')
Wskaźniki maturalne dla LO 2013-2011
pobierz_wartosci_wskaznikow_ewd('LO', 2013, '~/wskaźniki LO 2010-2008.csv')
Wskaźniki maturalne dla techników 2012-2010
pobierz_wartosci_wskaznikow_ewd('T', 2012, '~/wskazniki_T_12-10.csv')
Pliki wynikowe zapisywane w katalogu Moje dokumenty.
Wskaźniki gimnazjalne od 2010-2008 do 2013-2011
pobierz_wartosci_wskaznikow_ewd('gimn.', 2010:2013, '~/wskazniki gimnazjalne 10_08-13_11.csv')
Wskaźniki maturalne dla LO z trzylatek 2011-2009 i 2014-2012
pobierz_wartosci_wskaznikow_ewd('gimn.', c(2014, 2011), '~/wskazniki LO 14_12-11_09.csv')
Najpierw musisz wiedzieć, jaki jest kod TERYT jednostki (jednostek) samorządu terytorialnego, dla której chcesz pobrać dane. Można to zrobić np. na tej stronie: http://tomek.zozlak.org/inne/podz_teryt/podz_teryt.php.
Warto też znać podstawowe zasady składni wyrażeń regularnych w R (aby dowiedzieć się więcej będąc w R wywołaj „?regex”). Do typowych zastosowań powinno jednak wystarczyć zapoznanie się z przykładami poniżej.
Wskaźniki gimnazjalne 2013-2011 dla gminy Krotoszyce
Gmina Krotoszyce ma TERYT 20903. Interesujące nas wyrażenie regularne to '^20903$'.
pobierz_wartosci_wskaznikow_ewd('gimn.', 2013, '~/gimnazja_Krotoszyce_13-11.csv', '^20903$')
Wskaźniki maturalne dla LO 2012-2010 z województw łódzkiego i świętokrzyskiego
Województwo łódzkie ma TERYT 100000 a świętokrzyskie 260000. Gminy znajdujące się w tych województwach będą więc mieć kody TERYT rozpoczynające się od „10” lub od „26” (a następnie cztery kolejne cyfry opisujące powiat i gminę). Odpowiednie wyrażenie regularne to: '^(10|26)….$'.
pobierz_wartosci_wskaznikow_ewd('LO', 2012, '~/LO OKE Łódź 10-09.csv', '^(10|26)....$')
Wskaźniki gimnazjalne 2014-2012 dla Warszawy
Warszawa jest w zasadzie jedną gminą, ale dzieli się na jednostki (dzielnice) o różnych kodach TERYT. Kody TERYT tych jednostek rozpoczynają się jednak od opisu powiatu (miasta na prawach powiatu) Warszawa, a więc 1465 (potem następują dwie cyfry opisujące dzielnicę). Poszukujemy więc JST, których TERYT opisuje wyrażenie regularne: '^1465..$', a więc, który zaczyna się od ciągu „1465”, po którym następują dwa dowolne znaki.
Analogicznie należy pobierać dane dla Krakowa, Łodzi, Poznania i Wrocławia (czyli tych, w których występują delegatury).
pobierz_wartosci_wskaznikow_ewd('gimn.', 2014, '~/gimnazja Warszawa 14-12.csv', '^1465..')