Narzędzia użytkownika

Narzędzia witryny


pobieranie_wartosci_ewd

Pobieranie zestawień wartości wskaźników EWD

Pobieranie zestawień wartości wskaźników EWD możliwe jest w łatwy sposób przy użyciu funkcji pobierz_wartosci_wskaznikow_ewd() z pakietu EWDdane. Funkcja zapisuje plik w formacie .csv (domyślnie w kodowaniu windows-1250), domyślnie z bardzo opisowymi, zrozumiałymi dla każdego odbiorcy, nazwami kolumn.

Aby można było jej użyć, trzeba jednak wcześniej:

Jeśli czynności te zostały wykonane, pozostaje uruchomić R i wykonać kod:

library(EWDdane)
pobierz_wartosci_wskaznikow_ewd(typ_szkoly, lata, nazwa_pliku)
  • Za typ_szkoly należy podstawić „gimn.”, „LO” lub „T” (łącznie z cudzysłowem).
  • Za lata należy podstawić interesujący nas rok lub, jeśli chcemy pobrać wartości wskaźników z kilku lat, ich zakres definiowany składnią rok_od:rok_do.
    • Podane liczby wskazują na ostatni rok, który obejmuje wskaźnik, tak więc np. wskaźnik 2014-2012 uzyskamy podając jako rok 2014, a wskaźniki od trzylatki 2010-2008 do trzylatki 2013-2011 uzyskamy podając zakres 2010:2013.
  • Za nazwa_pliku należy podstawić ujętą w cudzysłów nazwę pliku, do którego mają zostać zapisane wyniki.
    • Jeśli nie jesteś pewien, jaki jest aktywny katalog roboczy R lub jeśli nie masz pojęcia, o co chodzi z tym katalogiem, podaj tą nazwę łącznie ze ścieżką do katalogu, np:
      • „D:/mój katalog/wskazniki_gimnazjalne.csv” zapisze wyniki w pliku wskazniki_gimnazjalne.csv, w katalogu mój katalog na dysku D.
      • „~/wskazniki_gimnazjalne.csv” zapisze wyniki w pliku wskazniki_gimnazjalne.csv, w Twoim katalogu Moje dokumenty (jeśli używasz Windows).

Uwaga! Funkcja poza wyrzuceniem na konsolę komunikatów, że to i tamto właśnie pobiera lub wylicza wyrzuci na nią (czasem nawet kilkakrotnie) również komunikat: Auto-disconnecting postgres connection (liczba, liczba). Jest to (niestety) zupełnie normalne, nie świadczy o żadnych błędach i nie należy się tym przejmować.

Jeśli kiedyś działało, a teraz nie działa...

Zapewne coś zmieniło się w strukturze bazy danych i konieczne jest zainstalowanie nowej wersji pakietów. Wykonaj w R polecenie:

devtools::install_github('zozlak/ZPD')
devtools::install_github('tzoltak/EWDdane')
library(EWDdane)

i spróbuj ponownie pobrać dane.

Przykłady użycia

Proste pobieranie wskaźników z jednego roku

Pliki wynikowe zapisywane w katalogu Moje dokumenty.

Wskaźniki gimnazjalne 2013-2011

pobierz_wartosci_wskaznikow_ewd('gimn.', 2013, '~/wskazniki gimnazjalne 2013-2011.csv')

Wskaźniki maturalne dla LO 2013-2011

pobierz_wartosci_wskaznikow_ewd('LO', 2013, '~/wskaźniki LO 2010-2008.csv')

Wskaźniki maturalne dla techników 2012-2010

pobierz_wartosci_wskaznikow_ewd('T', 2012, '~/wskazniki_T_12-10.csv')

Pobieranie wyników z wielu lat

Pliki wynikowe zapisywane w katalogu Moje dokumenty.

Wskaźniki gimnazjalne od 2010-2008 do 2013-2011

pobierz_wartosci_wskaznikow_ewd('gimn.', 2010:2013, '~/wskazniki gimnazjalne 10_08-13_11.csv')

Wskaźniki maturalne dla LO z trzylatek 2011-2009 i 2014-2012

pobierz_wartosci_wskaznikow_ewd('gimn.', c(2014, 2011), '~/wskazniki LO 14_12-11_09.csv')

Pobieranie wyników tylko dla pewnych JST (np. gmin)

Najpierw musisz wiedzieć, jaki jest kod TERYT jednostki (jednostek) samorządu terytorialnego, dla której chcesz pobrać dane. Można to zrobić np. na tej stronie: http://tomek.zozlak.org/inne/podz_teryt/podz_teryt.php.

Warto też znać podstawowe zasady składni wyrażeń regularnych w R (aby dowiedzieć się więcej będąc w R wywołaj „?regex”). Do typowych zastosowań powinno jednak wystarczyć zapoznanie się z przykładami poniżej.

Wskaźniki gimnazjalne 2013-2011 dla gminy Krotoszyce

Gmina Krotoszyce ma TERYT 20903. Interesujące nas wyrażenie regularne to '^20903$'.

pobierz_wartosci_wskaznikow_ewd('gimn.', 2013, '~/gimnazja_Krotoszyce_13-11.csv', '^20903$')

Wskaźniki maturalne dla LO 2012-2010 z województw łódzkiego i świętokrzyskiego

Województwo łódzkie ma TERYT 100000 a świętokrzyskie 260000. Gminy znajdujące się w tych województwach będą więc mieć kody TERYT rozpoczynające się od „10” lub od „26” (a następnie cztery kolejne cyfry opisujące powiat i gminę). Odpowiednie wyrażenie regularne to: '^(10|26)….$'.

pobierz_wartosci_wskaznikow_ewd('LO', 2012, '~/LO OKE Łódź 10-09.csv', '^(10|26)....$')

Wskaźniki gimnazjalne 2014-2012 dla Warszawy

Warszawa jest w zasadzie jedną gminą, ale dzieli się na jednostki (dzielnice) o różnych kodach TERYT. Kody TERYT tych jednostek rozpoczynają się jednak od opisu powiatu (miasta na prawach powiatu) Warszawa, a więc 1465 (potem następują dwie cyfry opisujące dzielnicę). Poszukujemy więc JST, których TERYT opisuje wyrażenie regularne: '^1465..$', a więc, który zaczyna się od ciągu „1465”, po którym następują dwa dowolne znaki.

Analogicznie należy pobierać dane dla Krakowa, Łodzi, Poznania i Wrocławia (czyli tych, w których występują delegatury).

pobierz_wartosci_wskaznikow_ewd('gimn.', 2014, '~/gimnazja Warszawa 14-12.csv', '^1465..')
pobieranie_wartosci_ewd.txt · ostatnio zmienione: 2015/03/04 10:28 przez t.zoltak