Narzędzia użytkownika

Narzędzia witryny


r_dplyr

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
Ostatnia wersja Both sides next revision
r_dplyr [2015/01/19 20:56]
zozlak
r_dplyr [2015/01/30 10:56]
zozlak [Funkcje w podziale na grupy zastosowań]
Linia 1: Linia 1:
 ====== Wprowadzenie do pakietu dplyr ====== ====== Wprowadzenie do pakietu dplyr ======
  
-  ​[[r_dplyr_tablice|Tablice ​dplyr]] +//Dplyr// usprawnia przetwarzanie danych w R na wielu płaszczyznach:​ 
-  * [[r_dplyr_potoki|Potoki]] ​(operator %>%+ 
-  * Czasowniki +  ​funkcje //dplyr-a// działają dużo szybciej niż bazowe funkcje R; 
-    [[r_dplyr_wiersze|wybór wierszy]]: ​//filter()slice()distinct(), sample_frac(),​ sample_n(), semi_join(),​ intersect(),​ anti_join(),​ setdiff()// +  * funkcje //dplyr-a// łączą się z sobą w logiczny sposób ​(w odróżnieniu od wielu bazowych funkcji R); 
-    * [[r_dplyr_kolumny|operacje na kolumnach (zmiennych)]]: ​//mutate()mutate_each()transmute(),​ select(), rename()// +  * funkcje //dplyr-a// wyrabiają w użytkowniku dobre nawyki związane z przekształcaniem danych; 
-    * [[r_dplyr_sortowanie|sortowanie]]: ​//arrange()// +  * //dplyr// umożliwia korzystanie z SQL-owych baz danych w taki sposóbjakby niczym nie różniły się one od zwykłego zbioru wielu ramek danych R. 
-    [[r_dplyr_agreagety|grupowanie i agregowanie]]: ​//group_by()ungroup()summarize()summarize_each()// + 
-    * [[r_dplyr_zlaczanie|złączanie tablic]]: ​//inner_join(), left_join(),​ right_join(),​ full_join(),​ union(), bind_rows(),​ bind_cols()//​ +Wejście w świat dplyr-a nie powinno nastręczyć specjalnych trudnościponieważ ​//dplyr-owe// odpowiedniki ramek danych zachowują się jak zwykłe ramki danych we wszystkich funkcjachktóre nie korzystają z ich specjalnych własnościa z kolei wszystkie funkcje ​//dplyr-a// akceptują też zwykłe R-owe ramki danych. 
-    * [[r_dplyr_pobranie|pobranie danych z serwera]]//collect()//+ 
 +Praca z danymi w pakiecie ​//dplyr// sprowadza się do: 
 + 
 +  ​Pobrania danych do zwykłej ramki danych R. 
 +  * Przekształcaniu danych za pomocą tzw. //czasowników//​ - funkcjiz których każda wykonuje na danych jednądobrze określoną czynność ​(np. tworzy zmiennegrupuje, agreguje, itp.). 
 +    * Charakterystyczne dla tego sposobu przetwarzania danych jest łączenie wywołań ​//czasowników//​ w (czasem dość długieciągi. Aby uczynić zapis takich łańcuchów bardziej czytelnymstosowany jest [[r_dplyr_potoki|operator potoku (%>%)]]
 + 
 +Poniżej znajduje się (możliwie pełne) kompedium funkcji dostępnych w wersji 0.4 pakietu ​//dplyr//.
  
  
r_dplyr.txt · ostatnio zmienione: 2015/01/30 10:58 przez zozlak