Narzędzia użytkownika

Narzędzia witryny


r_dplyr

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
r_dplyr [2015/01/19 20:56]
zozlak
r_dplyr [2015/01/30 10:58]
zozlak
Linia 1: Linia 1:
-====== ​Wprowadzenie do pakietu ​dplyr ======+====== ​Dlaczego pakiet ​dplyr====== 
 + 
 +//Dplyr// usprawnia przetwarzanie danych w R na wielu płaszczyznach:​ 
 + 
 +  * funkcje //dplyr-a// działają dużo szybciej niż bazowe funkcje R; 
 +  * funkcje //dplyr-a// łączą się z sobą w logiczny sposób (w odróżnieniu od wielu bazowych funkcji R); 
 +  * funkcje //dplyr-a// wyrabiają w użytkowniku dobre nawyki związane z przekształcaniem danych; 
 +    * patrz idea //​nieuporządkowanych//​ i //​uporządkowanych//​ danych przedstawiona {{http://​vita.had.co.nz/​papers/​tidy-data.pdf|tutaj}};​ 
 +  * //dplyr// umożliwia korzystanie z SQL-owych baz danych w taki sposób, jakby niczym nie różniły się one od zwykłego zbioru wielu ramek danych R. 
 + 
 +Wejście w świat dplyr-a nie powinno nastręczyć specjalnych trudności, ponieważ //​dplyr-owe//​ odpowiedniki ramek danych zachowują się jak zwykłe ramki danych we wszystkich funkcjach, które nie korzystają z ich specjalnych własności,​ a z kolei wszystkie funkcje //dplyr-a// akceptują też zwykłe R-owe ramki danych. 
 + 
 +Praca z danymi w pakiecie //dplyr// sprowadza się do: 
 + 
 +  * Pobrania danych do zwykłej ramki danych R. 
 +  * Przekształcaniu danych za pomocą tzw. //​czasowników//​ - funkcji, z których każda wykonuje na danych jedną, dobrze określoną czynność (np. tworzy zmienne, grupuje, agreguje, itp.). 
 +    * Charakterystyczne dla tego sposobu przetwarzania danych jest łączenie wywołań //​czasowników//​ w (czasem dość długie) ciągi. Aby uczynić zapis takich łańcuchów bardziej czytelnym, stosowany jest [[r_dplyr_potoki|operator potoku (%>%)]].
  
-  * [[r_dplyr_tablice|Tablice dplyr]] 
-  * [[r_dplyr_potoki|Potoki]] (operator %>%) 
-  * Czasowniki 
-    * [[r_dplyr_wiersze|wybór wierszy]]: //filter(), slice(), distinct(), sample_frac(),​ sample_n(), semi_join(),​ intersect(),​ anti_join(),​ setdiff()// 
-    * [[r_dplyr_kolumny|operacje na kolumnach (zmiennych)]]:​ //mutate(), mutate_each(),​ transmute(),​ select(), rename()// 
-    * [[r_dplyr_sortowanie|sortowanie]]:​ //​arrange()//​ 
-    * [[r_dplyr_agreagety|grupowanie i agregowanie]]:​ //​group_by(),​ ungroup(), summarize(),​ summarize_each()//​ 
-    * [[r_dplyr_zlaczanie|złączanie tablic]]: //​inner_join(),​ left_join(),​ right_join(),​ full_join(),​ union(), bind_rows(),​ bind_cols()//​ 
-    * [[r_dplyr_pobranie|pobranie danych z serwera]]: //​collect()//​ 
  
  
r_dplyr.txt · ostatnio zmienione: 2015/01/30 10:58 przez zozlak