Narzędzia użytkownika

Narzędzia witryny


r_dplyr

Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
r_dplyr [2015/01/19 21:13]
zozlak
r_dplyr [2015/01/30 10:58]
zozlak
Linia 1: Linia 1:
-====== ​Wprowadzenie do pakietu ​dplyr ======+====== ​Dlaczego pakiet ​dplyr======
  
 //Dplyr// usprawnia przetwarzanie danych w R na wielu płaszczyznach:​ //Dplyr// usprawnia przetwarzanie danych w R na wielu płaszczyznach:​
Linia 6: Linia 6:
   * funkcje //dplyr-a// łączą się z sobą w logiczny sposób (w odróżnieniu od wielu bazowych funkcji R);   * funkcje //dplyr-a// łączą się z sobą w logiczny sposób (w odróżnieniu od wielu bazowych funkcji R);
   * funkcje //dplyr-a// wyrabiają w użytkowniku dobre nawyki związane z przekształcaniem danych;   * funkcje //dplyr-a// wyrabiają w użytkowniku dobre nawyki związane z przekształcaniem danych;
 +    * patrz idea //​nieuporządkowanych//​ i //​uporządkowanych//​ danych przedstawiona {{http://​vita.had.co.nz/​papers/​tidy-data.pdf|tutaj}};​
   * //dplyr// umożliwia korzystanie z SQL-owych baz danych w taki sposób, jakby niczym nie różniły się one od zwykłego zbioru wielu ramek danych R.   * //dplyr// umożliwia korzystanie z SQL-owych baz danych w taki sposób, jakby niczym nie różniły się one od zwykłego zbioru wielu ramek danych R.
  
Linia 16: Linia 17:
     * Charakterystyczne dla tego sposobu przetwarzania danych jest łączenie wywołań //​czasowników//​ w (czasem dość długie) ciągi. Aby uczynić zapis takich łańcuchów bardziej czytelnym, stosowany jest [[r_dplyr_potoki|operator potoku (%>%)]].     * Charakterystyczne dla tego sposobu przetwarzania danych jest łączenie wywołań //​czasowników//​ w (czasem dość długie) ciągi. Aby uczynić zapis takich łańcuchów bardziej czytelnym, stosowany jest [[r_dplyr_potoki|operator potoku (%>%)]].
  
-Poniżej znajduje się (możliwie pełne) kompedium funkcji dostępnych w wersji 0.4 pakietu //dplyr//. 
- 
-===== Funkcje w podziale na grupy zastosowań ===== 
- 
-  * [[r_dplyr_tablice|Tablice dplyr]] 
-  * [[r_dplyr_potoki|Potoki]] (operator %>%) 
-  * Czasowniki 
-    * [[r_dplyr_wiersze|wybór wierszy]]: //filter(), slice(), distinct(), sample_frac(),​ sample_n(), semi_join(),​ intersect(),​ anti_join(),​ setdiff()// 
-    * [[r_dplyr_kolumny|operacje na kolumnach (zmiennych)]]:​ //mutate(), mutate_each(),​ transmute(),​ select(), rename()// 
-    * [[r_dplyr_sortowanie|sortowanie]]:​ //​arrange()//​ 
-    * [[r_dplyr_agreagety|grupowanie i agregowanie]]:​ //​group_by(),​ ungroup(), summarize(),​ summarize_each()//​ 
-    * [[r_dplyr_zlaczanie|złączanie tablic]]: //​inner_join(),​ left_join(),​ right_join(),​ full_join(),​ union(), bind_rows(),​ bind_cols()//​ 
-    * [[r_dplyr_pobranie|pobranie danych z serwera]]: //​collect()//​ 
  
  
r_dplyr.txt · ostatnio zmienione: 2015/01/30 10:58 przez zozlak