To jest stara wersja strony!
filter(tablica, warunek1, …)
t1 = data.frame(id = 11:16, zmienna1 = c('a', 'b', 'c', 'd', 'e', 'f')) filter(t1, id < 13, zmienna1 %in% c('b', 'c')) # wynikiem będzie: # # id zmienna1 # 12 b filter(t1, id < 13 | zmienna1 %in% c('b', 'c')) # wynikiem będzie: # # id zmienna1 # 12 b # 13 c
slice(tablica, wektorNumerówWierszy)
t1 = data.frame(id = 11:16, zmienna1 = c('a', 'b', 'c', 'd', 'e', 'f')) slice(t1, c(2, 4, 6)) # wynikiem będzie: # # id zmienna1 # 12 b # 14 d # 16 f
distinct(tablica)
dane = data.frame(x = c(1, 1, 1), y = c(1, 2, 1)) distinct(dane) # wynikiem będzie: # # x y # 1 1 # 1 2
semi_join(tablica1, tablica2)
t1 = data.frame(id = 1:3, zmienna1 = c('a', 'b', 'c')) t2 = data.frame(id = 2:4, zmienna2 = c('x', 'y', 'z')) semi_join(t1, t2) # wynikiem będzie: # # id zmienna1 # 2 b # 3 c
anti_join(tablica1, tablica2)
t1 = data.frame(id = 1:3, zmienna1 = c('a', 'b', 'c')) t2 = data.frame(id = 2:4, zmienna2 = c('x', 'y', 'z')) anti_join(t1, t2) # wynikiem będzie: # # id zmienna1 # 1 a
sample_frac(tablica, odsetek, czyZeZwracaniem, wagi)
dane = data.frame(x = 1:10) sample_frac(dane, 0.5) # wynikiem będzie tablica o 5 wierszach, żadna wartość nie będzie się powtarzać sample_frac(dane, 0.7, TRUE) # wynikiem będzie tablica o 7 wierszach, wartości mogą się powtarzać sample_frac(dane, 0.7, F, x) # wynikiem będzie tablica o 7 wierszach, wartości nie będą się powtarzać, pradopodobieństwo wylosowania liczby będzie proporcjonalne do wartości liczby
sample_n(tablica, liczbaWierszy, czyZeZwracaniem, wagi)
dane = data.frame(x = 1:10) sample_n(dane, 5) # wynikiem będzie tablica o 5 wierszach, żadna wartość nie będzie się powtarzać sample_n(dane, 7, TRUE) # wynikiem będzie tablica o 7 wierszach, wartości mogą się powtarzać sample_n(dane, 7, F, x) # wynikiem będzie tablica o 7 wierszach, wartości nie będą się powtarzać, pradopodobieństwo wylosowania liczby będzie proporcjonalne do wartości liczby