Narzędzia użytkownika

Narzędzia witryny


r_dplyr_tablice

To jest stara wersja strony!


Tablice dplyr

Tworzenie

Z ramki danych R

  • Wszystkie czasowniki radzą sobie z przetwarzaniem ramek danych R, więc nie ma potrzeby przekształcania ramek danych R na tablice dplyr.
  • Jeśli kluczowa jest wydajność, można przekształcić ramkę danych R na tablicę dplyr korzystającą z backend-u data.table:
    library(data.table)
    library(dplyr)
    daneDf = read.csv2('mojeDane.csv')
    daneTbl = tbl_dt(daneDf)

Z grupy danych w bazie

Funkcje pakietu ZPD pobierające grupy danych z bazy zwracają tablice dplyr, nie trzeba ich więc konwertować.

Z dowolnego zapytania SQL wykonanego na bazie

  • Nawiąż połączenie z bazą danych funkcją polacz() pakietu ZPD.
  • Utwórz tablicę dplyr kombinacją funkcji tbl() oraz sql()
library(ZPD)
src = polacz()
dane = tbl(src, sql("SELECT * FROM kryteria_oceny JOIN pytania USING (id_pytania)")

[w ten sposób działają wewnętrznie funkcje pakietu ZPD pobierający grupy danych z bazy]

Konwersja na ramkę danych

Wystarczy skorzystać z funkcji as.data.frame(), np.

library(ZPD)
src = polacz()
testyTbl = pobierz_testy()
testyDf = as.data.frame(testyTbl)

Przy tym:

  • jeśli tablica dplyr pochodzi z bazy danych, wywołanie as.data.frame() spowoduje najpierw przekształcenie jej w tablicę lokalną (wywołanie czasownika collect());
  • jeśli na tablicy dplyr określone zostało (czasownikiem group_by()) grupowanie, ale nie została wykonana (czasownikie summarize()) agregacja, to ramka danych R będzie zawierała dane niezagregowane.
r_dplyr_tablice.1418808485.txt.gz · ostatnio zmienione: 2014/12/17 10:28 przez zozlak