Sto costruendo un frame di big data unendo il contenuto di alcuni file insieme. Questi file condividono lo stesso layout di colonne.
c = read.delim ('bigfile1.txt') c1 = read.delim ('bigfile2.txt') c2 = read.delim ('bigfile3 .txt ') ctmp1 = merge (c, c1, all = TRUE) ctmp2 = merge (ctmp1, c2, all = TRUE)
Il codice precedente è efficiente?
Dovrei invece riutilizzare lo stesso nome di variabile, ad esempio
tmp = merge (c, c1, all = TRUE) tmp = merge (tmp, c2, all = TRUE)