Il n'y a aucune raison d'afficher la sortie entière d'une grande trame de données. L'affichage ou la manipulation de grandes trames de données utilisera inutilement de grandes quantités de ressources informatiques.
Tout ce que vous faites peut se faire en miniature. Il est beaucoup plus facile de travailler sur le codage et la manipulation de données lorsque la trame de données est petite. La meilleure façon de travailler avec des données volumineuses est de créer une nouvelle trame de données qui ne prend qu'une petite partie ou un petit échantillon de la grande trame de données. Ensuite, vous pouvez explorer les données et effectuer votre codage sur la plus petite trame de données. Une fois que vous avez exploré les données et que votre code fonctionne, utilisez simplement ce code sur le bloc de données plus grand.
La manière la plus simple consiste simplement à prendre le premier n, nombre des premières lignes de la trame de données à l'aide de la fonction head (). La fonction head n'imprime que n, nombre de lignes. Vous pouvez créer une mini trame de données en utilisant la fonction head sur la grande trame de données. Ci-dessous, j'ai choisi de sélectionner les 50 premières lignes et de transmettre leur valeur au small_df. Cela suppose que le BigData est un fichier de données provenant d'une bibliothèque que vous avez ouverte pour ce projet.
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
Cela fonctionnera la plupart du temps, mais parfois la trame Big Data est fournie avec des variables pré-triées ou avec des variables déjà groupées. Si les mégadonnées sont comme ceci, vous devrez alors prélever un échantillon aléatoire des lignes des mégadonnées. Utilisez ensuite le code qui suit:
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df