La programmation hadoop

21

Hadoop «Impossible de charger la bibliothèque native-hadoop pour votre plate-forme»

Je configure actuellement hadoop sur un serveur exécutant CentOs . Lorsque j'exécute start-dfs.shou stop-dfs.sh, j'obtiens l'erreur suivante: WARN util.NativeCodeLoader: impossible de charger la bibliothèque native-hadoop pour votre plate-forme ... à l'aide des classes Java intégrées le cas échéant J'utilise Hadoop 2.2.0. Faire une recherche en ligne a fait apparaître ce …

269 java linux hadoop hadoop2 java.library.path

19

Différence entre porc et ruche? Pourquoi avoir les deux? [fermé]

Fermé . Cette question est basée sur l'opinion . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin d'y répondre avec des faits et des citations en modifiant ce message . Fermé il y a 4 ans . Améliorez cette question Mon parcours …

256 hadoop hive apache-pig

8

Apache Spark: le nombre de cœurs par rapport au nombre d'exécuteurs

J'essaie de comprendre la relation entre le nombre de cœurs et le nombre d'exécuteurs lors de l'exécution d'un travail Spark sur YARN. L'environnement de test est le suivant: Nombre de nœuds de données: 3 Spécifications de la machine du nœud de données: CPU: Core i7-4790 (nombre de cœurs: 4, nombre …

195 hadoop apache-spark yarn

16

Quand utiliser Hadoop, HBase, Hive et Pig?

Quels sont les avantages de l' utilisation soit Hadoop ou HBase ou Ruche ? D'après ce que je comprends, HBase évite d'utiliser la réduction de carte et dispose d'un stockage orienté colonne au-dessus de HDFS. Hive est une interface de type sql pour Hadoop et HBase . J'aimerais également savoir …

185 hadoop hbase hive apache-pig

15

Comment désactiver la journalisation INFO dans Spark?

J'ai installé Spark à l'aide du guide AWS EC2 et je peux lancer le programme correctement en utilisant le bin/pysparkscript pour accéder à l'invite Spark et je peux également effectuer le démarrage rapide avec succès. Cependant, je ne peux pas pour la vie de moi comprendre comment arrêter toute la …

144 python scala apache-spark hadoop pyspark

14

Spark - charger le fichier CSV en tant que DataFrame?

Je voudrais lire un CSV dans Spark et le convertir en DataFrame et le stocker en HDFS avec df.registerTempTable("table_name") J'ai essayé: scala> val df = sqlContext.load("hdfs:///csv/file/dir/file.csv") Erreur que j'ai obtenue: java.lang.RuntimeException: hdfs:///csv/file/dir/file.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [49, 59, …

142 scala apache-spark hadoop apache-spark-sql hdfs

3

Quels sont les avantages et les inconvénients du format parquet par rapport aux autres formats?

Les caractéristiques d'Apache Parquet sont: Auto-descriptif Format en colonne Indépendant de la langue En comparaison avec Avro, les fichiers de séquence, les fichiers RC, etc. je veux un aperçu des formats. J'ai déjà lu: Comment Impala fonctionne avec les formats de fichiers Hadoop , cela donne quelques aperçus sur les …

137 file hadoop hdfs avro parquet

8

Comment copier un fichier de HDFS vers le système de fichiers local

Comment copier un fichier de HDFS vers le système de fichiers local. Il n'y a pas d'emplacement physique d'un fichier sous le fichier, pas même de répertoire. comment puis-je les déplacer dans mon local pour d'autres validations.Je suis essayé via winscp.

135 hadoop copy hdfs

6

Différence entre HBase et Hadoop / HDFS

C'est un peu une question naïve mais je suis nouveau dans le paradigme NoSQL et je n'en sais pas grand-chose. Donc, si quelqu'un peut m'aider à comprendre clairement la différence entre le HBase et Hadoop ou si vous donnez des conseils qui pourraient m'aider à comprendre la différence. Jusqu'à présent, …

130 hadoop nosql hbase hdfs difference

8

Quelle est la différence entre le partitionnement et le compartimentage d'une table dans Hive?

Je sais que les deux sont effectués sur une colonne du tableau, mais en quoi chaque opération est-elle différente.

129 hadoop hive

13

Chaînage de plusieurs tâches MapReduce dans Hadoop

Dans de nombreuses situations réelles où vous appliquez MapReduce, les algorithmes finaux finissent par être plusieurs étapes MapReduce. c'est-à-dire Map1, Reduce1, Map2, Reduce2, et ainsi de suite. Vous avez donc la sortie de la dernière réduction qui est nécessaire comme entrée pour la carte suivante. Les données intermédiaires sont quelque …

124 hadoop mapreduce

9

Le nœud de nom est en mode sans échec. Impossible de partir

root# bin/hadoop fs -mkdir t mkdir: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/root/t. Name node is in safe mode. impossible de créer quoi que ce soit dans hdfs J'ai fait root# bin/hadoop fs -safemode leave Mais montrant safemode: Unknown command quel est le problème? Solution

122 hadoop hdfs

6

Comment Hadoop traite-t-il les enregistrements répartis entre les limites des blocs?

Selon le Hadoop - The Definitive Guide Les enregistrements logiques définis par FileInputFormats ne s'intègrent généralement pas parfaitement dans les blocs HDFS. Par exemple, les enregistrements logiques d'un TextInputFormat sont des lignes qui traverseront le plus souvent les limites HDFS. Cela n'a aucune incidence sur le fonctionnement de votre programme …

119 hadoop split mapreduce block hdfs

9

Quel est le but de la phase de mélange et de tri dans le réducteur dans Map Reduce Programming?

Dans la programmation de Map Reduce, la phase de réduction comprend le mélange, le tri et la réduction comme sous-parties. Le tri est une affaire coûteuse. Quel est le but de la phase de mélange et de tri dans le réducteur dans Map Reduce Programming?

113 sorting hadoop mapreduce hdfs shuffle

18

Différence entre les tables internes Hive et les tables externes?

Quelqu'un peut-il me dire la différence entre la table externe de Hive et les tables internes. Je sais que la différence vient du fait de laisser tomber la table. Je ne comprends pas ce que vous entendez par les données et les métadonnées sont supprimées en interne et seules les …

110 hadoop hive hiveql

Questions marquées «hadoop»