Questions marquées «distributed-computing»

5
Expliquer Apache ZooKeeper
J'essaie de comprendre ZooKeeper, comment cela fonctionne et ce qu'il fait. Existe-t-il une application comparable à ZooKeeper? Si vous le savez, comment décririez-vous ZooKeeper à un profane? J'ai essayé apache wiki, zookeeper sourceforge ... mais je ne suis toujours pas en mesure de m'identifier à lui. Je viens de lire …

13
Spark - répartition () vs coalesce ()
Selon Learning Spark Gardez à l'esprit que la répartition de vos données est une opération assez coûteuse. Spark a également une version optimisée de repartition()appelée coalesce()qui permet d'éviter le mouvement des données, mais uniquement si vous diminuez le nombre de partitions RDD. Une différence que j'obtiens est qu'avec repartition()le nombre …




25
Calculez la médiane d'un milliard de nombres
Si vous avez un milliard de nombres et cent ordinateurs, quelle est la meilleure façon de localiser la médiane de ces nombres? Une solution que j'ai est: Répartissez l'ensemble de manière égale entre les ordinateurs. Triez-les. Trouvez les médianes pour chaque ensemble. Triez les ensembles sur les médianes. Fusionner deux …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.