Je travaille à la mise en place d'un ensemble de machines virtuelles pour expérimenter avec Spark avant de dépenser et de dépenser de l'argent pour construire un cluster avec du matériel. Note rapide: je suis un universitaire avec une formation en apprentissage automatique appliqué et je travaille un peu en science des données J'utilise les outils informatiques, rarement j'aurais besoin de les configurer.
J'ai créé 3 machines virtuelles (1 maître, 2 esclaves) et installé Spark avec succès. Tout semble fonctionner comme il se doit. Mon problème réside dans la création d'un serveur Jupyter auquel on peut se connecter à partir d'un navigateur qui ne fonctionne pas sur une machine du cluster.
J'ai installé le bloc-notes Jupyter avec succès ... et il fonctionne. J'ai ajouté un nouveau profil IPython se connectant à un serveur distant avec Spark.
maintenant le problème
La commande
$ ipython --profile=pyspark
fonctionne bien et il se connecte au cluster d'étincelles. cependant,
$ ipython notebook --profile=pyspark
[<stuff is here>] Unrecognized alias: "profile=pyspark", it will probably have no effect.
par défaut, le default
profil n'est pas le pyspark
profil.
Ma config notebook pour pyspark
a:
c = get_config()
c.NotebookApp.ip = '*'
c.NotebookApp.open_browser = False
c.NotebookApp.port = 8880
c.NotebookApp.server_extensions.append('ipyparallel.nbextension')
c.NotebookApp.password = u'some password is here'
$ ipython --profile=pyspark notebook
? Il se peut que le problème ne soit lié qu'à l'ordre des arguments.