Questions marquées «azure-databricks»

Apache Spark: impact du repartitionnement, du tri et de la mise en cache sur une jointure

J'explore le comportement de Spark en joignant une table à elle-même. J'utilise Databricks. Mon scénario fictif est: Lire une table externe en tant que trame de données A (les fichiers sous-jacents sont au format delta) Définissez la trame de données B comme trame de données A avec seulement certaines colonnes …

10 apache-spark pyspark bigdata azure-databricks delta-lake

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.

Licensed under cc by-sa 3.0 with attribution required.