* Δημιουργία δεδομένων DataFrames: Ο πρωταρχικός σκοπός ήταν να δημιουργηθούν δεδομένα δεδομένων από διάφορες πηγές δεδομένων (όπως αρχεία CSV, αρχεία JSON, πίνακες κυψελών κ.λπ.). Τα πλαίσια Data είναι δομημένες συλλογές δεδομένων που οργανώνονται σε ονομασμένες στήλες.
* Εκτελέστε ερωτήματα SQL: Θα μπορούσατε να εκτελέσετε τα ερωτήματα SQL απευθείας έναντι των πλαισίων δεδομένων που έχουν καταχωρηθεί ως προσωρινά ή επίμονα τραπέζια εντός του κινητήρα SQL SPARK.
* Λειτουργία SQL Access Spark: Παρέχει πρόσβαση στις διάφορες λειτουργίες του κινητήρα Spark SQL, όπως οι μετασχηματισμοί δεδομένων, οι συγκεντρώσεις και άλλες λειτουργίες που μοιάζουν με SQL.
Ωστόσο, το «sqlcontext» έχει καταργηθεί. Έχει αντικατασταθεί από το «SparkSession» σε μεταγενέστερες εκδόσεις του Spark. Το «Sparksession» συνδυάζει τις λειτουργίες του «sqlcontext», του `hivecontext» και του `streamingContext` σε ένα μόνο σημείο εισόδου, παρέχοντας μια πιο ενοποιημένη και εξορθολογισμένη προσέγγιση για την εργασία με το Spark.
Στην ουσία, αν συναντήσετε `sqlcontext` σε παλαιότερο κώδικα Spark, θα πρέπει να μεταναστεύετε στη χρήση` sparksession '. Εξυπηρετούν τον ίδιο θεμελιώδη σκοπό, αλλά η «SparkSession» είναι η συνιστώμενη και υποστηριζόμενη προσέγγιση στη σύγχρονη ανάπτυξη Spark. Και οι δύο τελικά αλληλεπιδρούν με τον κινητήρα SQL Spark, αλλά το "Sparksession` προσφέρει μια πιο ολοκληρωμένη εμπειρία.
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα