λογισμικό

* Γνώση Υπολογιστών >> λογισμικό >> λογισμικού βάσεων δεδομένων

Data Mining & η διαδικασία ETL

Η επεξεργαστική ισχύ των υπολογιστών επιτρέπει στους ερευνητές και τις επιχειρήσεις να αναλύουν τα δεδομένα με πιο περίπλοκους τρόπους από κάθε πριν . Η εξόρυξη δεδομένων είναι η διαδικασία της προσπαθεί να βρει χρήσιμες πληροφορίες σε μεγάλα σύνολα δεδομένων . ETL διαδικασία εξόρυξης δεδομένων αναφέρεται στα μέτρα με τα οποία τα δεδομένα καταγράφονται , κωδικοποιούνται και γραμμένο σε μια βάση δεδομένων για περαιτέρω ανάλυση . Ορισμοί
Η

εξόρυξη δεδομένων ορίζεται ως η διαδικασία της ανάλυσης δεδομένων και τη συγκέντρωση του σε πληροφορίες που μπορούν να τεθούν σε χρήσιμους σκοπούς . Η διαδικασία εξόρυξης δεδομένων περιλαμβάνει την εύρεση προτύπων σε σύνολα δεδομένων που παρέχουν κατηγορηματική πληροφορίες για το πώς το σύνολο δεδομένων είναι οργανωμένη. Η εξόρυξη δεδομένων μπορεί να χρησιμοποιηθεί για την ανάλυση της σχέσης μεταξύ σχεδόν κάθε μετρήσιμο μεταβλητές ? Μερικές εφαρμογές πραγματικού κόσμου της εξόρυξης δεδομένων περιλαμβάνει την ανάλυση των στρατηγικών μάρκετινγκ , τις διαδικασίες παραγωγής και τα ανθρώπινα συμπεριφορικές τάσεις . Ο όρος ETL είναι ένα αρκτικόλεξο για το εκχύλισμα , μετατροπής και φόρτωσης . Απόσπασμα , να μετατρέψει και να φορτώσει αναφέρονται στις τρεις διαδικασίες με τις οποίες ένα σύστημα βάσης δεδομένων που έχει δημιουργηθεί για ανάλυση .
Εικόνων Extraction
Η

Το πρώτο βήμα για τη δημιουργία μιας αποθήκης δεδομένων που μπορεί να εξορύσσεται για την ανάλυση είναι να εξαγάγετε τα δεδομένα από την αρχική της προέλευση . Διαδικασίες εκχύλισης διαφέρουν ανάλογα με τον τύπο των δεδομένων που γίνεται εξόρυξη . Μερικές φορές εκχύλιση περιλαμβάνει τον εντοπισμό και την ανάκτηση ενός υποσυνόλου δεδομένων από μία ή περισσότερες υπάρχουσες βάσεις δεδομένων. Σε άλλες περιπτώσεις , η διαδικασία εξαγωγής απαιτεί πρωτότυπη έρευνα , όπως η αναζήτηση στο Web για ιστοσελίδες που περιέχουν σχετικές πληροφορίες .

Η Transform
Η

Μόλις κατάλληλα δεδομένα βρίσκεται κατά τη διάρκεια της η διεργασία εκχύλισης τότε ότι τα δεδομένα πρέπει να υφίστανται χειρισμό , έτσι ώστε να μπορεί να αποθηκεύεται σε μια βάση δεδομένων για μετέπειτα ανάλυση . Η διαδικασία της αλλαγής των δεδομένων από την αρχική του μορφή σε μια τακτοποίηση μορφή ονομάζεται μετασχηματισμός . Ο μετασχηματισμός μπορεί να περιλαμβάνει οποιοδήποτε αριθμό αλλαγών στα δεδομένα , συμπεριλαμβανομένων και σχετικά απλές λειτουργίες , όπως η μετατροπή σε πεζά γράμματα και την άρση σημείων στίξης από σειρές χαρακτήρων. Η διαδικασία μετασχηματισμού μπορεί επίσης να περιλαμβάνει πιο πολύπλοκες διαδικασίες, όπως η εκτέλεση των αριθμητικών συναρτήσεων στις τιμές προέλευσης , ταξινόμηση δεδομένων και την εξακρίβωση της εγκυρότητας των δεδομένων προέλευσης . Ο στόχος της φάσης μετασχηματισμού είναι να λάβει τα ανεπεξέργαστα δεδομένα εξαγωγής και να το μετατρέψει σε δεδομένα που είναι χρήσιμα για τους στόχους του έργου εξόρυξης δεδομένων .
Εικόνων φορτίου
Η

στιγμή τα δεδομένα μετασχηματίζονται στην κατάλληλη μορφή, θα πρέπει να αποθηκεύεται σε μία αποθήκη δεδομένων. Η φάση φορτίου αναφέρεται στη διαδικασία με την οποία μετασχηματισμένα δεδομένα είναι συνδεδεμένος σε μια βάση δεδομένων του υπολογιστή. Μόλις οι πληροφορίες αποθηκεύονται στη βάση δεδομένων , μπορεί να υποβληθούν σε ποιοτική και ποσοτική ανάλυση για να αναζητήσετε σχέδια ενδιαφέροντος .
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα