λογισμικό

* Γνώση Υπολογιστών >> λογισμικό >> λογισμικού βάσεων δεδομένων

Data Cleansing Στρατηγικές

Τα στοιχεία μπορούν να καταστραφούν σε οποιοδήποτε αριθμό τρόπων , από τα λάθη που εισάγει ο χρήστης για τις ασυνέπειες μορφοποίησης . Αντίγραφα είναι ένα από τα πιο κοινά προβλήματα των δεδομένων στις βάσεις δεδομένων οι περισσότερες εταιρείες » . Ο καλύτερος τρόπος για να εξασφαλιστεί η ακρίβεια των δεδομένων είναι η πρόληψη της διαφθοράς , αλλά είναι σοφό να έχουμε ένα σχέδιο για την αντιμετώπιση των προβλημάτων των δεδομένων σε περίπτωση που προκύψουν προβλήματα . Διττός
Η

Αντίγραφα μπορεί να είναι μια ματαιώνοντας πράγμα για να δούμε ως ελεγκτή δεδομένων . Συχνά , μια οθόνη δεδομένων front-end δεν μπορεί να πιάσει ορισμένους τύπους διπλών ? , Για παράδειγμα , σε έναν πίνακα διευθύνσεων , 123 Main Street και 123 κύριο ST μπορεί να εμφανίζεται ως δύο ξεχωριστές διευθύνσεις , όταν στην πραγματικότητα είναι η ίδια διεύθυνση <. br >

Αυτό μπορεί να λυθεί με μία από τις δύο μεθόδους : την αφαίρεση δεδομένων ή τη διόρθωση των δεδομένων . Αφαίρεση δεδομένων θα σήμαινε τη διαγραφή όλων , αλλά ένα παράδειγμα ενός συνόλου αντιγράφων, ενώ η διόρθωση των δεδομένων θα ενημερώσετε όλα τα στιγμιότυπα των επικαλύψεων σε ένα ενιαίο συμφωνημένη τιμή . Πακέτα λογισμικού είναι διαθέσιμα που χρησιμοποιούν έναν αλγόριθμο για τον εντοπισμό των ακραίων τιμών με βάση την τυπική απόκλιση , συστάδες ή άλλα κριτήρια , τότε οι ακραίες τιμές αξιολογούνται από ένα θέμα εμπειρογνώμονα θέμα που καθορίζει την τύχη της απροσδόκητης εισόδου .
Εικόνων Απόσπασμα , Transform , Load
Η

Απόσπασμα , μετασχηματισμού, φορτίο , ή ETF , είναι μια ευρέως χρησιμοποιούμενη μέθοδος για να μετακινήσετε και καθαρά δεδομένα . Ενώ δεν παρουσιάζεται εγχειρίδιο καθαρισμό , υπάρχουν αυτοματοποιημένες εργασίες στη φάση μεταφράσει . Για παράδειγμα , αν οι πίνακα προέλευσης καταστήματα " M " και " F" και ο πίνακας προορισμού καταστήματα " αρσενικό " και " θηλυκό ", ένα script μπορεί να τρέχει για να μεταφράσει τα δεδομένα με τις νέες τιμές .

Μόλις τα δεδομένα καθαρίζεται και επικυρωθεί , μπορεί να εισαχθεί στον πίνακα προορισμού . Μπορεί επίσης να εισαχθούν πάνω από τα παλιά δεδομένα για να γράψετε πάνω δεδομένα . Αυτό λειτουργεί καλά, όταν μια ολόκληρη στήλη δεδομένων σε έναν πίνακα πρέπει να αλλάξει .

Η Ενημέρωση Legacy Systems
Η

Ενημέρωση σύστημα κληρονομιά συνήθως περιλαμβάνει τη μετακίνηση των δεδομένων σε μια ενδιάμεση θέση , ή την περιοχή στάσης , όπου στη συνέχεια υποβάλλεται σε ένα αυτοματοποιημένο , καθώς και οδηγίες καθαρισμού γύρο δεδομένων . Αυτό γίνεται για να αποφύγουν τυχόν μη αναστρέψιμη λάθη στα δεδομένα κληρονομιά πριν από την εισαγωγή της στο νέο σύστημα . Θα πρέπει να σημειωθεί ότι τα δεδομένα κληρονομιά δεν θα πρέπει να ενημερωθεί , σύμφωνα με πληροφορίες - management.com , προκειμένου να αποφευχθεί η διατήρηση δύο χωριστών συνόλων δεδομένων . Θα πρέπει να συνταξιοδοτηθεί αντ 'αυτού και το νέο σύστημα θα πρέπει να είναι η μόνη στην χρήση πάμε μπροστά .
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα