λογισμικό

* Γνώση Υπολογιστών >> λογισμικό >> λογισμικού βάσεων δεδομένων

Πώς να αναπτύξει Metrics Ποιότητας Δεδομένων

εργαλεία αποθήκες δεδομένων και εξόρυξη δεδομένων να είναι εύκολο να εξάγει και να αναλύει τεράστιες ποσότητες πληροφοριών , αλλά η ποιότητα της ανάλυσης είναι μόνο τόσο καλή όσο η ποιότητα των δεδομένων . Το πρώτο βήμα σε οποιαδήποτε μελέτη έρευνα ή τα δεδομένα του έργου αποθήκευσης πρέπει να είναι η αξιολόγηση της ποιότητας των δεδομένων που πρόκειται στο έργο . Μέτρα για την πληρότητα , εγκυρότητα και συνέπεια όλες παράγοντας σε αυτή την εκτίμηση . Για την ανάπτυξη της ποιότητας των δεδομένων μετρήσεων , θα πρέπει να ακολουθήσει κάποια συγκεκριμένα βήματα . Οδηγίες
Η 1

αναπτύξει ένα πλαίσιο για τη μέτρηση της ποιότητας των δεδομένων . Δημιουργία χώρου σε κάθε βάση δεδομένων όπου μπορούν να αποθηκευτούν τα αποτελέσματα των ελέγχων ποιότητας . Ανάπτυξη εκθέσεις ή πίνακες από αυτά τα δεδομένα . 2

πληρότητα των δεδομένων μέτρησης. Επιλέξτε βασικά στοιχεία σε κάθε βάση δεδομένων και να μετρήσει το ποσοστό μηδενισμού , τα κενά πεδία ή τις αξίες που εκπροσωπούν διαθέσιμο ή είναι άγνωστα .
Εικόνων 3

ποσοστά Μέτρο των επιτρεπτών τιμών . Όταν ένα πεδίο έχει έναν αριθμό προκαθορισμένων τιμών κώδικα , τη μέτρηση της κατανομής αυτών των αξιών και του αριθμού των ανακριβών και απούσες τιμές . Αναλύστε αυτές τις διανομές για να προσδιοριστεί αν ορισμένες κωδικοί εμφανίζονται πολύ συχνά . Εάν ναι, αυτή η τιμή μπορεί να χρειαστεί να υποδιαιρεθεί για να παρέχουν καλύτερη περιγραφή. Για παράδειγμα , εάν οι απαντήσεις είναι μαύρο , το λευκό και το χρώμα και το 98 % των απαντήσεων είναι το χρώμα, θα μπορούσε να έχει νόημα για να αντικαταστήσει το χρώμα με κόκκινο , μπλε ή πράσινο .
Η 4

Ελέγξτε για λογικές τιμές . Αριθμητικό μετρήσεις εμφανίζονται συνήθως μέσα σε ένα επιτρεπόμενο εύρος . Για παράδειγμα, μια ημερήσια θερμοκρασία μέτρησης καιρού Φαρενάιτ θα εμφανιστεί συνήθως ως μια τιμή από περίπου -40 έως 120. Κάθε αξία εκτός αυτής της περιοχής είναι πιθανόν να μην ισχύει .
5

Σύγκριση τιμών εντός της ίδιας ρεκόρ για τη συνοχή . Αν η θερμοκρασία ήταν 90 βαθμούς Φαρενάιτ και η τιμή καθίζησης είναι το χιόνι , μία από τις δύο τιμές είναι πιθανόν λανθασμένη .
Η 6

Ελέγξτε τη συνοχή μεταξύ των σχετικών εγγραφών. Χρησιμοποιήστε παρόμοιους ελέγχους συνοχή μεταξύ των εγγραφών στις σχέσεις γονέα-παιδιού και σε πολλαπλές καταχωρήσεις του παιδιού . Γονείς και παιδιά σχέσεις είναι δεσμοί μεταξύ των στοιχείων της βάσης δεδομένων . Για παράδειγμα, σε ένα αριθμό αντικειμένων που σχετίζονται με το χρόνο , εάν ένα σύνολο ωριαία θερμοκρασίες θερμοκρασίας λίστας μετρήσεις αυξάνεται σταθερά από 50 έως 70 μοίρες σε όλο το πρωί, αλλά η ανάγνωση 10 AM είναι -20 , αυτή η τιμή είναι πιθανώς κατά λάθος .
Σελίδα 7

Δημιουργήστε αναφορές , πίνακες ή κοινοποιήσεις με βάση τα δεδομένα που συλλέγονται . Συνοψίσω την οργανωτική ομάδα , προμηθευτή ή τον τύπο του πελάτη με τις ικανότητες για να τρυπάνι κάτω σε συγκεκριμένα στοιχεία δεδομένων . Αναλύστε τα δεδομένα για να προσδιοριστεί ο τόπος όπου συμβαίνουν τα λάθη και τι μπορεί να γίνει για τη βελτίωση της ποιότητας των δεδομένων .
8

Βελτίωση της ποιότητας των δεδομένων . Αναθεωρήστε τους κανόνες των επιχειρήσεων , επισκευή λογισμικού για να απορρίψει κακά στοιχεία , να κοινοποιούν στους πελάτες των θεμάτων δεδομένων και να βρει τρόπους για να ανταμείψει πρωτοβουλίες ποιότητας . Παρακολουθεί τις μετρήσεις αυτές την πάροδο του χρόνου .
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα