λογισμικό

* Γνώση Υπολογιστών >> λογισμικό >> Λογισμικό Utility

Τα μειονεκτήματα της OCR

Η Ταχυδρομική Υπηρεσία των ΗΠΑ χρησιμοποιεί την τεχνολογία οπτικής αναγνώρισης χαρακτήρων ( OCR ) για να διαβάσετε τις διευθύνσεις σε κομμάτια του ταχυδρομείου . Για το μήνυμα να είναι αναγνώσιμα από ένα ταχυδρομείο ταξινόμησης OCR , ωστόσο , οι διευθύνσεις και οι γραμματοσειρές θα πρέπει να διαμορφωθεί με έναν ορισμένο τρόπο . Το λογισμικό OCR είναι χρήσιμο για τη μετατροπή σαρωμένων εικόνων δακτυλογραφημένο ή χειρόγραφο έγγραφα σε αναζητήσιμα ηλεκτρονικό κείμενο , αλλά έχει μειονεκτήματα που περιορίζουν τις εφαρμογές της . Περιορισμένη Έγγραφα
Η

OCR λειτουργεί καλύτερα με καλή ποιότητα δακτυλογραφημένα έγγραφα . Χειρόγραφα έγγραφα που δεν μπορούν να διαβαστούν εύκολα από το λογισμικό OCR . Ομοίως , δακτυλογραφημένο γραμματοσειρές που μοιάζουν χειρογράφου - καθώς και μη λατινικές γραμματοσειρές - να δημιουργήσει πολλά λάθη κατά τη διαδικασία της οπτικής αναγνώρισης χαρακτήρων . Εάν το έγγραφο έχει φτωχή αντίθεση , είναι ζαρωμένο ή βρώμικο , ή το κείμενο και το φόντο είναι παρόμοια στο σκοτάδι , τότε OCR μπορεί να λειτουργήσει καλά . OCR έχει δυσκολία με τα έγγραφα που έχουν και τις δύο εικόνες και κείμενο. Υπολογιστικά φύλλα , θα παράγουν επίσης περισσότερα λάθη .
Εικόνων Ακρίβεια
Η

Δεν το λογισμικό OCR είναι 100 τοις εκατό ακριβής . Ο αριθμός των σφαλμάτων εξαρτάται από την ποιότητα και το είδος του εγγράφου , συμπεριλαμβανομένης της γραμματοσειράς που χρησιμοποιείται . Τα σφάλματα που εμφανίζονται κατά τη διάρκεια OCR περιλαμβάνουν εσφαλμένη ανάγνωση γραμμάτων , πηδώντας πάνω από τα γράμματα που είναι δυσανάγνωστο , ή την ανάμιξη κείμενο από γειτονικές στήλες ή λεζάντες εικόνων . Εάν απαιτείται υψηλή ακρίβεια - όπως και με τη μετατροπή των ψηφιακών βιβλίων σε ηλεκτρονική μορφή - τότε θα χρειαστεί ένα καθαρό -up του ηλεκτρονικού κειμένου

Η εργασία arounds

OCR έχει δυσκολεύονται να κάνουν διαχωρισμό ανάμεσα στους χαρακτήρες , όπως τον αριθμό μηδέν και ένα κεφαλαίο " O. " Για να επιλύσετε αυτό , μια ειδική γραμματοσειρά OCR μπορεί να χρησιμοποιηθεί , όπως το γράψιμο από το μηδέν . Ωστόσο, αυτό λειτουργεί μόνο για έγγραφα που δημιουργήθηκαν με OCR στο μυαλό , όπως τα ερωτηματολόγια . Κατά τη δημιουργία ερωτηματολογίων που θα είναι χειρόγραφες , οι ερευνητές χρησιμοποιούν επίσης τα κουτιά για κάθε γράμμα .
Εικόνων Πρόσθετες εργασίες
Η Ακόμα κι αν η σαρωμένη εικόνα του πρωτότυπου εγγράφου είναι υψηλό - ποιότητα , πρόσθετα μέτρα πρέπει να συμβεί για να καθαρίσει το κείμενο OCR . Είναι για να διορθώσει τα λάθη που δημιουργούνται από OCR πολύ υψηλής έντασης εργατικού δυναμικού . Ένα άτομο πρέπει να συγκρίνει το χέρι του πρωτότυπου εγγράφου και το ηλεκτρονικό κείμενο . Οι άνθρωποι κάνουν επίσης τα λάθη κατά την πληκτρολόγηση κειμένου από ένα έγγραφο , αλλά μερικές φορές είναι πιο γρήγορα να παραλείψετε το βήμα OCR .
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα