Android

Σάρωση και επεξεργασία γραφικού κειμένου με ελεύθερο OCR

Week 5, continued

Week 5, continued
Anonim

Η τεχνολογία οπτικής αναγνώρισης χαρακτήρων (OCR) σας επιτρέπει να επεξεργαστείτε κείμενο σε γραφική εικόνα ή σαρωμένο έγγραφο. Χρησιμοποιείται ευρέως για τη μετατροπή βιβλίων και εγγράφων σε ηλεκτρονικά αρχεία, για τη μηχανογράφηση ενός συστήματος τήρησης αρχείων σε ένα γραφείο ή για τη δημοσίευση του κειμένου σε έναν ιστότοπο.

Το OCR καθιστά δυνατή την επεξεργασία του κειμένου, την αναζήτηση μιας λέξης ή φράση και εφαρμόστε τεχνικές όπως η μηχανική μετάφραση, το κείμενο σε ομιλία και η εξόρυξη κειμένου σε αυτό.

Το Microsoft Office περιλαμβάνει το Microsoft Document Imaging OCR, ωστόσο, υπάρχουν πολλές άλλες εναλλακτικές λύσεις δωρεάν λογισμικού που κάνουν και τη δουλειά, συμπεριλαμβανομένου του λογισμικού εφαρμογής που ήρθε με το σαρωτή σας ή τη συσκευή all-in-one. Ουσιαστικά, για να σαρώσετε και στη συνέχεια να μετατρέψετε μια εικόνα σε κείμενο χρησιμοποιώντας OCR, πρέπει να ακολουθήσετε τα τυπικά βήματα:

  • Τοποθετήστε το έγγραφο στην κλίνη του σαρωτή
  • Στον υπολογιστή, χρησιμοποιήστε το λογισμικό εφαρμογής του σαρωτή και το OCR ως τύπο.
  • Επιλέξτε την περιοχή που θέλετε να εκτελέσετε μια σάρωση OCR και ελέγξτε την προεπισκόπηση
  • Σάρωση και στη συνέχεια αποθήκευση του αρχείου κειμένου και μπορείτε να την επεξεργαστείτε σε οποιαδήποτε εφαρμογή επεξεργασίας κειμένου.

Μπορείτε επίσης να εγκαταστήσετε ένα εφαρμογή για την εκτέλεση του OCR αντί για το προεπιλεγμένο πρόγραμμα του σαρωτή.

Το FreeOCR μπορεί να σαρώσει από τους περισσότερους σαρωτές TWAIN και WIA και μπορεί επίσης να ανοίξει σαρωμένες εικόνες TIFF PDF και πολλών σελίδων. Το δωρεάν OCR περιλαμβάνει το μηχανογραφημένο OCR κινητό Tesseract που είναι επίσης γνωστό ως Tesseract GUI. Το FreeOCR είναι δωρεάν, συμπεριλαμβανομένων και για εμπορική χρήση. Το FreeOCR απαιτεί το.NET Framework v2.0. Το FreeOCR v4 θα κυκλοφορήσει σύντομα

Υπάρχουν αρκετές δωρεάν ηλεκτρονικές υπηρεσίες στο Web που σας επιτρέπουν να πραγματοποιήσετε μια OCR σε μια εικόνα ή ένα σαρωμένο έγγραφο στο πρόγραμμα περιήγησης.

  • Το NewOCR.com είναι μια δωρεάν online υπηρεσία OCR. Το NewOCR.com αναλύει το κείμενο σε οποιοδήποτε αρχείο εικόνας που μεταφορτώνετε και, στη συνέχεια, μετατρέπει το κείμενο από την εικόνα σε κείμενο. Η υπηρεσία σας παρέχει απεριόριστες αναφορικές μεταφορτώσεις και ανάλυση διάταξης (αναγνώριση κειμένου σε πολλές στήλες). Η φιλική υπηρεσία δεν απαιτεί εγγραφή και υποστηρίζει 29 γλώσσες, παρόλο που ο ιστότοπος είναι αρκετά βασικός και ερασιτεχνικός. Η υπηρεσία λαμβάνει οποιεσδήποτε μορφές JPEG, PNG, GIF, BMP και πολλαπλών σελίδων TIFF έως και 5 MB καθώς και έγγραφα PDF πολλαπλών σελίδων έως και 20 MB.
  • Το Free-OCR.com είναι ένα άλλο δωρεάν εργαλείο OCR online. Μπορείτε να ανεβάσετε τα αρχεία εικόνας (JPG, GIF, TIFF BMP ή PDF) όχι μεγαλύτερα από 2MB, όχι μεγαλύτερα ή μεγαλύτερα από 5000 pixels και υπάρχει ένα όριο 10 λήψεων εικόνων ανά ώρα. Το Free-OCR μπορεί να χειριστεί εικόνες με κείμενο πολλαπλών στηλών και υποστηρίζει επίσης 29 γλώσσες. Ένας περίεργος περιορισμός είναι ότι παίρνει μόνο την πρώτη σελίδα ενός εγγράφου PDF ενώ εκτελεί OCR.
  • Η υπηρεσία OCR Free Online σάς επιτρέπει να αναγνωρίζετε κείμενο και χαρακτήρες από σαρωμένα έγγραφα PDF (συμπεριλαμβανομένων αρχείων πολλαπλών σελίδων), φωτογραφίες και ψηφιακές φωτογραφικές μηχανές. Επιτρέπει στους χρήστες να επιλέγουν 32 γλώσσες για να αναγνωρίζουν πολύγλωσσα έγγραφα και να μετατρέπουν απευθείας σε διάφορες μορφές όπως PDF, DOC, XLS, RTF, HTML και TXT. Μπορείτε να επιλέξετε να αποθηκεύσετε τα αρχεία OCRed online στον ασφαλή χώρο εργασίας σας ή να τα κατεβάσετε στον υπολογιστή σας.

Είμαι βέβαιος ότι αυτή η λίστα δεν είναι εξαντλητική. Γιατί δεν προσθέτετε περισσότερες τέτοιες υπηρεσίες και εφαρμογές ως σχόλια σε αυτήν την ανάρτηση, αν γνωρίζετε πια;