Come usare Tesseract OCR in Java

Video: How To Read Images in Java Using OCR- Tesseract

Contenuto

indicazioni

Le librerie di riconoscimento ottico dei caratteri di Tesseract offrono agli sviluppatori un modo per scansionare documenti e testo in un'immagine. Sono utilizzati per memorizzare immagini di documenti che non sono più necessari sulla carta. Puoi usarli in Java creando loop di controllo per ogni carattere e scrivendo ciascuno in un file. Per utilizzare le librerie Tesseract, è necessario includere lo "spazio dei nomi" Java per le funzioni OCR.

indicazioni

Le librerie Tesseract consentono agli utenti di scansionare i loro documenti (John Foxx / Stockbyte / Getty Images)

Fare clic con il pulsante destro del mouse sul file Java che si desidera utilizzare per creare il documento OCR. Fai clic su "Apri con" e seleziona l'editor Java di tua scelta.
Aggiungi lo spazio dei nomi della libreria OCR nella parte superiore del file. Copia e incolla il seguente codice nel tuo file sorgente:

com.tplan.robot.imagecomparison.tesseractocr
Creare il codice responsabile della scansione dei caratteri per un file. Ad esempio, il codice seguente crea loop attraverso ciascun carattere in un file e li scrive in un file immagine:

(I = 1; {i} <{lines} +1; i = {i}) è un insieme di valori definiti come: +1) {Typeline "{_TOCR_LINE {i}}"}
Fare clic sul pulsante "Salva" dell'editor e fare clic su "Esegui" per eseguire il codice in un compilatore Java.