Come usare Tesseract OCR in Java

Autore: Judy Howell
Data Della Creazione: 26 Luglio 2021
Data Di Aggiornamento: 20 Novembre 2024
Anonim
How To Read Images in Java Using OCR- Tesseract
Video: How To Read Images in Java Using OCR- Tesseract

Contenuto

Le librerie di riconoscimento ottico dei caratteri di Tesseract offrono agli sviluppatori un modo per scansionare documenti e testo in un'immagine. Sono utilizzati per memorizzare immagini di documenti che non sono più necessari sulla carta. Puoi usarli in Java creando loop di controllo per ogni carattere e scrivendo ciascuno in un file. Per utilizzare le librerie Tesseract, è necessario includere lo "spazio dei nomi" Java per le funzioni OCR.


indicazioni

Le librerie Tesseract consentono agli utenti di scansionare i loro documenti (John Foxx / Stockbyte / Getty Images)
  1. Fare clic con il pulsante destro del mouse sul file Java che si desidera utilizzare per creare il documento OCR. Fai clic su "Apri con" e seleziona l'editor Java di tua scelta.

  2. Aggiungi lo spazio dei nomi della libreria OCR nella parte superiore del file. Copia e incolla il seguente codice nel tuo file sorgente:

    com.tplan.robot.imagecomparison.tesseractocr

  3. Creare il codice responsabile della scansione dei caratteri per un file. Ad esempio, il codice seguente crea loop attraverso ciascun carattere in un file e li scrive in un file immagine:

    (I = 1; {i} <{lines} +1; i = {i}) è un insieme di valori definiti come: +1) {Typeline "{_TOCR_LINE {i}}"}


  4. Fare clic sul pulsante "Salva" dell'editor e fare clic su "Esegui" per eseguire il codice in un compilatore Java.