Che cos'è il riconoscimento ottico dei caratteri (OCR)?

Sommario:

Che cos'è il riconoscimento ottico dei caratteri (OCR)?
Che cos'è il riconoscimento ottico dei caratteri (OCR)?
Anonim

Il riconoscimento ottico dei caratteri (OCR) si riferisce al software che crea una versione digitale di un documento stampato, digitato o scritto a mano che i computer possono leggere senza la necessità di digitare o inserire manualmente il testo. L'OCR viene generalmente utilizzato sui documenti scansionati in formato PDF, ma può anche creare una versione del testo leggibile dal computer all'interno di un file immagine.

Che cos'è l'OCR

OCR, noto anche come riconoscimento del testo, è una tecnologia software che trasforma caratteri come numeri, lettere e segni di punteggiatura (detti anche glifi) da documenti stampati o scritti in un formato elettronico più facilmente riconoscibile e letto da computer e altri programmi software. Alcuni programmi OCR lo fanno quando un documento viene scansionato o fotografato con una fotocamera digitale e altri possono applicare questo processo a documenti che sono stati precedentemente scansionati o fotografati senza OCR. L'OCR consente agli utenti di eseguire ricerche all'interno di documenti PDF, modificare il testo e riformattare i documenti.

Image
Image
Scansione di giornali storici con il software OCR.

Getty Images

A cosa serve l'OCR?

Per le esigenze di scansione quotidiana rapida, l'OCR potrebbe non essere un grosso problema. Se si esegue una grande quantità di scansioni, essere in grado di cercare all'interno dei PDF per trovare quello esatto di cui si ha bisogno può far risparmiare un bel po' di tempo e rende più importante la funzionalità OCR nel programma dello scanner. Ecco alcune altre cose con cui l'OCR aiuta:

  • Elaborazione e inserimento dati automatizzati (Esempio: Sistemi di monitoraggio dei candidati per i curricula).
  • Rendere ricercabili i libri scansionati.
  • Conversione di scansioni scritte a mano in testo leggibile dal computer.
  • Rendere i documenti più utilizzabili dai programmi di lettura che assistono gli utenti ipovedenti.
  • Preservare documenti storici e giornali, rendendoli anche ricercabili.
  • Estrazione dati e trasferimento a programmi contabili (Esempio: scontrini e fatture).
  • Indicizzazione di documenti per l'utilizzo da parte dei motori di ricerca.
  • Riconoscimento delle targhe di guida da parte di un autovelox e il software della telecamera a luci rosse.
  • Sintetizzatore vocale per persone che non sanno parlare: il fisico teorico, Stephen Hawking, è forse l'utente più noto di un programma di sintesi vocale.

Linea inferiore

Perché non fare semplicemente una foto, giusto? Perché non saresti in grado di modificare nulla o cercare il testo perché sarebbe solo un'immagine. La scansione del documento e l'esecuzione del software OCR possono trasformare quel file in qualcosa che puoi modificare e cercare.

Cronologia dell'OCR

Sebbene il primissimo utilizzo del riconoscimento del testo risalga al 1914, lo sviluppo diffuso e l'uso di tecnologie relative all'OCR iniziò sul serio negli anni '50, in particolare con la creazione di caratteri molto semplificati che erano più facili da convertire in digitale- testo leggibile. Il primo di questi font semplificati è stato creato da David Shepard e comunemente noto come OCR-7B. OCR-7B è ancora in uso oggi nel settore finanziario per il carattere standard utilizzato su carte di credito e di debito. Negli anni '60, i servizi postali in diversi paesi iniziarono a utilizzare la tecnologia OCR per accelerare notevolmente lo smistamento della posta, inclusi Stati Uniti, Gran Bretagna, Canada e Germania. L'OCR è ancora la tecnologia di base utilizzata per smistare la posta per i servizi postali in tutto il mondo. Nel 2000, la conoscenza chiave dei limiti e delle capacità della tecnologia OCR è stata utilizzata per sviluppare i programmi CAPTCHA utilizzati per fermare bot e spammer.

Nel corso dei decenni, l'OCR è diventato più accurato e sofisticato grazie ai progressi nelle aree tecnologiche correlate come l'intelligenza artificiale, l'apprendimento automatico e la visione artificiale. Oggi, il software OCR utilizza il riconoscimento dei modelli, il rilevamento delle funzionalità e l'estrazione di testo per trasformare i documenti in modo più rapido e accurato che mai.

Domande frequenti

    Come faccio a scansionare i documenti con il mio telefono o tablet?

    Su iOS, apri l'app Note e crea una nuova nota. Apri la fotocamera, quindi tocca Scansione documenti. Su Android, apri Google Drive e seleziona Plus (+), quindi tocca Scansiona per scansionare documenta con il tuo telefono.

    Come si usa l'OCR in Adobe Acrobat?

    Apri un file PDF contenente un'immagine acquisita, quindi seleziona Strumenti > Modifica PDF. Acrobat applicherà automaticamente l'OCR in modo che tu possa modificare il testo. Seleziona dove vuoi apportare le modifiche e inizia a digitare.

    Qual è la differenza tra OCR e OMR?

    Optical Mark Recognition (OMR) è un software che rileva i segni sulla carta, in genere un foglio a bolle. L'OMR viene utilizzato per elaborare i risultati di esami, sondaggi, questionari e persino elezioni. A differenza dell'OCR, l'OMR non è in grado di decifrare i segni sulla pagina, ma verifica solo che siano presenti.

Consigliato: