Kuidas pildil olevat teksti arvutile loetavaks muuta? 0



Pildilt teksti lugemine ei valmista inimestele mingit probleemi. Paraku ei saa sedasama öelda arvutite kohta, mis pildil olevat teksti ilma spetsiaalse lahenduseta ära ei tunne. Nimelt räägime seekord OCR nimelisest lahendusest, mis annab võimaluse pildil olevat teksti ka arvuti jaoks arusaadavaks muuta.

Mis on OCR?

OCR-224x300OCR ehk inglise keeles Optical character recognition (optiline tähemärgi tuvastamine) on tegelikult juba väga vana tehnoloogia. Selle juured peituvad juba 1920.ndatesse, kui ilma tegi telegraaf. Koos sellega tekkis vajadus telegraafi teksti pimedatele ettekandmiseks. Kuid mitte ainult –  antud tehnoloogial on potentsiaali lugeda mistahes “analoogsel” kujul materjali ja selle abil võib näiteks vanade mikrofilmide arhiivist otsida automaatselt mistahes märksõnu või teemasid.

OCR toimimise põhimõte on tegelikult väga lihtne: arvuti võrdleb pildis oleva teksti tähemärke ning püüab vastavalt tähemärgi kujule leida vastava tähemärgi oma andmestikust. Sobivad kujud leitud, väljastatakse tekst juba digitaalselt ja seda on võimalik suvalise tekstiredaktoriga töötlema asuda.

Siinkohal tuleb aru saada, et kui pildil olev tekst ja iga tähemärk selles on kujutis, siis digitaalselt kuvatud tekst on arvuti jaoks tegelikult nullide ja ühtede jada. Ehk teisiti öeldes, hüppa või lakke, kuid vinüülplaati ei saa kuidagi arvutiga otse kuulata: vinüüli lugemiseks tuleb ikkagi kasutada helipead ja sellest tekkinud heli on võimalik juba digitaalseks pöörata.

OCR tarkvaralised lahendused

Ehkki OCR tehnoloogia on saanud ligi 90 aastat areneda, on antud tehnoloogiat kasutav tarkvara endiselt suhteliselt kohmakas ja vähegi võimekamad OCR tarkvaralahendused omavad endiselt suurt hinnasedelit. Seega meie, lihtinimesed, saame kasutada veidike lihtsakoelisemaid ja täiesti tasuta vahendeid.

Tõenäoliselt kõige levinumaks tarkvaraks, millelt ei oskakski OCR-lahendust oodata, on Google Drive. Sinna on võimalik laadida nii .jpg, .png, .gif ja .pdf kujul faile. Selleks, et OCR teenus aktiveerida, tuleb kõigepealt Google Drive veebiteenus avada, oma kontole sisse logida ning siis avada seaded. Kohe esimene valik ongi OCR teenuse aktiveerimiseks – jäta sinna linnuke:

google ocr

Nüüd on sul võimalik pärast toetatud faili üleslaadimist avada see Google Doc’si rakendusega, kus lisaks üleslaaditud pildile või PDF-dokumendile kuvatakse ka OCR tehnoloogiaga tuvastatud tekst.

Teine küllaltki levinud OCR-funktsiooni toetav levinud tarkvara sisaldub Microsoft Office’i kontoritarkvara paketis – OneNote. Isegi, kui sul ei ole arvutis Office’i paketti, on OneNote’i võimalik tasuta alla laadida, ehkki selleks tuleb sul kas luua või kasutada Microsoft’i kontot.

Kui Google Drive’i puhul on OCR-tehnoloogia kasutamine küllalt tülikas (nõuab õige mitu eri sammu), siis OneNote näitab siinkohal tõelist kasutusmugavust: sul ei tarvitse teha muud, kui teksti sisaldav pilt OneNote’i kopeerida ning siis pildil hiirega paremkliki valikute alt vajuta “Kopeeri tekst pildilt” (või kui kasutad inglise keelset OneNote’i – Copy Text). Ja kogu lugu: selleks, et pildil olev tekst kätte saada, tuleb see lihtsalt vabalt valitud tekstiredaktorisse paigutada (paste).onenoteocr

OCR veebiteenused

Kui sa aga mingil põhjusel eelmainitud kahte tarkvaralist lahendust kasutada ei soovi/saa, võid alati pöörduda mõne tasuta veebiteenuse poole. Üheks selliseks on näiteks Free OCR nime kandev veebilehekülg.

ocr

Tegemist on väga lihtsa teenusega: ava veebilehekülg, lae oma teksti sisaldav pildi või PDF fail üles ning antud tekst ilmub leheküljel kuvatud kasti. Sul ei ole vaja ennast ei registreerida ega isegi e-maili aadressi andma.

Küll aga tuleks igaks juhuks hoiatada, et ehkki antud veebiteenus kinnitab omalt poolt, et ei kasuta loetud teksti enda huvides, ei ole mõttekas antud teenusega konfidentsiaalseid materjale töödelda. Igaks juhuks.

Mida tuleks OCR’i puhul veel arvestada?

Ehkki üldiselt suudavad kõik OCR teenused sinuni enam-vähem loetava teksti tuua, siis tuleks sellesse alati reservatsiooniga suhtuda ning kogu tekst kindlasti oma silmaga üle vaadata. Samuti tuleb silmas pidada, et kui näiteks inglise keelset teksti suudetakse juba päris hästi lugeda, siis eesti keel koos oma öäüõ-tähemärkidega on siinkohal pigem erand ning ei allu tavaliselt OCR-lahendustele kuigi hästi.

Samuti tuleks silmas pidada, et mida raskemates oludes on pildil olev tekst (nurga all, halvasti valgustatud, väikese resolutsiooniga või stilistilise tähestiiliga), seda väiksem võimalus on teksti tuvastamiseks.


Autorist

Sander Hüüs

Sander Hüüs

Kirjutan väga erinevatel teemadel, peamiselt programmidest (nii arvutitele kui telefonidele), tarkvaramaailma uudistest ning internetiteenustest. Kõige olulisemaks pean kirjutamisel lihtsust ja ülevaatlikkust, et teksti oleks mõnus lugeda.

Autori teised artiklid

Kommentaarid