5 Servicii gratuite OCR online testate și revizuite


Aveți un document PDF sau o imagine pe care doriți să o convertiți în text? Recent, cineva mi-a trimis un document prin poștă pe care trebuia să-l editez și să-l trimită cu corecții. Persoana nu a putut găsi o copie digitală, așa că am fost însărcinată cu obținerea întregului text în format digital.

Nu a existat nici o cale de a petrece ore întregi să scriu totul înapoi, așa că am ajuns să iau o imagine frumoasă de înaltă calitate a documentului și apoi mi-a ars drumul printr-o grămadă de servicii OCR online pentru a vedea care mi-ar da cele mai bune rezultate. În acest articol, voi trece printr-un cuplu din site-urile mele preferate pentru OCR care sunt gratuite. Merită menționat faptul că majoritatea acestor site-uri furnizează un serviciu gratuit de bază și apoi au opțiuni plătite dacă doriți caracteristici suplimentare, cum ar fi imagini mai mari, documente PDF multiple, diferite limbi de intrare, etc.

Este, de asemenea, știți mai devreme că majoritatea acestor servicii nu vor putea să se potrivească cu formatarea documentului dvs. original. Acestea sunt în principal pentru extragerea textului și asta este. Dacă aveți nevoie de tot pentru a fi într-un anumit aspect sau format, va trebui să faceți acest lucru manual odată ce veți primi tot textul din OCR. În plus, cele mai bune rezultate pentru obținerea textului vor veni din documente cu o rezoluție de la 200 la 400 DPI. Dacă aveți o imagine DPI scăzută, rezultatele nu vor fi la fel de bune. În cele din urmă, au existat o mulțime de site-uri pe care le-am testat, care nu au funcționat. Dacă aveți Google gratuit OCR online, veți vedea o grămadă de site-uri, dar mai multe dintre site-urile din primele 10 rezultate nu au finalizat chiar conversia. Unii ar pleca din timp, alții ar da greșeli, iar alții s-au blocat pe pagina "conversie", așa că nici măcar nu m-am deranjat să menționez acele site-uri. Pentru fiecare site am testat două documente pentru a vedea cât de bine ar fi ieșirea. Pentru testele mele, am folosit pur și simplu iPhone-ul meu 5S pentru a face o fotografie a ambelor documente și apoi le-a încărcat direct pe site-urile web pentru conversie. Dacă vrei să vezi cum arată imaginile pe care le-am folosit testul meu, le-am atașat aici: test1 și test2. Rețineți că acestea nu sunt versiunile de rezoluție completă a imaginilor preluate de la telefon. Am folosit imaginea de rezoluție completă când încărcați pe site-uri.

OnlineOCR

OnlineOCR.net este un site curat și simplu care a dat rezultate foarte bune în testul meu. Principalul lucru care îmi place este că nu are tone de anunțuri peste tot, ceea ce este de obicei în cazul acestor tipuri de site-uri de servicii de nișă.

free online ocr

Pentru a începe, selectați fișierul și așteptați până la terminarea încărcării. Dimensiunea maximă de încărcare pentru acest site este de 100 MB. Dacă vă înregistrați pentru un cont gratuit, primiți câteva caracteristici suplimentare, cum ar fi dimensiunea de încărcare mai mare, fișiere PDF multiple, diferite limbi de intrare, mai multe conversii pe oră etc.

Apoi, alegeți limba de introducere și apoi alegeți formatul de ieșire. Aveți posibilitatea să alegeți dintre Word, Excel sau Text simplu. Faceți clic pe butonul Conversieși veți vedea textul afișat în partea inferioară a unei casete împreună cu un link de descărcare.

ocr output

Dacă tot ce doriți este textul, copiați-l și lipiți-l din cutie. Cu toate acestea, vă sugerăm să descărcați documentul Word deoarece face o lucrare surprinzător de bună de a păstra aspectul documentului original. De exemplu, când am deschis documentul Word pentru al doilea test, am fost surprins să găsiți că documentul a inclus un tabel cu trei coloane, la fel ca în imagine.

online ocr output

Din toate site-urile, de departe. Merită să te înregistrezi dacă trebuie să faci o mulțime de conversii.

Pentru completitudine, mă voi conecta și la fișierele de ieșire create de fiecare serviciu, astfel încât să poți vedea rezultatele pentru tine. Iată rezultatele de la OnlineOCR: Test1 Doc și Test2 Doc.

Rețineți că atunci când deschideți aceste documente Word pe computer, Cuvântul care afirmă că este din Internet și editare a fost dezactivat. Acest lucru este perfect, deoarece Word nu are încredere în documentele de pe Internet și într-adevăr nu trebuie să activați editarea dacă doriți doar să vizualizați documentul.

i2OCR

Un alt site care rezultate bune au fost i2OCR. Procesul este foarte asemănător: alegeți limba, fișierul și apoi apăsați Extragere text.

i2ocr

trebuie să așteptați un minut sau două aici pentru că acest site durează mai mult. De asemenea, în pasul 2, asigurați-vă că imaginea dvs. este afișată în partea dreaptă în previzualizare, altfel veți obține o grămadă de gabberish ca ieșire. Din anumite motive, imaginile din iPhone-ul meu au fost afișate în modul portret pe calculatorul meu, dar peisajul a fost încărcat pe acest site.

i2ocr output a trebuit să deschidă manual imaginea într-o aplicație de editare a fotografiilor, să o rotească la 90 de grade, apoi să o rotească înapoi pe portret și apoi să o salveze din nou. Odată terminat, derulați în jos și vă va arăta o previzualizare a textului împreună cu un buton de descărcare.

Acest site a reușit destul de bine cu ieșirea pentru primul test, dar nu a făcut atât de bine cu al doilea test care a avut aspectul coloanei. Iată rezultatele de la i2OCR: Test1 Doc și Test2 Doc.

FreeOCR

Free-OCR.com imaginile dvs. și convertiți-le în text simplu. Nu are opțiunea de a exporta în format Word. Alegeți fișierul, selectați o limbă și apoi faceți clic pe Start.

Site-ul este rapid și veți obține rezultate destul de repede. Doar faceți clic pe linkul pentru a descărca fișierul text pe computerul dvs.

freeocr

Ca și în cazul NewOCR menționat mai jos, acest site valorifică toate T documentul. Nu am nici o idee de ce ar face asta, dar pentru un motiv ciudat acest site și NewOCR au făcut acest lucru. Nu este o afacere mare să o schimbi, dar este un proces obositor pe care nu trebuie să-l faci.

Iată rezultatele de la FreeOCR: Test1 Doc și Test2 Doc.

ABBYY FineReader Online

Pentru a utiliza FineReader Online, trebuie să vă înregistrați pentru un cont free trial la OCR până la 10 pagini gratis. Dacă aveți nevoie doar de o singură dată pentru OCR pentru câteva pagini, puteți utiliza acest serviciu. Asigurați-vă că faceți clic pe linkul de verificare din e-mailul de confirmare după înregistrare.

finereader online

Faceți clic pe Recunoaștețiîn partea de sus și apoi pe Încărcațipentru a selecta fișierul. Alegeți limba, formatul de ieșire și apoi faceți clic pe Recunoașteredin partea de jos. Acest site are o interfață curată și nici un anunț prea.

În testele mele, acest site a fost capabil să apucă textul din primul document de testare, dar a fost absolut enorm atunci când am deschis documentul Word, așa că a terminat să o faci din nou și să aleg Text simplu ca format de ieșire.

Pentru cel de-al doilea test cu coloanele, documentul Word era gol și nici nu puteam găsi textul. Nu sunteți sigur ce sa întâmplat acolo, dar nu pare să fie capabil să rezolve nimic altceva decât simple paragrafe. Iată rezultatele de la FineReader: test1 Doc și Test2 Doc.

NewOCR

s>, a fost OK, dar nu este la fel de bun ca primul site. În primul rând, au anunțuri, dar din fericire nu o tonă. Selectați mai întâi fișierul dvs., apoi faceți clic pe butonul Previzionare.

upload image

zona în care doriți să scanați textul. Este destul de mult fel ca modul în care procesul de scanare funcționează pe un computer cu un scaner atașat.

ocr image

Dacă documentul are mai multe coloane, bifați butonul Analiza aspectului paginiiși se va încerca să se împartă textul în coloane. Faceți clic pe butonul OCR, așteptați câteva secunde pentru ca aceasta să se finalizeze, apoi derulați în jos până când pagina se reîmprospătează.

În primul test, a primit tot textul corect, dar din anumite motive capitalizat T în document! Nici o idee de ce ar face asta, dar a făcut-o. În cel de-al doilea test cu analiza paginii activată, a primit cea mai mare parte a textului, dar aspectul a fost complet dezactivat.

Iată rezultatele de la NewOCR: Test1 Doc și 25

Concluzie

După cum puteți vedea, gratuit nu vă dă rezultate foarte bune de cele mai multe ori din păcate. Primul site menționat este cel mai bun de departe, deoarece nu numai că a făcut o treabă bună de a recunoaște întregul text, dar a reușit să păstreze formatul documentului original.

Dacă aveți nevoie doar de text, deși , majoritatea site-urilor de mai sus ar trebui să poată face acest lucru pentru dvs. Dacă aveți întrebări, nu ezitați să comentați. Bucurați-vă!

Postări asemănatoare:


2.12.2015