Ką daro dantiraščio programa? Teksto atpažinimas naudojant dantraštį

Teksto atpažinimas yra labai patogi funkcija. Jums nebereikia perspausdinti didelių knygų ir straipsnių tomų. Mokytojams, studentams ir mokslininkams tokios programinės įrangos yra tikra dovana. Pažvelkime į skirtingas programas ir nustatykime, kuri programa tekstui iš paveikslėlio atpažinti yra geriausia.

Kaip tai veikia

Optinis simbolių atpažinimas (OCR) – tai galimybė paversti tekstą iš grafinės formos (nuotrauka, nuskaityta, pdf) į įprastą formatą. Konvertuotą tekstą galima redaguoti.
Bet koks rastrinis vaizdas susideda iš taškų. Atpažinimo programinė įranga identifikuoja paveikslėlyje esančias raides ir paverčia jas tekstu. Išanalizuota dokumento struktūra. Teksto blokai yra paryškinti. Tada nubrėžiamos linijos, kurios skirstomos į žodžius, o paskui į simbolius. Kiekvienas simbolis lyginamas su modeliais. Po to keliamos hipotezės apie tai, koks tai simbolis. Remdamasi jais, programinė įranga analizuoja skirtingas linijas į žodžius ir žodžius į simbolius skaidyti. Tokių hipotezių skaičius yra didžiulis. Galiausiai programa priima sprendimą ir išveda tekstą.

Programinės įrangos apžvalga

Paprastai visas programas galima suskirstyti į tris kategorijas:

  • Mokama.
  • Laisvas.
  • Internetinės paslaugos.

Pažvelkime į kelias kiekvieno skyriaus parinktis.

Mokamos ir nemokamos programos

OCR CuneiForm

Nemokama programa, skirta atpažinti nuskaitytą tekstą, kurią galite atsisiųsti čia.

Programą 1993 metais sukūrė „Cognitive Technologies“. Vienas pagrindinių jo bruožų tuo metu buvo gebėjimas atpažinti rusų ir anglų kalbų mišinį. 2009 m. buvo pridėta šaka, leidžianti atpažinti kitų kalbų mišinį. Programinės įrangos produktas buvo tiekiamas su skaitytuvais ir MFP iš pirmaujančių gamintojų: Hewlet-Pachard, Epson, Xerox ir kt. Naujausia versija buvo išleista 2009 m.
Atsisiuntę ir įdiegę bandome atpažinti tekstą. Paimkime šį straipsnį kaip pavyzdį.

Programos sąsaja paprasta, meniu rusų kalba.


Spustelėkite aplanko piktogramą ir įkelkite vaizdą. Paspauskite atpažinimo mygtuką.


Rezultatas nėra įspūdingas. Daugiaspalvis tekstas neatpažįstamas.


Nepaisant to, kad buvo naudojami skirtingi žodynai, anglų kalba taip pat buvo menkai pripažinta.


Apskritai ideali nuotrauka gali būti paversta simboliais, tačiau kuo prastesnė originalaus vaizdo kokybė, tuo prastesnė rezultato kokybė.
Pažymėtina, kad tai vienintelė rusinto teksto atpažinimo programa, skirta nuskaitymui, legaliai atsisiųsta nemokamai. Visi kiti geriausiu atveju turi nemokamą bandomąjį laikotarpį.

RiDoc

Programa, skirta atpažinti tekstą iš nuotraukos arba iš skaitytuvo su nemokama 30 dienų bandomoji versija. Ją galite atsisiųsti čia.

Programa turi gerą funkcionalumą ir prieinamą sąsają. Norėdami įkelti vaizdą, spustelėkite mygtuką „Atidaryti“.


Kitas yra mygtukas „Atpažinti“.


Dėl to mes gauname galutinį rezultatą. Jį galima atidaryti „Word“ arba „OpenOffice“.


Štai rezultatas.


Taip pat ne idealus, bet daug daugiau nei ankstesniu atveju.
Taip pat galite pridėti vandens ženklą arba sujungti kelis vaizdus.

ReadIris

Mokamas programinės įrangos produktas, kurio bandomoji versija yra 100 puslapių arba 10 dienų. Teksto atpažinimo skaitytuvo programą galite atsisiųsti iš oficialios svetainės čia.

Kūrėjas – Belgijos įmonė IRIS, sukurta 1986 m. Pagrindinė specializacija – išmanaus dokumentų atpažinimo technologijos ir produktai.

Programa konvertuoja paveikslėlį, PDF failą arba nuskaitytą dokumentą į visiškai redaguojamą tekstinį failą. Ištraukia tekstą iš jūsų dokumentų, išlaikydama originalaus failo išdėstymą. Turi šias funkcijas:

  • konvertuoti Word, Excel ir PowerPoint failus į indeksuotus PDF failus;
  • dokumentų konvertavimas naudojant kontekstinį meniu;
  • įvežamų dokumentų kokybės rodiklis;
  • automatinis skaitytuvų aptikimas;
  • perspektyvos korekcijos modulis.

Programos sąsaja yra rusifikuota (nurodyta diegimo metu) ir gana paprasta.


Spustelėkite mygtuką „Iš failo“ ir pasirinkite mūsų vaizdą. Programa automatiškai padalijo jį į du blokus.


Norėdami atpažinti, spustelėkite mygtuką „Atidaryti“ ir nurodykite vaizdo kelią. Formatas nurodytas aukščiau esančioje eilutėje.


Rezultatas pranoko visus lūkesčius. Net kontūras buvo išsaugotas.


Dokumentą galite siųsti paštu arba į debesį. Norėdami tai padaryti, spustelėkite aukščiau esantį sąrašą ir pasirinkite. Pagal numatytuosius nustatymus jis išsaugomas faile.


Ši programa kainuoja apie 6000 rublių.

ABBYY FineReader

Garsiausia ir reklamuojama programa. Bandomąją versiją galite atsisiųsti čia.

Mokama kaina 6990 rublių. Rusijos plėtra 1993 m., vis dar laikoma viena geriausių pasaulyje. Pagrindinės funkcijos:

  • Lentelių ir grafikų, matematinių formulių atpažinimas.
  • Žiūrėti ir naršyti pdf.
  • Sukurti ir tiesiogiai redaguoti pdf.
  • Darbas su skaitmeniniu parašu.
  • Dokumentų palyginimas.
  • Komentarų pridėjimas.

Programa turi daug funkcijų. Sąsaja yra rusifikuota ir prieinama.


Paspaudus mygtuką „Atidaryti“ ir pasirinkus paveikslėlį, prasideda automatinis jos padalijimas į blokus.


Norėdami pradėti procesą, spustelėkite atitinkamą mygtuką.


Belieka pasirinkti, kokiu formatu išsaugoti ir nurodyti aplanką, kuriame bus išsaugotas dokumentas.


Atidarykime rezultatą. Kaip matote, pripažinimas pavyko puikiai.


Dar kartą palyginkite su ReadIris.


Pirmoji parinktis (Finereader) vykdoma nepriekaištingai. Todėl galbūt atiduodame delną šiai programai. Jų kaina yra panaši, todėl 600–700 rublių skirtumas nevaidina ypatingo vaidmens.

Teksto atpažinimas iš nuotraukų internete

IMGonline

Internetinė vaizdo apdorojimo paslauga. Svetainėje pateikiami įrankiai:

  • Suspauskite paveikslėlį ir pakeiskite jo dydį
  • Apkarpymas, karpymas
  • Apdorojami įterptieji metaduomenys
  • Efektai
  • Patobulinimai
  • Spalvų paletės paveikslėlių apibrėžimas
  • Gauti foną
  • Panašumo procento nustatymas ir kt.

Patogi svetainė, suteikianti daugybę vaizdų apdorojimo galimybių. Sąsaja yra paprasta ir aiški.


Siūlo dvi programas. Palyginkime. Įkelkite failą ir spustelėkite Gerai.


Toliau spustelėkite nuorodą.


Rezultatas nedžiugina.


Išbandykime antrąją programą.


Taip pat abejotina.


Nustatykime papildomą kalbą.


Patikrinkime rezultatą.

Šiek tiek geriau, bet toli gražu ne tobula.

img2txt

Programa, skirta atpažinti tekstą iš nuotraukų internete, neleidžia nuskaityti.

Svetainė veikia nuo 2014 m. Jokių kitų paslaugų, be dabartinės, kūrėjai neplanuoja.


Pasirinkite failą ir spustelėkite „Įkelti“. Tada spustelėkite „Pradėti atpažinimą“.

Rezultatas taip pat toli gražu nėra tobulas.

Konvertavimas

Gana didelis mokamas portalas, kuriame galite pasinaudoti šiomis funkcijomis:

  • Konvertuoti vaizdo įrašus, garso įrašus, nuotraukas.
  • Konvertuoti PDF į Word, Excel, PowerPoint.
  • PDF skaidymas.
  • Suspausti PDF, PNG ir kt.

Veikimo principas yra visiškai panašus, tačiau yra daugiau nustatymų. Nuotraukas galima vilkti ir mesti.


Galite nurodyti kelias kalbas ir dokumento tipą, kuriame išsaugomas rezultatas.


Neregistruoti vartotojai turi prieigą tik prie 10 puslapių atpažinti.
Paspaudę captcha, pasirinkite "Konvertuoti".


Spustelėkite atsisiųsti.


Rezultatas pranoko visus lūkesčius.


Pasirodo, kad paprastos internetinės paslaugos taip pat turi galimybę užtikrinti kokybišką atpažinimą. Taigi Convertio paskelbtas aiškiu šios kategorijos nugalėtoju. Tačiau, kaip ir bet kuris puikus produktas, jis kainuoja.

Taigi, pažvelgėme į įvairius OCR įrankius. Paaiškėjo, kad nemokami gali padėti, tačiau kokybė išlieka neprilygstama. Taigi, jei jums nuolat reikia konvertuoti tekstą iš spausdinto į elektroninį, turėsite išleisti šiek tiek pinigų.

Geros dienos!

CuneiForm yra nemokama programa, skirta greitai konvertuoti vaizdą į teksto formatą. Programa pritaikoma daugelyje sričių: mokyklose, universitetuose, biure, skaitmeninant senus archyvus, knygas ir kitus dokumentus.

CuneiForm OpenOCR yra geriausia Abbyy Finereader alternatyva

Kodėl paprastam vartotojui šis įrankis yra geresnis už Finereader? Visų pirma, tai nemokama. Aukščiau minėtos programinės įrangos kaina yra 5 776 rubliai, o už CuneiForm OpenOCR jūs nemokėsite visiškai nieko. Tiesiog įdiekite ir naudokite. Beje, „CuneiForm“ galite atsisiųsti tiesiogiai šiame puslapyje (žemiau patalpinome nuorodą į oficialią programos versiją). Iškart po įdiegimo atidarykite atpažintuvą ir perskaitykite trumpas jo instrukcijas:

Taigi, kaip paveikslėlis paverčiamas tekstu? Su šia programa bus labai lengva dirbti tiek pradedantiesiems, tiek profesionalams, nes norint atpažinti tereikia atlikti porą žingsnių. Pirma, jums reikia kokio nors vaizdo (bet kokio formato - PNG, BMP, JPEG ir kt.), todėl atidarykite norimą objektą.

Antra, turite spustelėti mygtuką „Atpažinti“. Toliau teksto atpažinimo procesas prasideda CuneiForm. Dažniausiai tai nutinka labai greitai, tik retais atvejais reikia palaukti ilgiau nei 5-10 sekundžių.

Įrankiui atpažinus tekstą, atsidaro standartinė teksto rengyklė – „Word“, „WordPad“ ir kt. Beje, čia galite redaguoti gautą tekstą, nes programa ne visada duoda tikslius rezultatus, ypač apdorojant pažeistus, senus puslapius.

Taip pat CuneiForm OpenOCR ne visada gali pasirinkti teksto sritis, t.y. lenteles, pastraipas, antraštes ir kitus skyrius. Esant tokiai situacijai, puslapį reikia pažymėti rankiniu būdu, tam buvo sukurtas atskiras patogus įrankis.

Siekiant didesnio patogumo, kūrėjai pridėjo nuskaitymo funkciją. Jūs tiesiog įdedate dokumentą ar knygą į MFP ar skaitytuvą, nuskaitote norimą sritį, o tada Kuniform automatiškai konvertuoja tekstą į vaizdą – tai labai naudinga priemonė.

Bendrųjų parametrų čia nėra daug, galima sukonfigūruoti tik 3 – žymėjimą, nuskaitymą ir formatavimą, bet tai kompensuoja tai, kad kiekvieną modulį galima konfigūruoti atskirai, todėl vartotojas gali viską pritaikyti sau. Beje, pati programa yra gana paprasta ir suderinama su bet kuria OS:

  • Windows XP;
  • „Windows Vista“, 7;
  • Windows 8, 8.1 ir 10;
  • Mac OS;
  • Linux ir kt.

Norėdami nemokamai atsisiųsti „CuneiForm“ rusų kalba, apsilankykite oficialioje kūrėjų svetainėje, kur gausite visą informaciją apie programą. Jei jau suprantate, kaip su juo dirbti, tiesiog spustelėkite žalią mygtuką ir gausite puikų teksto atpažinimo įrenginį, atsisiųsdami jį iš oficialios svetainės be virusų ir SMS prenumeratos.

Nemokama programa automatiškai atpažinti nuskaitytą tekstą. Programa neatrodo kaip karamelė, bet išmano savo dalykus.

Kompiuteris jau užtikrintai įžengė į paprasto piliečio gyvenimą. Kai reikia gauti palyginti nedidelį spausdintos informacijos kiekį, lengviausias būdas yra įvesti šį tekstą rankiniu būdu naudojant teksto rengyklę.

Tačiau kartais reikia „perrašyti“ visą knygą. Tokiais atvejais racionaliausia naudoti skaitytuvą. Bet pats skaitytuvas daro tik teksto fotokopiją, kurios jokiu būdu negalima redaguoti. Norėdami pakeisti informaciją gautame paveikslėlyje, turite atlikti dokumento atpažinimą.

Neabejotinas lyderis šiuo klausimu yra OCR (optinio simbolių atpažinimo) sistema iš Abbyy – FineReader. Tačiau tai gana brangu ir ne kiekvienas gali sau leisti turėti tokį įrankį savo arsenale. Šiandien susipažinsime su nemokama Fine Reader alternatyva – programa CuneiForm. Čia yra lyginamoji abiejų paketų galimybių lentelė:

Teksto atpažinimo variklio CuneiForm palyginimas su mokamu analoginiu FineReader

Kaip matote, jei norite nemokamai atpažinti tekstą, turėsite dėl ko nors nusileisti. Pirmas dalykas, su kuriuo turite susitaikyti, yra CuneiForm nesugebėjimas dirbti su kai kuriais skaitytuvais (ypač MFP skaitytuvais). Todėl turėsite nuskaityti dokumentą naudodami standartines Windows funkcijas. Antra, turite stebėti nuskaitymo skiriamąją gebą.

Taip yra dėl to, kad CuneiForm negali apdoroti didelių failų (virš 100 KB), o kuo didesnė skiriamoji geba, tuo didesnis nuskaitymo failo dydis. Bet teksto atpažinimo kokybė programoje yra daug aukštesnė nei mokamo konkurento, todėl optimalūs nuskaitymo parametrai būtų 200 dpi (galima ir daugiau, bet tada yra tikimybė, kad programa tiesiog užšals).

Kalbų skaičius taip pat nedidelis, tačiau pagrindinės yra. Be to, nors kalbų derinti neįmanoma, CuneiForm turi mišrų anglų ir rusų atpažinimo režimą! Čia ir baigiasi minusai :). Galite pradėti diegimą.

CuneiForm diegimas

Čia nėra jokių sunkumų, nes montuotojas jums padės. Tiesiog paleiskite diegimo failą ir vykdykite instrukcijas. Po įdiegimo meniu Pradėti pasirodys naujas skyrius. Atidarykite jį ir paleiskite „CuneiForm“.

Programos sąsaja

„CuneiForm“ sąsaja yra daug paprastesnė nei „Fine Reader“ ir nereikalauja beveik jokios konfigūracijos. Programą galima visiškai valdyti įrankių juostoje esančių mygtukų dėka. Pažvelkime į juos išsamiau:

Programa gali dirbti vedlio režimu, kuris įjungiamas pirmuoju mygtuku. Bet jei „CuneiForm“ nepalaiko jūsų skaitytuvo, turėtumėte atsisakyti šio režimo. Kitas mygtukas pradeda nuskaitymo procesą (vėl, jei yra skaitytuvo palaikymas). Galite pastebėti mažas rodykles ant šio ir tolesnių mygtukų. Paspaudę ant jų turėsime prieigą prie kai kurių papildomų funkcijų.

Darbas su CuneiForm

Dabar pabandykime CuneiForm praktiškai. Jei programa palaiko jūsų skaitytuvą, pirmasis mygtukas, kurį turėtumėte spustelėti, bus „Gauti vaizdą“. Jei tai neįmanoma, atidarysime paruoštą nuskaitymą (palaikomi JPG, GIF, BMP, PNG formatai (ne visada teisingi), taip pat TIF (visiškai)).

Dabar reikia padaryti žymes. Tai padeda nustatyti blokus, kurie sudaro puslapį. Palaikomas blokų atpažinimas teksto (mėlynas rėmelis), paveikslėlių (žalias rėmelis) arba lentelių (oranžinis rėmelis) pavidalu (automatinį žymėjimą galima keisti rankiniu būdu naudojant bloko kontekstinį meniu).

Kai tekstas pažymėtas, laikas jį atpažinti. Norėdami tai padaryti, spustelėkite kitą mygtuką. Pasibaigus atpažinimo procesui, darbo lange bus rodomas tekstas, kurį galima redaguoti mažame įmontuotame teksto rengyklėje, panašiame į Microsoft Word. Tuo pačiu metu galėsite iš karto pamatyti tuos žodžius, kuriuose programa „nežinoma“ (mėlynas paryškinimas) ir kuriuose yra klaida (abejotina raidė - rožinė).

Ir galiausiai po sėkmingo redagavimo galite išsaugoti mūsų darbo rezultatą. Spustelėkite paskutinį mygtuką įrankių juostoje ir išsaugokite tekstą kaip RTF, HTML arba TXT failą.

Jeigu norite daugiau, tuomet spustelėję šone esančią rodyklę, galėsite pasirinkti eksporto parinktis į vieną iš siūlomų programų (Microsoft Word, Excel arba Eufratas).

Pažiūrėkite į ankstesnę ekrano kopiją. Tikrai pastebėjote, kad papildomų mygtukų meniu, pradedant „Žymėjimas“ ir baigiant „Išsaugoti“, pabaigoje yra elementas „Automatinis“. Suaktyvinus šią parinktį, nebereikia spausti pasirinkto mygtuko. Tai reiškia, kad galite automatizuoti nuskaitymo apdorojimo procesą taip, kad atidarytumėte tik naują dokumentą. Visa kita „CuneiForm“ padarys pati!

Bendrieji CuneiForm nustatymai

Iš pradžių programa sukonfigūruojama optimaliausiu būdu, tačiau jei norite ką nors pakeisti, tiesiog eikite į meniu „Failas“ ir pasirinkite parinktį „Bendrieji nustatymai“. Tai gali būti naudinga keičiant kalbą ir kai kuriuos kitus tekstų atpažinimo, formatavimo ir nuskaitymo parametrus.

Partijos atpažinimas

Galėjome baigti čia, jei „CuneiForm“ pakete nebūtų kitos priemonės. Dar kartą atidarykite „Pradėti“ ir programos aplanke rasite kitą programą - „Batch Recognition“. Įsivaizduokite, kad nuskaitote visą knygą! ir dabar mes turime tai pripažinti!!! Jei kiekvieną nuskaitymo failą atidarysite atskirai, tai užtruks daug laiko, tačiau paketinis režimas leidžia nurodyti reikiamus failus, o visa kita programa pasirūpins pati.

Pirmiausia turite sukurti naują failų paketą. Spustelėkite atitinkamą mygtuką ir vykdykite paleisto vedlio nurodymus:

Kai atpažinimas bus baigtas, pagrindiniame lange galėsite matyti visus atpažintus dokumentus. Jei atpažinimas buvo sėkmingas, kairiajame šoniniame skydelyje rasite tik du aktyvius sąrašus: „Original“ ir „Processed“. Jei yra failų, kurių nepavyko atpažinti, juos rasime skiltyje „Klaidos“.

išvadas

CuneiForm aiškiai turi gerą potencialą, tačiau vystymasis gana lėtas. Nepaisant atvirojo kodo, Cognitive yra labai reiklus kūrėjams, nes pažanga nepasirodo taip ilgai. Belieka tikėtis, kad reikalai pajudės į priekį ir programa taps dar geresnė, bet kol kas tenkinamės mažu. Bet ar tikrai jis toks mažas... Pasirinkimas yra jūsų!

užsiprenumeruokite naujas vaizdo pamokas!

Taigi, montavimas. Beje, 0.7 versija yra prieinama Ubuntu iš saugyklų. 0.9 versija šiuo metu yra naujausia.
wget http://launchpad.net/cuneiform-linux/0.9/cuneiform-linux-0.9/+download/cuneiform-linux-0.9.0.tar.bz2
tar xvjf cuneiform-linux-0.9.0.tar.bz2
cd cuneiform-linux-0.9.0
mkdir builddir
cd builddir
cmake -DCMAKE_BUILD_TYPE=derinti..
padaryti
padaryti įdiegti
Papildomas argumentas „-DCMAKE_INSTALL_PREFIX=/your/dir“ įdiegs cuneiform į norimą katalogą.
Galite jį paleisti naudodami šiuos argumentus:

L
Nurodo dokumento kalbą. Iš galimų: eng (numatytasis) ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur.

O
Išsaugoma faile.

F
Gauto teksto formatas. Palaikoma: tekstas (numatytasis), html, rtf, išmanusis tekstas (paprastas tekstas su TeX pastraipomis), hocr (hOCR HTML formatas), gimtoji (Cuneiform 2000 formatas)

Taškų matrica
Scenarijaus optimizavimas vaizdams, atspausdintiems naudojant taškinį spausdintuvą.

Faksas
Faksu išspausdinto vaizdo scenarijaus optimizavimas.

Viena kolona
Išjungiama puslapio analizė ir daroma prielaida, kad mūsų vaizdą sudaro vienas teksto stulpelis.

Naudojimo pavyzdys:
cuneiform -l ruseng -o /our/dir/text.txt /our/dir/book_1.tif

GUI

Toliau norėjau grafinės sąsajos kasdieniams poreikiams. Galima rinktis iš 2 dalių – YAGF ir:

Buvo nuspręsta naudoti YAGF. Jis taip pat parašytas qt ir taip pat reikalingas rašybos tikrinimo paketas. Atsisiųskite ir įdiekite.

Neseniai pradėjau ieškoti nemokamų programų, skirtų nuskaitytam tekstui atpažinti, arba kaip jos dar vadinamos OCR programomis. Mokėti už populiarųjį monstrą ABBYY FineReader nebuvo noro, tačiau, kaip paaiškėjo, jie siūlo labai nedaug tokio tipo programų galimybių nemokamai naudotis. Pirmas variantas, kuris pasitaikė, galbūt buvo viena populiariausių „Windows“ programų, tačiau dabartine forma ji nėra draugiška rusų kalbai. Vienas iš tinklaraščio skaitytojų pasiūlė išbandyti vietinių kūrėjų darbus.

Diegimo procedūra yra standartinė, kelių standartinių klausimų sąrašas, kur labiausiai įsiminė licencijos sutartis ir aplanko, kuriame bus įdiegta programa, pasirinkimas. Kelios sekundės laukimo ir viskas paruošta. Nieko nereikalingo neįdiegta, jums taip pat nereikia atsisiųsti ar įdiegti papildomų programinės įrangos komponentų.

Paleidę programą, gauname standartinę OCR sąsają, meniu su keliais elementais, didelius mygtukus pagrindinėms funkcijoms pasiekti, o pagrindinis langas yra padalintas į dvi dalis atpažintam vaizdui ir gatavam tekstui.

Pats pirmasis įrankių juostos mygtukas, kuriame nupiešta burtų lazdelė, yra vedlys, kurį paleisdami pereisime visus etapus, pradedant nuo nuskaitymo ir baigiant baigtu redaguoti tinkamu tekstu, kuris atidžiai pasiūlys pasirinkti reikiamą nustatymus. Rezultatas bus tam tikras pusiau automatinis režimas, susijęs tik su bendraisiais nustatymais, nesigilinant į niuansus.

Galite pasirinkti sudėtingesnį kelią, peržvelgdami kiekvieną elementą atskirai, tačiau galite atlikti daugybę papildomų redagavimo ir smulkių koregavimų, kurie leis jums gauti geresnį galutinį rezultatą.

Mygtuku, kuriame nupieštas skaitytuvas, galime nuskenuoti norimą dokumentą arba įkelti gatavą vaizdą. Po to gauname įrankių juostą, su kuria galime koreguoti vaizdą, jį pasukti ir pasirinkti atpažinimo sritį.

Mygtukas su kompasu leidžia pažymėti puslapį, paryškinti stulpelius, vaizdus ir teksto blokus. Visus rastus blokus galima redaguoti perkeliant juos ir keičiant jų dydį pele. Perkelkite žymeklį prie mėlynų linijų ir pamatysite, kaip jis pakeis savo formą, tada, manau, patys tai išsiaiškinsite.

Naudodami piktogramą su akiniais, tekstą atpažįstame tiesiai paruoštose vietose. Kai tekstas bus paruoštas, spustelėkite bet kurią raidę ir pamatysite paveikslėlio skyrių, kuriame jis buvo rastas.

Mygtukas su lėktuvu skirtas atpažintam tekstui įrašyti į failus ar Word Excel, kodėl šis standartinis rinkinys vėlgi neaišku, nes vis dar yra daugybė nuostabių teksto redaktorių.

Priklausomai nuo to, kuriame etape esate, įrankių juosta pakeis savo turinį, pasiūlydama tam tikram etapui reikalingus įrankius.

Dabar pereikime prie liūdno dalyko: „Windows 7“ atsisakė dirbti su skaitytuvu, programa tai pamatė, skaitytuvas net pradėjo zvimbėti, o monitoriuje nubėgo punktyrinė linija, rodanti, kad duomenys perduodami, o pabaigoje. išmetė klaidą. Visi šokiai su tamburinu ir forumų skaitymas nedavė teigiamų rezultatų. Įskaitant failo „Face.INI“ redagavimą, kur, kaip rekomenduojama, „TWAIN_TransferMode=memory-buffered“ buvo pataisyta į TWAIN_TransferMode=memory-native. Dėl to turėjau išspręsti problemą, nuskaityti tekstą naudojant standartinius „Windows“ įrankius ir įterpti gatavą vaizdą į „CuneiForm“.

Taip pat blogai, kad pati programa nepalaiko PDF failų. Turite imtis problemų sprendimo būdų, naudoti trečiųjų šalių programas, kad padarytumėte paveikslėlius iš pdf dokumentų, tada naudokite OCR. Bet vėlgi, dėl mažos vaizdų raiškos teksto atpažinimo kokybė yra labai žema, todėl tuomet tenka daug ką taisyti rankiniu būdu.

Aš beveik pamiršau, pirmą kartą paleisti Windows Vista ir 7 geriau kaip administratoriui, kitaip programa kelioms minutėms pateks į transą, nerodydama jokių gyvybės ženklų.

Programa tikrai veikia su visomis pagrindinėmis kalbomis, jų yra apie 20, įskaitant rusų, anglų, ukrainiečių, vokiečių, prancūzų, ispanų, italų ir mišrių rusų-anglų.

„CuneiForm“ paliko prieštaringą įspūdį: atrodo, kad jis veikia, bet ne visiškai, greičiausiai dėl to, kad darbas su programa buvo sustabdytas 2007 m., o po šaltinio kodų atidarymo komandos, kuri galėtų toliau plėtoti projektą, taip ir nepavyko. kartu. Smagu, kad jis supranta rusų kalbą, bet teks šiek tiek priprasti, kol išmoksite pasirinkti normalius nuskaitymo parametrus, kad atpažinimo rezultatai būtų patenkinami. Aš dabar esu šiame etape.

Dabartinės formos negaliu rekomenduoti jo naudoti paprastiems vartotojams. Tie, kurie išdrįsta išbandyti CuneiForm, būkite protiškai pasiruošę, kad iš pirmo karto gerų rezultatų nepasieksite, o iškylančių problemų sprendimą turėsite rasti patys.

Veikia 32 ir 64 bitų operacinėse sistemose. Sąsaja yra visiškai rusų kalba, ir atrodo, kad nėra siūlomų kitų parinkčių.

Puslapis, kuriame galima nemokamai atsisiųsti „CuneiForm“ http://www.cuneiform.ru/downloads/index.html

Naujausia versija rašant CuneiForm V12

Programos dydis: archyvas 33,3 MB

Suderinamumas: Windows Vista ir 7, Windows XP