Скан ва OCR

Нимаи нек

Эҳтимол ҳар яке аз мо бо вазифа, вақте ки шумо бояд ҳуҷҷати электрониро ба шакли электронӣ тарҷума кунед. Ин махсусан барои онҳое, ки таҳсил мекунанд, бо ҳуҷҷатҳои корӣ, тарҷумаҳои матнӣ бо истифода аз калимаҳои электронӣ ва ғайра заруранд.

Дар ин мақола ман мехостам якчанд асосҳои ин равандро гузорам. Умуман, тасниф ва намоиши матн хеле вақтро сарф мекунанд, зеро аксари амалиётҳо бояд ба таври дастӣ анҷом дода шаванд. Мо кӯшиш мекунем, ки чӣ гуна, чӣ гуна ва чӣ сабабро фаҳмем.

На ҳама чизро дарк мекунанд. Баъд аз сканкунӣ (ҳамаи замимаҳо дар сканер мувофиқат кунед), шумо тасвири формат BMP, JPG, PNG, GIF (метавонад дигар форматҳо дошта бошад). Пас аз ин тасвири шумо бояд матнро гиред - ин тартиби шинохташуда номида мешавад. Дар ин тартиб, дар поён оварда мешавад.

Мундариҷа

  • 1. Барои нусхабардорӣ ва шинохт кардан чӣ лозим аст?
  • 2. Интихоби сканкунии матн
  • 3. Тасдиқи матни ҳуҷҷат
    • 3.1 Матн
    • 3.2 Суратҳо
    • 3.3 Ҷадвалҳо
    • 3.4 Намудҳои ғайричашмдошт
  • 4. Тасдиқи файлҳои PDF / DJVU
  • 5. Хатогӣ тафтиш ва наҷот ёфтани натиҷаҳои кор

1. Барои нусхабардорӣ ва шинохт кардан чӣ лозим аст?

1) Сканер

Барои тарҷумаи ҳуҷҷатҳои чопшуда ба шакли матн, шумо аввал ба сканер ва ба таври лозимӣ барномаҳои ватаниву ронандагоне, ки бо он мераванд, ниёз доранд. Бо онҳо шумо метавонед ҳуҷҷатро скан кунед ва барои коркарди минбаъда захира кунед.

Шумо метавонед ба аналогҳои дигар истифода кунед, вале нармафзор, ки бо сканнер дар маҷмӯъ омада буд, одатан зудтар кор мекунад ва имконоти бештар дорад.

Вобаста ба кадом навъи сканер шумо доред - суръати кор метавонад хеле фарқ кунад. Сканерҳо, ки тасвири аз саҳифа дар 10 сония гирифта метавонанд, онҳое, ки онро дар 30 сония гирифтаанд. Агар шумо китоберо дар бораи 200-300 сканҳоро ҷустуҷӯ кунед, ман фикр мекунам, ки чӣ гуна чанд маротиба дар вақти муайян фарқ мекунад?

2) Барнома барои эътироф

Дар мақолаи мо, ман ба шумо дар кори яке аз беҳтарин барномаҳои сканнерӣ ва ба таври комил эътироф кардани ҳама ҳуҷҷатҳо нишон медиҳам - ABBYY FineReader. Аз он вақт ин барнома пардохта мешавад, он гоҳ фавран ман ба алоқаи дигар - аналоги озодии формати Cunei биравед. Дар ҳақиқат, ман онҳоро муқоиса намекунам, зеро, ки FineReader дар ҳама ҳолатҳо ба даст меорад, ман инро тавсия медиҳам.

ABBYY FineReader 11

Сомонаи расмӣ: //www.abbyy.ru/

Яке аз беҳтарин барномаҳои он. Он барои тасвир кардани матн дар расм тасвир шудааст. Вариантҳо ва хусусиятҳо сохта шуданд. Он метавонад як нусхаи рангҳоро, ки ҳатто чопи дастнависҳои дастнависро дастгирӣ мекунад (гарчанде ки ман шахсан кӯшиш накардаам, ман хуб мешавам, ки нусхабардорӣ кардани нусхаи дастнависро, агар шумо дастнависии занги хаттии комил дошта бошед). Маълумоти бештар дар бораи кор бо ӯ дар поён дида мешавад. Мо инчунин дар ин ҷо қайд мекунем, ки мақолаи кор дар барномаи 11 тарҳро фаро мегирад.

Чун қоида, вариантҳои гуногуни ABBYY FineReader аз якдигар фарқ мекунанд. Шумо метавонед ба осонӣ метавонад ҳамон тавр кунед. Фарқиятҳои асосӣ метавонанд ба осонӣ, суръати барнома ва имкониятҳои он бошанд. Масалан, нусхаҳои пештар барои кушодани ҳуҷҷати PDF ва DJVU ...

3) Ҳуҷҷатҳо барои скан кардан

Ҳа, ҳамин тавр, ман қарор додам, ки ҳуҷҷатҳояшро дар сутуни алоҳида бигирам. Дар бештари ҳолатҳо, ҳама сабтҳо, газетаҳо, мақолаҳо, маҷаллаҳо ва ғ он китобҳо ва адабиёт, ки дар талабот мебошанд. Ман ба чӣ оварда мерасонам? Аз таҷрибаи шахсӣ, ман метавонам бигӯям, ки шумо мехоҳед сканатро бубинед, аллакай дар шабака ҳастед! Вақте ки ман як китоб ё дигар аллакай аллакай дар шабака пайдо шудаам, чанд маротиба ман шахсан вақти худро сарф кардам. Ман фақат бояд матнро ба ҳуҷҷат нусхабардорӣ намуда, бо он давом диҳам.

Аз ин маслиҳати оддӣ - пеш аз он, ки ягон чизро ҷустуҷӯ кунед, санҷед, ки оё касе аллакай онро таҳия кардааст ва шумо ба вақти худро партофтанӣ нестед.

2. Интихоби сканкунии матн

Дар ин ҷо, ман дар бораи ронандагони шумо барои сканер, барномаҳои бо он пайравӣ намекунам, зеро ҳамаи моделҳои сканӣ гуногунанд, нармафзор низ дар ҳама ҷо фарқ мекунад ва ба назар мерасад, ки чӣ тавр иҷро кардани амалиёт ғайриимкон аст.

Ҳамаи сканерҳо ҳамон танзимот доранд, ки ба суръат ва сифати кори шумо таъсир мерасонанд. Ин ҷо дар бораи онҳое, ки ман дар ин ҷо гап мезанам. Ман дар тартиботи фармоишӣ менависам.

1) сифати сканӣ - DPI

Аввалан, сифати сканро дар вариантҳо на камтар аз 300 DPI муайян кунед. Маслиҳат медиҳад, ки ҳатто агар имконпазир бошад, ҳатто каме зиёдтар гузоред. Нишондиҳандаи баландтарин нишондиҳандаи DPI аст, равшантар шудани тасвири шумо хоҳад баромад ва ҳамин тавр коркарди минбаъда зудтар мешавад. Илова бар ин, сифати баландтарини сканат - ба хатогиҳои камтартаре, ки шумо дертар бояд ислоҳ кунед.

Беҳтарин имконият медиҳад, одатан 300-400 DPI.

2) хромататсия

Ин параметр ба муддати тӯлонӣ таъсир мерасонад (бо роҳи DPI низ таъсир мерасонад, аммо онҳо хеле қавӣ ҳастанд ва танҳо вақте ки корбар арзиши баландро муқаррар мекунад).

Одатан се намуд вуҷуд дорад:

- сиёҳ ва сафед (барои матни оддӣ);

- хокистарӣ (барои матн бо ҷадвалҳо ва тасвирҳо мувофиқ);

- ранг (барои маҷаллаҳои ранг, китобҳо, умуман, ҳуҷҷатҳо, ки дар он ранги муҳим аст).

Одатан, вақти санҷиш аз интихоби ранг вобаста аст. Баъд аз ҳама, агар шумо ҳуҷҷати калон дошта бошед, ҳатто 5-10 сония иловагӣ дар саҳифа ба таври комил дар вақти муносиб ...

3) Суратҳо

Шумо метавонед ин ҳуҷҷатро на танҳо тавассути ҷустуҷӯ, балки бо тасвири он қабул кунед. Чун қоида, дар ин ҳолат шумо дигар проблемаҳо дошта бошед: тасодуфӣ, тасодуфӣ. Аз ин сабаб, метавонад минбаъд таҳрир ва коркарди матни қабулшуда минбаъд талаб кунад. Шахсан ман, барои ин бизнес бо истифода аз камерерҳо тавсия намедиҳам.

Бояд қайд кард, ки ҳар як ҳуҷҷати мазкур намебошад, зеро сифати сканӣ метавонад хеле паст бошад ...

3. Тасдиқи матни ҳуҷҷат

Мо мепиндорем, ки саҳифаҳои саҳеҳе, ки шумо қабул кардед. Аксари онҳо форматҳо мебошанд: tif, bmb, jpg, png. Умуман, барои ABBYY FineReader - ин хеле муҳим нест ...

Баъди кушодани сурат дар ABBYY FineReader, барнома чун қоида, дар мошини худ интихоб мекунад ва онҳоро эътироф мекунад. Аммо баъзан вай ин корро мекунад. Барои ин мо интихоби майдонҳои дилхоҳро дида мебароем.

Ин муҳим аст! На ҳама дарк мекунанд, ки пас аз кушодани ҳуҷҷат дар барнома, ҳуҷҷати рамзӣ дар чапи тиреза нишон дода мешавад, ки шумо дар он ҷойҳои гуногунро ишора кардаед. Баъд аз зеркунии тугмаи "шинохтани", барнома дар тиреза дар тарафи рост ба шумо матни хато меорад. Пас аз шинохт, бо ин роҳ тавсия дода мешавад, ки матни хатогиро дар ҳамон FineReader тафтиш кунед.

3.1 Матн

Ин майдон барои таркиби матн истифода мешавад. Тасвирҳо ва ҷадвалҳо аз он хориҷ карда мешаванд. Навиштани нусхаҳои нодир ва ғайриоддӣ бояд ба таври дастӣ ворид карда шаванд ...

Барои интихоби майдон, ба диалог дар болои FineReader диққат диҳед. Тугмаи "T" вуҷуд дорад (нигаред. Дар экран дар поён, нишоннамои мушак танҳо дар ин тугма аст). Ба он пахш кунед, пас дар тасвири зер, майдони оддии росткунҷаро дар матн ҷойгир кунед. Бо роҳи, дар баъзе ҳолатҳо ба шумо лозим аст, ки блокҳои 2-3, ва баъзан 10-12 саҳифа эҷод кунед, зеро Форматкунии матн метавонад фарқ кунад ва тамоми майдонро бо як чоркунҷа интихоб накунед.

Бояд қайд кард, ки тасвирҳо набояд ба матн ворид шаванд! Дар ояндаи наздик, он шуморо муддати тӯлонӣ наҷот хоҳад дод ...

3.2 Суратҳо

Барои нишон додани тасвирҳо ва маҳалҳое, ки бо сабаби сифати пасти сифат ё тасодуфии ғайримуқаррарӣ душвор аст, истифода бурд.

Дар экран дар поён, нишоннамои муш дар тугмае, ки барои интихоби "тасвир" интихоб шудааст, ҷойгир аст. Бо роҳи, комилан ягон қисми саҳифа метавонад дар ин минтақа интихоб карда шавад ва FineReader он гоҳ ба ҳуҷҷат ҳамчун тасвири муқаррарӣ замима карда мешавад. Ie танҳо "доғи" нусхабардорӣ ...

Одатан, ин майдон барои мониторҳои сусти сканҳо истифода мешавад, то ки матн ва ҳарфҳои ғайридавлатӣ, тасвирҳои худ нишон диҳанд.

3.3 Ҷадвалҳо

Дар экрани слайд дар поён нишон медиҳад, ки ҷадвалҳоро нишон диҳед. Умуман, ман шахсан онро хеле кам истифода мебарам. Далели он аст, ки шумо бояд ҳар як сатрро дар ҷадвал гиред ва нишон диҳед, ки чӣ гуна ва чӣ гуна барнома. Агар миз хеле хурд бошад ва дар сифати хеле хуб не, ман маслиҳати "тасвирӣ" -ро бо ин мақсадҳо тавсия медиҳам. Ҳамин тариқ, бисёр вақт сарфакорона ва пас шумо метавонед зудтар метавонед як мизро дар асоси тасвири Word ба кор баред.

3.4 Намудҳои ғайричашмдошт

Бояд қайд кард, Баъзан матнҳои нолозим дар саҳифае, ки барои шинохтани матн душвор нестанд, ё ба шумо имкон намедиҳанд, ки майдони дилхоҳашро интихоб кунед. Онҳо метавонанд бо истифода аз "eraser" бардошта шаванд.

Барои ин, ба ҳолати таҳририи тасвир нигаред.

Воҳиди локалӣро интихоб кунед ва минтақаи номатлубро интихоб кунед. Он пӯшида мешавад ва дар ҷои он як варақи сафед хоҳад шуд.

Бо ин роҳ, ман тавсия медиҳам, ки ин имкониятро то ҳадди имкон тавонед. Ҳамаи мавзӯъҳои матниро, ки шумо интихоб кардед, санҷед, ки ба шумо нусхаи матн лозим нестанд, ё ягон нуқтаҳои нолозим, ношаффоф, бозхаридҳо - бо лагери нест карда мешаванд. Бо шарофати ин эътироф зудтар мешавад!

4. Тасдиқи файлҳои PDF / DJVU

Умуман, ин намунаи шинохтан аз дигарон фарқ мекунад - яъне. Шумо метавонед онро бо тасвирҳо ба монанди он кор кунед. Яке аз чизҳое, ки барнома бояд варианти кӯҳна набошад, агар шумо файлҳои PDF / DJVU-ро кушоед, версияи версияро ба 11 нависед.

Маслиҳати каме. Баъди кушодани ҳуҷҷат дар FineReader - он автоматӣ ба таври автоматӣ тасвир карда мешавад. Аксар вақт дар файлҳои PDF / DJVU, як ҷузъи махсуси саҳифа дар тамоми ҳуҷҷат лозим нест! Барои тоза кардани чунин майдон дар ҳамаи саҳифаҳо, амалҳои зеринро иҷро кунед:

1. Ба қисми таҳрири тасвир нигаред.

2. Имконияти "танзим" -ро интихоб кунед.

3. Майдонеро, ки дар ҳамаи саҳифаҳо лозим аст, интихоб намоед.

4. Ба ҳамаи саҳифаҳо ва trim муроҷиат кунед.

5. Хатогӣ тафтиш ва наҷот ёфтани натиҷаҳои кор

Ин назар ба он ишора мекунад, ки то ҳол ҳамаи профилҳо интихоб шудаанд, ҳол он ки мушкилот ҳалли худро пайдо мекунанд, сипас эътироф мекунанд - онро мегиранд ва онро наҷот медиҳанд ... Он ҷо набуд!

Аввал, мо бояд ҳуҷҷатро санҷем!

Барои фаъол кардани он, баъд аз шинохт, дар тиреза дар рост, тугмаи «тафтиш» мавҷуд аст, ба экран нигаред. Баъд аз пахш кардани он, барномаи FineReader ба таври автоматӣ ба шумо нишон медиҳад, ки дар он ҷойҳо хатогиҳо мавҷуданд ва он метавонад як ё якчанд рамзро муайян кунад. Шумо бояд танҳо интихоб кунед, ё бо фикри барнома розӣ мешавед ва ё аломати худро ворид кунед.

Бо роҳи, дар ним мавридҳо, тақрибан, барномаи шумо ба шумо калимаи дуруст тайёр карда мешавад - шумо танҳо барои мушаххас кардани интихоби шумо мушоҳидаед.

Дуюм, пас аз тафтиши шумо бояд интихоби формате, ки дар он шумо ба натиҷаи кори шумо захира кунед, интихоб кунед.

Дар ин ҷо FineReader ба шумо ба таври пурра ҷавоб медиҳад: шумо метавонед танҳо як маълумотро дар якҷоягӣ ба калимаҳои Word интиқол диҳед ва шумо метавонед онро дар яке аз даҳҳо форматҳо захира кунед. Аммо ман мехоҳам диққати дигареро нишон диҳам. Ҳар гуна формате, ки шумо интихоб мекунед, барои интихоби намуди нусха муҳимтар аст! Чунин тарзҳои ҷолибро баррасӣ кунед ...

Нусхаи нопурра

Ҳамаи соҳаҳоҳое, ки шумо дар саҳифа дар ҳуҷҷати эътирофшуда интихоб кардаед, дар ҳуҷҷати манбаъ муайян карда мешавад. Имконияти хеле қулай вақте, ки барои шумо намунаи матн намерасад. Бо ин роҳ, феҳристҳо низ ба аслӣ монанд мебошанд. Ман бо ин вариант тавсия медиҳам, ки ҳуҷҷатро ба Word интиқол диҳед, минбаъд дар он ҷо корро давом диҳед.

Нусхаи нусхабардорӣ

Ин вариант хуб аст, чунки шумо версияи аллакай таркиб ёфтаед. Ie Нишондиҳандаи «kilometer», ки дар ҳуҷҷати аслӣ буда метавонистанд, шумо мувофиқат намекунед. Интихоби муфид, вақте ки шумо маълумоти бештарро таҳрир мекунед.

Дар ҳақиқат, шумо набояд интихоб кунед, агар барои муҳофизат кардани сабки тарҳрезӣ, рангҳо, индексҳо муҳим аст. Баъзан, агар эътирофи муваффақ набошад - ҳуҷҷати шумо метавонад «форм» -ро бо формати тағйирёбанда табдил кунад. Дар ин ҳолат тавсия дода мешавад, ки нусхаи дақиқ интихоб кунед.

Матни сатҳ

Имконияти онҳое, ки танҳо матнро аз саҳифа бе ягон чизи дигар талаб мекунанд. Ҳуҷҷатҳое, ки бидуни ҳуҷҷатҳои расмӣ ва ҷадвалҳо мувофиқанд.

Ин мақолаи нусхабардории ҳуҷҷат ва мақола мебошад. Ман умедворам, ки бо кӯмаки ин маслиҳатҳои оддӣ шумо метавонед мушкилоти худро ҳал кунед ...

Шукрона!