Тафсилоти матн дар файли PDF онлайн.


Ин имкон намедиҳад, ки матнро аз файли PDF истифода баред, ки бо истифодаи нусхаи анъанавӣ. Аксар вақт саҳифаҳои чунин ҳуҷҷатҳо мундариҷаи нусхаи варақаҳои коғазии онҳо мебошанд. Барои ворид кардани ин файлҳо ба маълумоти пурра таҳриршуда, барномаҳои махсус бо функсияҳои оксити оптикӣ (OCR) истифода мешаванд.

Чунин ҳалли мушкилот барои татбиқи он хеле душвор аст ва бинобар ин, хароҷоти зиёдро талаб мекунанд. Агар шумо ба таври мунтазам матнро бо PDF тасвир кунед, онро бо хариди барнома мувофиқ кунед. Барои ҳолатҳои ночиз, ин мантиқан барои истифодаи яке аз хидматҳои онлайн дастрас мебошад.

Чӣ тавр матн аз матни PDF дидан

Албатта, нармафзори хусусии онлайнии OCR дар муқоиса бо ҳалли пурраи мизи корӣ маҳдуд аст. Аммо шумо метавонед бо чунин захираҳо барои озод, ё барои пардохти номиналӣ кор карда метавонед. Муҳимияти асосӣ ин аст, ки барномаҳои дахлдори веб бо вазифаи асосии худ, яъне эътирофи матн, бо ҳамдигар мубориза мебаранд.

Усули 1: ABBYY FineReader Online

Ширкати хадамоти хидматрасонӣ яке аз пешвоёни соҳаи шинохтани оптикӣ мебошад. ABBYY FineReader барои Windows ва Mac як ҳалли пуриқтидор барои тағйир додани PDF ба матн ва кор бо он аст.

Барномасозони вебсайт, албатта, аз он дар функсионалӣ камтар аст. Бо вуҷуди ин, хадамот метавонист тавассути матнҳо ва суратҳо дар беш аз 190 забонҳо матнро эътироф кунад. Дастрас кардани файлҳои PDF ба ҳуҷҷатҳои Word, Excel ва ғайра.

ABBYY FineReader Хизмат дар онлайн онлайн

  1. Пеш аз оғози кор бо воситаи корт, ҳисоби худро дар сомона эҷод кунед ё дар Facebook, Google ё ҳисоби Microsoft-и худ истифода баред.

    Барои гузариш ба тирезаи воридотӣ, тугмаи чапи мушро пахш кунед. "Забон" дар менюи менюи боло.
  2. Ҳангоми воридшавӣ ворид кунед, ҳуҷҷати эҳтиётии PDF-ро бо истифода аз тугмаи FineReader ворид кунед "Боркунии файлҳо".

    Баъд тугмаро пахш кунед "Рақамҳои саҳифаро интихоб кунед" ва тасвири дилхоҳро барои шинохтани матн нишон диҳед.
  3. Баъдан, забонҳои дар ҳуҷҷат ҷойгиршуда, формати файлеро, ки натиҷа додаанд, интихоб кунед ва тугмаи чапро пахш кунед "Эътироф".
  4. Пас аз коркард, давомнокии он пурра ба андозаи ҳуҷҷат вобаста аст, шумо метавонед файлро бо матни оддӣ бо пахш кардани номи худ бор кунед.

    Ё онро ба яке аз хидматҳои дастраси абрӣ содир кунед.

Хизматрасонӣ фарқ мекунад, эҳтимолияти алгоритми шинохташудаи тасвирҳо ва файлҳои PDF мебошад. Аммо, мутаассифона, истифодаи ройгони он бо панҷ саҳифа дар як моҳ маҳдуд аст. Барои кор бо ҳуҷҷатҳои тиллоӣ, шумо бояд харидани як сола харед.

Бо вуҷуди ин, агар вазифаи OCR хеле зарур аст, ABBYY FineReader Online як варианти бузург барои истихроҷи матн аз файлҳои PDF осон аст.

Усули 2: Системаи онлайнии онлайнӣ

Хизматҳои оддӣ ва муносиб барои рақамӣ кардани матн. Бе зарурати бақайдгирӣ, захираҳо ба шумо имкон медиҳад, ки 15 соат PDF-саҳифаҳоро дар як соат шинохта тавонед. Free Online OCR комилан бо ҳуҷҷатҳо дар 46 забон кор мекунад ва бе иҷозати се формати содироти матн - DOCX, XLSX ва TXT дастгирӣ мекунад.

Ҳангоми бақайдгирӣ, корбар метавонад ҳуҷҷатҳои зиёди саҳифаҳоро иҷро кунад, аммо шумораи рамзҳои ин саҳифаҳо 50 адад маҳдуд аст.

Хизматрасонии онлайнии онлайнии OCR

  1. Барои тасвири матн аз PDF ба сифати "меҳмон", бе иҷозати манбаъ, формати мувофиқро дар саҳифаи асосии сайт истифода кунед.

    Тугмаи дилхоҳро бо тугмаи интихоб кунед "Файл", забони матнии матн, форматро нишон диҳед, пас интихоби файли боркунӣ ва пахш кунед "Табдил додан".
  2. Дар охири раванди раќамикунонї, ангушт занед "Бор кардани файли натиҷавӣ" барои сабт кардани ҳуҷҷати анҷомшуда бо матн дар компютер.

Барои истифодабарандагони ваколатдор, пайдарпаии амалиётҳо хеле гуногун мебошанд.

  1. Тугмачаи истифода баред "Бақайдгирӣ" ё "Забон" дар менюи боло ба ҷои, эҷоди суратҳисоби Free Online OCR ё ба он ворид шавед.
  2. Пас аз додани иҷозатнома дар панели эътироф, калидро нигоҳ доред "CTRL", то ба ду рӯйхати ҳуҷҷати ройгон аз рӯйхат пешниҳод кунед.
  3. Вариантҳои иловагӣ барои истихроҷи матн аз PDF-ро интихоб кунед ва тугмаи пахш кунед. "Файлро интихоб кунед" барои ворид кардани ҳуҷҷат ба хидмат.

    Сипас, шинос шуданро оғоз кунед, пахш кунед "Табдил додан".
  4. Пас аз коркарди ҳуҷҷат, ба алоқа бо номи файли берунӣ дар сутуни дахлдор пахш кунед.

    Натиҷаи шинохтани фаврӣ дар хотираи компютератон захира карда мешавад.

Агар шумо нусхабардории матн аз ҳуҷҷати хурде дошта бошед, шумо метавонед бо истифодаи асбоби дар боло тавсифшуда ба таври бехатар муроҷиат кунед. Барои кор бо файлҳои калон, шумо бояд рамзҳои иловагиро дар Online Online OCR харид кунед ё ба ҳалли дигар муроҷиат кунед.

Метод 3: NewOCR

Хизматрасонии OCR-бепул, ки ба шумо имкон медиҳад, ки шумо аз ҳама гуна ҳуҷҷатҳои графикӣ ва электронӣ, монанди DjVu ва PDF. Сарчашмаҳо ба андоза ва шумораи файлҳои эътирофшуда маҳдуд намегарданд, сабти номро талаб намекунад ва доираи васеи вазифаҳои алоқамандро пешниҳод мекунад.

NewOCR 106 забонро дастгирӣ мекунад ва қодир ба дурустии сканеркҳои ҳуҷҷати сифат аст. Метавонанд, ки майдонро барои шинохтани матн дар саҳифаи файл интихоб кунед.

Хизматҳои онлайнӣ NewOCR

  1. Ҳамин тариқ, шумо метавонед бо захираи фаврӣ, бе зарурати анҷом додани амалҳои ғайричашмдошт оғоз намоед.

    Ба таври мустақим дар саҳифаи асосӣ барои ворид кардани ҳуҷҷат ба сомона вуҷуд дорад. Барои нусхабардории файл ба NewOCR, тугмаро истифода баред "Файлро интихоб кунед" дар қисмат "Файлро интихоб кунед". Он гоҳ дар соҳаи "Забони шинохташаванда" як ё якчанд забон аз ҳуҷҷати сарчашмаро интихоб кунед, сипас пахш кунед "Боркунии + OCR".
  2. Танзимоти шинохтани профилҳои худро танзим кунед, барои ҷустуҷӯи матн, саҳифаҳои дилхоҳро интихоб кунед ва тугмаи ростро пахш кунед. "OCR".
  3. Ба поён ҳаракат кунед ва тугмаи ҷустуҷӯ кунед. Бор кунед.

    Ба он пахш кунед ва дар рӯйхати афтанда, формати заруриро барои боргирӣ интихоб кунед. Баъд аз ин, файл хотимавӣ бо матни эфирӣ ба компютери шумо бор карда мешавад.

Ин восита осон аст ва ҳамаи рамзҳоеро, ки ба таври кофӣ сифати баланд доранд, эътироф мекунанд. Бо вуҷуди ин, коркарди ҳар як саҳифаи ҳуҷҷати PDF-и воридшуда бояд мустақилона кушода шавад ва дар файли алоҳида нишон дода шавад. Шумо метавонед, албатта, натиҷаҳои шинохтаи худро ба силсилабандӣ нусхабардорӣ кунед ва онҳоро бо дигарон ҳамроҳ кунед.

Бо вуҷуди ин, бо назардошти нуктаи боло, миқдори зиёди матн бо ёрии NewOCR хеле осон аст. Бо ёрии файлҳои файли хурди яквақта бо "браузер."

Усули 4: OCR.Space

Манбаи оддӣ ва фаҳмо барои рақамӣ кардани матн ба шумо имконият медиҳад, ки ҳуҷҷатҳои PDF-ро шинохта ва натиҷаро дар файли TXT бароранд. Дар шумораи шумораи саҳифаҳо вуҷуд надорад. Танҳо маҳдудияти он аст, ки андозаи ҳуҷҷати воридотӣ набояд аз 5 мегабайт зиёд бошад.

Хизматрасонии интернетӣ

  1. Бояд қайд кард, ки кор бо дастгоҳ зарур нест.

    Танҳо дар бораи пайвастшавӣ ба тугмаи ангуштзанӣ ва ҳуҷҷати PDF ба сайт бо истифодаи тугмаи компютери худ бор кунед "Файлро интихоб кунед" ё аз шабака - бо истиноди.
  2. Дар рӯйхати афтодан "Интихоби забони OCR" забони ҳуҷҷатро ворид кунед.

    Сипас раванди шинохтани матнро бо пахш кардани тугмаи оғоз намоед. "ОКК оғоз кунед!".
  3. Дар охири коркарди файл, ба натиҷа дар "Натиҷаи OCR" ва пахш кунед Бор кунедбарои зеркашии ҳуҷҷати TXT анҷом дода шудааст.

Агар шумо фақат матнро аз PDF фаҳмонед ва формати ниҳоӣ дар ҳама ҳолат муҳим нест, OCR.Space интихоби хуб аст. Ҳуҷҷати ягона бояд «monolingual» бошад, зеро эътироф кардани ду ё зиёда забонҳо дар ҳамон вақт дар хидмат таъмин карда намешаванд.

Ҳамчунин нигаред: Аналҳои озод FreeReader

Арзёбии воситаҳои онлайн дар маҷаллае, ки дар мақола оварда шудааст, бояд қайд карда шавад, ки FineReader Online аз ABBYY вазифаи OCR ба таври дақиқ ва дақиқро идора мекунад. Агар дараҷаи ҳадди аксари эътирофи матн барои шумо муҳим бошад, беҳтар аст, ки ин хосиятро махсусан баррасӣ кунед. Аммо барои пардохти он, эҳтимолан эҳтимол дорад низ бояд.

Агар шумо нусхаҳои ҳуҷҷатҳои хурдро рақам кунед ва шумо омодаед, ки хатогиҳои худро дар хидмати худ ислоҳ кунед, он барои истифодаи NewOCR, OCR.