OCR ။ အခမဲ့ပရိုဂရမ် - အလားတူ FineReader

ရှိရာသို့အလျင်အမြန်သို့မဟုတ်နောက်ပိုင်းမကြာခဏရုံး applications များနှင့်အတူအလုပ်လုပ်သောသူလူတိုင်းကိုတစ်ဘုံလုပ်ငန်းတာဝန်နှင့်အတူရင်ဆိုင်ခဲ့ရသည်ကြသည် - စာအုပ်, မဂ္ဂဇင်း, သတင်းစာရုံအရွက်ကနေစာသားအား scan, ပြီးတော့ထိုကဲ့သို့သောစကားလုံးစာရွက်စာတမ်းအဖြစ် text format အစရှိသူများပုံရိပ်တွေဘာသာပြန်ဆိုရန်။

ဒီလိုလုပ်ဖို့တစ်စကင်နာနှင့်စာသားအသိအမှတ်ပြုမှုများအတွက်အထူးအစီအစဉ်လိုအပ်သည်။ ဤဆောင်းပါး၌ကျွန်ုပ်တို့သည်အခမဲ့ analogue FineReader အကြောင်းပြောဆိုကြလိမ့်မည် -Cuneiform (FineReader အတွက်အသိအမှတ်ပြုမှုတွင် - ဤဆောင်းပါးကိုကြည့်ပါ။ ) ။

ရဲ့စတင်ကြစို့ ...

အကြောင်းအရာ

  • 1. Cuneiform အစီအစဉ်ကိုအခွင့်အလမ်းများကို Features
  • OCR ၏ 2. ဥပမာ
  • 3. အသုတ်လိုက် OCR
  • 4. နိဂုံး

1. Cuneiform အစီအစဉ်ကိုအခွင့်အလမ်းများကို Features

Cuneiform

သင့်အနေဖြင့်ဆော့ဖ်ဝဲရေးသူရဲ့ site ကိုမှ Download ပြုလုပ်နိုင်ပါသည်: //cognitiveforms.com/

ပွင့်လင်းအရင်းအမြစ်နှင့်အတူစာသားကိုအသိအမှတ်ပြုမှုများအတွက်ပရိုဂရမ်ဖြစ်ပါတယ်။ XP, Vista, 7, 8, အရာနှစ်သက်: အပြင်, က Windows ကိုအားလုံးဗားရှင်းမှာအလုပ်လုပ်နေပါတယ်။ ဒီအပြင်, အပြည့်အဝရုရှားဘာသာပြန်ချက်အစီအစဉ်ကို add!

အပြစ်တွေ:

- OCR 20 လူကြိုက်အများဆုံးဘာသာစကားများ (အင်္ဂလိပ်နှင့်ရုရှားကိုယ်တိုင်ကဒီနံပါတ်ကိုများတွင်ပါဝင်သည်);

- အကြီးအထောက်ခံမှုကွဲပြားခြားနားသောပုံနှိပ်စာလုံးတွေ;

- အဘိဓာန်အဆိုပါအသိအမှတ်ပြုစာသားကိုစစ်ဆေး;

- အတော်ကြာကွဲပြားခြားနားတဲ့နည်းလမ်းတွေထဲမှာရလဒ်များကိုကယ်တင်နိုင်စွမ်း;

- တစ်ဦးစာရွက်စာတမ်းရဲ့ဖွဲ့စည်းပုံ၏ထိန်းသိမ်းစောင့်ရှောက်;

- စားပွဲ၏ကြီးမြတ်ထောက်ခံမှုနှင့်အသိအမှတ်ပြုမှု။

cons:

- ကအလွန်ကြီးမားစာရွက်စာတမ်းများနှင့်ဖိုင်များ (400 dpi) ကိုပံ့ပိုးမထားဘူး,

- စကင်နာများဟာတိုက်ရိုက်အချို့အမျိုးအစားများကိုထောကျပံ့ပေးမထားဘူး (ကောင်းစွာ, ကကြောက်စရာမဟုတ်ဘူး, အကင်နာစကင်ဖတ်စစ်ဆေးဖို့နှင့်အထူးအစီအစဉ်တစ်ခုဖြစ်သည်ယာဉ်မောင်းမှထောက်ပံ့။ );

- ဒီဇိုင်းမတောက်ပါဘူး (သို့သော်အစီအစဉ်ကိုအပြည့်အဝအတွက်ပြဿနာဖြေရှင်းနိုင်မည်သည့်အခါအဘယ်သူလိုအပ်ပါတယ်) ။

OCR ၏ 2. ဥပမာ

အကြှနျုပျတို့သညျကိုလက်ခံရရှိထားသောအသိအမှတ်ပြုမှုများအတွက်လိုအပ်သောရုပ်ပုံများကို (ကစကင်ဖတ်စစ်ဆေးနေ, ဒါမှမဟုတ် pdf / djvu format နဲ့အွန်လိုင်းစာအုပ်ဒေါင်းလုဒ်လုပ်ပြီးထိုသို့ပြုမှမည်သို့သူတို့၏တပ်မက်လိုချင်သောအပုံရိပ်ထဲကရတယ်။ - ဤဆောင်းပါးကိုရှုပါ။ ) ထိုယူဆ။

1) program ကို CuineForm (ဖိုင် / ပွင့်လင်းသို့မဟုတ် "Cntrl + O") အတွက်အလိုရှိသောရုပ်ပုံလွှာကိုဖွင့်။

2) အသိအမှတ်ပြုမှုမှဆက်လက်ဆောင်ရွက်ရန်အလို့ငှာ - ကပထမဦးဆုံးကွဲပြားခြားနားသောဒေသများသိရှိနိုင်ဖို့လိုအပ်သောဖြစ်ပါသည်: စာသား, ပုံများ, စားပွဲ, etc အဆိုပါအစီအစဉ်ကို Cuneiform ဒီလက်ဖြင့်သာပြုမိပေမယ့်နိုင်ပါသည်။ အလိုအလျှောက်! ဒီလိုလုပ်ဖို့, အထက် pane ထဲကကိုကို "markup" ကိုကလစ်နှိပ်ပါ။

3) 10-15 စက္ကန့်ပြီးနောက်။ program ကိုအလိုအလျှောက်ကွဲပြားခြားနားသောအရောင်များကိုအပေါငျးတို့သဒေသများမီးမောင်းထိုးပြ။ ဥပမာအားဖြင့်, စာသားဧရိယာအပြာအတွက်မီးမောင်းထိုးပြနေသည်။ စကားမစပ်ကမှန်ကန်စွာနှင့်လျင်မြန်စွာအားလုံးလယ်ကွင်းကိုမီးမောင်းထိုးပြပါလိမ့်မယ်။ ရိုးရိုးသားသားပြောရရင်ငါကဒါကြောင့်အစာရှောင်ခြင်းနှင့်မှန်ကန်သောတုံ့ပြန်မှုကိုမျှော်လင့်ခဲ့ပါဘူး ...

4) အလိုအလျှောက် layout ကိုမယုံကြည်ကြဘူး, သင်သည်လက်စွဲသုံးနိုငျသောသူတို့အားသည်။ ဒီလိုလုပ်ဖို့, သင်စာသား, စားပွဲ, ဓါတ်ပုံတွေကိုမီးမောင်းထိုးပြနိုင်သည့်မှတဆင့် tools တွေကို socket (အောက်တွင်ပုံရိပ်ကြည့်ရှုပါ။ ), ရှိပါတယ်။ တိုး / ကနဦးပုံရိပ်လျော့အနားကိုချုံ့, ရွှေ့ပါ။ ယေဘုယျအားဖြင့်ကောင်းတစ်ဦးအစု။

အားလုံးဒေသများမှတ်ပြီးပါပြီပြီးနောက် 5) သင်ဆက်လက်ဆောင်ရွက်နိုင်ပါတယ် မှတ်မိခြင်း။ အောက်မှာပြထားတဲ့အတိုင်းဒီလိုလုပ်ဖို့, ရိုးရိုး, သင့်လျော်တဲ့ခလုတ်ကိုကလစ်နှိပ်ပါ။

6) ရုံ 10-20 စက္ကန့်အကြာတွင်။ သင်အသိအမှတ်ပြုသည့်စာသားနှင့်အတူ Microsoft Word ကိုစာရွက်စာတမ်းဖွင့်လှစ်မီ။ ဒီဥပမာအဘို့အစာသားထဲမှာစိတ်ဝင်စားစရာကောင်းကဘာလဲ, အမှား, သင်တန်းရှိကြ၏, ဒါပေမဲ့သူတို့ကအရမ်းအများကြီးမဟုတျပါ! အထူးသဖြင့်, ထိုကုန်ကြမ်းအဖြစ် nondescript ဘာအတွက်ထည့်သွင်းစဉ်းစား - ပုံ။

အဆိုပါမြန်နှုန်းနှင့်အရည်အသွေး FineReader နှင့်အတူနှိုင်းယှဉ်ပါ!

3. အသုတ်လိုက် OCR

သင်တဦးတည်းရုပ်ပုံထက်ပိုပေမယ့်တော်တော်များများအသိအမှတ်မပြုဖို့လိုအပ်တဲ့အခါဒီအစီအစဉ်ကိုအင်္ဂါရပ်နေရာလေးကိုအတွက်လာနိုင်ပါတယ်။ များသောအားဖြင့်က "အစကတည်းက" မီနူးထဲမှာဝှက်ထားလျက်ရှိသောအသုတ်အသိအမှတ်ပြုမှုကို run ဖို့တစ်ဦးကဖြတ်လမ်း။

1) Program ကိုဖွင့်လှစ်ပြီးနောက်, သငျသညျသစ်တစ်ခုအထုပ်ဖန်တီးတစ်ခုသို့မဟုတ်ယခင်ကသည်ကယ်တင်ခြင်းသို့ရောက်ဖွင့်လှစ်ဖို့လိုအပ်ပါတယ်။ ကျွန်တော်တို့ရဲ့ဥပမာထဲမှာ - အသစ်တစ်ခုကိုတဦးတည်းဖန်တီးပါ။

2) နောက်တစ်ဆင့်မှာတော့ကျနော်တို့ခြောက်လအကြာမှာကြောင့်ကယ်တင်ခြင်းသို့ရောက်ရ၏ထားပြီးကြောင်းမှတ်မိဖို့ပိုကောင်းထိုကဲ့သို့သော, ကနာမည်တစ်ခုပေး။

3) ထို့နောက်စာရွက်စာတမ်းဘာသာစကား (ရုရှား, အင်္ဂလိပ်) ကို select, သင့် Scan ပုံများ, နှင့်စားပွဲအတွက်ပစ္စည်းရှိမရှိဖော်ပြသည်။

4) အခုဆိုရင်သင်ဖိုင်များကိုအသိအမှတ်ပြုမှုများအတွက်တည်ရှိသည်ရှိရာ folder ကိုသတ်မှတ်ဖို့လိုအပ်ပါတယ်။ စကားမစပ်စိတ်ဝင်စားစရာအလုံအလောက်, program ကိုကစီမံကိန်းသူတို့ကိုအသိအမှတ်ပြုရန်နှင့် add နိုင်ပါလိမ့်မည်သည့်အပေါငျးတို့သရုပ်ပုံများနှင့်အခြားပုံရိပ်ဖိုင်များကိုရှာတွေ့ပါလိမ့်မယ်။ သငျသညျပိုလျှံဖယ်ရှားပစ်ရန်ထွက်ခွာလိမ့်မည်။

5) နောက်တစ်ဆင့်အသိအမှတ်ပြုပြီးနောက်, အရင်းအမြစ်ဖိုင်တွေနဲ့အတူဘာလုပ်ရမှန်းကိုရှေးခယျြ vazhen- မဟုတ်ပါဘူး။ ငါက "ဘာမျှမလုပ်ပေး" ကို tick ရွေးချယ်ဖို့အကြံပြုလိုပါတယ်။

6) ဒါဟာသာအသိအမှတ်ပြုစာရွက်စာတမ်းသိမ်းဆည်းထားတဲ့အတွက် format ကိုရွေးဖို့နေဆဲဖြစ်သည်။ အတော်ကြာရွေးချယ်စရာရှိပါတယ်:

- RTF - တစ်ဦးစာရွက်စာတမ်းစကားလုံးကနေဖိုင်တစ်ခု, (program ကိုရန်အခမဲ့, link တစ်ခုအပါအဝင်) အပေါငျးတို့သလူကြိုက်များရုံးများကမ်းလှမ်း;

- TXT - ကသာအစာသား, images နဲ့စားပွဲမဖွစျနိုငျကယ်ဖို့ဖြစ်နိုင်သမျှသောစာသားပုံစံဖြစ်၏

- htm - hypertext ကိုစာမျက်နှာသင်သည်ထို site များအတွက်ဖိုင်များကိုစကင်ဖတ်စစ်ဆေးခြင်းနှင့်အသိအမှတ်မပြုလျှင်, အသုံးဝင်သည်။ ဒါဟာနှင့်ရှေးခယျြကျွန်တော်တို့ရဲ့ဥပမာထဲမှာ။

7) "ပြီးပြီ" ခလုတ်ကိုနှိပ်ခြင်းအားပြီးနောက်သင်၏စီမံကိန်းအပြောင်းအလဲနဲ့စတင်ပါလိမ့်မည်။

8) အဆိုပါအစီအစဉ်တော်တော်လေးမြန်ဆန်စွာအလုပ်လုပ်သည်။ ဖတ်ရှုပြီးနောက်သင် htm ဖိုင်တွေနဲ့ tab ကိုမြင်ရပါလိမ့်မည်။ သင်ထိုကဲ့သို့သောဖိုင်ကို၏ရလဒ်များကိုတွေ့မြင်နိုင်သည်ရှိရာဘရောက်ဇာ, ကိုဖွင့်ဖို့ကိုနှိပ်ပါလျှင်။ စကားမစပ်, သင်ကအတူနောက်ထပ်အလုပ်အတွက်တစ်ဦးအစုအဝေးကိုကယ်တင်နိုင်ပါ။

9) တွေ့မြင်နိုင်ပါသည်အဖြစ်, ရလဒ်များကို အလုပ်ကအရမ်းအထင်ကြီးဖြစ်ပါတယ်။ Image ကိုအစီအစဉ်ကိုအသိအမှတ်မပြုရန်လွယ်ကူကြောင်း, ဒါကြောင့်အောက်စာသားအသိအမှတ်မပြုရန်လွယ်ကူသည်။ အားလုံးစူပါကြောင်း - အစီအစဉ်ကိုအခမဲ့ဖြစ်တယ်, စဉ်တွင်!

4. နိဂုံး

သငျသညျမကြာခဏစကင်ဖတ်စစ်ဆေးဖို့မနှင့် OCR, FineReader ထို့နောက်အစီအစဉ်ကိုဝယ်လျှင်, ဖြစ်ကောင်းသဘောမျိုးလုပ်မထားဘူး။ ပြဿနာများ၏အများစုအလွယ်တကူ Cuneiform ကိုင်တွယ်နိုင်ပါတယ်။

အခြားတစ်ဖက်တွင်, ကနှင့် minuses မှာရှိသည်။

ပထမဦးစွာလည်းအနည်းငယ် tools တွေကိုတည်းဖြတ်အဘို့နှင့်ရလဒ်အတည်ပြု။ အခါဓါတ်ပုံတွေကိုအများကြီးအသိအမှတ်ပြုရန်လိုအပ်ဒုတိယအချက်မှာ - ထို FineReader အတွက်ညာဘက်ကော်လံထဲမှာတစ်ချက်မှာစီမံကိန်းလုပ်ဖို့ကဆက်ပြောသည်ကြောင်းအားလုံးတွေ့မြင်ဖို့ပိုပြီးလွယ်ကူ: လျင်မြန်စွာပိုလျှံဖယ်ရှားပစ်ရန်, အပြောင်းအလဲများကိုလုပ်, etc ပြီးတော့တတိယ, စာရွက်စာတမ်းများပေါ်မှာအလွန်အရည်အသွေးညံ့ဖျင်း, Cuneiform အသိအမှတ်ပြုမှုအဖြစ်ရှုံး :. စာရွက်စာတမ်းစိတ်ထဲရောက်စေဖို့ရှိပါတယ် - အမှားတံဆိပ်ထုပုဒ်ဖြတ်ပုဒ်ရပ်, ကိုးကား, etc အုပ်ချုပ်ဖို့

ဒါကအားလုံးပါပဲ။ တဖန်သင်တို့ကစာသားအသိအမှတ်ပြုမှုများအတွက်အခမဲ့အစီအစဉ်၏အခြားဘယ်အရာကိုခံထိုက်သိ?