ရှိရာသို့အလျင်အမြန်သို့မဟုတ်နောက်ပိုင်းမကြာခဏရုံး applications များနှင့်အတူအလုပ်လုပ်သောသူလူတိုင်းကိုတစ်ဘုံလုပ်ငန်းတာဝန်နှင့်အတူရင်ဆိုင်ခဲ့ရသည်ကြသည် - စာအုပ်, မဂ္ဂဇင်း, သတင်းစာရုံအရွက်ကနေစာသားအား scan, ပြီးတော့ထိုကဲ့သို့သောစကားလုံးစာရွက်စာတမ်းအဖြစ် text format အစရှိသူများပုံရိပ်တွေဘာသာပြန်ဆိုရန်။
ဒီလိုလုပ်ဖို့တစ်စကင်နာနှင့်စာသားအသိအမှတ်ပြုမှုများအတွက်အထူးအစီအစဉ်လိုအပ်သည်။ ဤဆောင်းပါး၌ကျွန်ုပ်တို့သည်အခမဲ့ analogue FineReader အကြောင်းပြောဆိုကြလိမ့်မည် -Cuneiform (FineReader အတွက်အသိအမှတ်ပြုမှုတွင် - ဤဆောင်းပါးကိုကြည့်ပါ။ ) ။
ရဲ့စတင်ကြစို့ ...
အကြောင်းအရာ
- 1. Cuneiform အစီအစဉ်ကိုအခွင့်အလမ်းများကို Features
- OCR ၏ 2. ဥပမာ
- 3. အသုတ်လိုက် OCR
- 4. နိဂုံး
1. Cuneiform အစီအစဉ်ကိုအခွင့်အလမ်းများကို Features
Cuneiform
သင့်အနေဖြင့်ဆော့ဖ်ဝဲရေးသူရဲ့ site ကိုမှ Download ပြုလုပ်နိုင်ပါသည်: //cognitiveforms.com/
ပွင့်လင်းအရင်းအမြစ်နှင့်အတူစာသားကိုအသိအမှတ်ပြုမှုများအတွက်ပရိုဂရမ်ဖြစ်ပါတယ်။ XP, Vista, 7, 8, အရာနှစ်သက်: အပြင်, က Windows ကိုအားလုံးဗားရှင်းမှာအလုပ်လုပ်နေပါတယ်။ ဒီအပြင်, အပြည့်အဝရုရှားဘာသာပြန်ချက်အစီအစဉ်ကို add!
အပြစ်တွေ:
- OCR 20 လူကြိုက်အများဆုံးဘာသာစကားများ (အင်္ဂလိပ်နှင့်ရုရှားကိုယ်တိုင်ကဒီနံပါတ်ကိုများတွင်ပါဝင်သည်);
- အကြီးအထောက်ခံမှုကွဲပြားခြားနားသောပုံနှိပ်စာလုံးတွေ;
- အဘိဓာန်အဆိုပါအသိအမှတ်ပြုစာသားကိုစစ်ဆေး;
- အတော်ကြာကွဲပြားခြားနားတဲ့နည်းလမ်းတွေထဲမှာရလဒ်များကိုကယ်တင်နိုင်စွမ်း;
- တစ်ဦးစာရွက်စာတမ်းရဲ့ဖွဲ့စည်းပုံ၏ထိန်းသိမ်းစောင့်ရှောက်;
- စားပွဲ၏ကြီးမြတ်ထောက်ခံမှုနှင့်အသိအမှတ်ပြုမှု။
cons:
- ကအလွန်ကြီးမားစာရွက်စာတမ်းများနှင့်ဖိုင်များ (400 dpi) ကိုပံ့ပိုးမထားဘူး,
- စကင်နာများဟာတိုက်ရိုက်အချို့အမျိုးအစားများကိုထောကျပံ့ပေးမထားဘူး (ကောင်းစွာ, ကကြောက်စရာမဟုတ်ဘူး, အကင်နာစကင်ဖတ်စစ်ဆေးဖို့နှင့်အထူးအစီအစဉ်တစ်ခုဖြစ်သည်ယာဉ်မောင်းမှထောက်ပံ့။ );
- ဒီဇိုင်းမတောက်ပါဘူး (သို့သော်အစီအစဉ်ကိုအပြည့်အဝအတွက်ပြဿနာဖြေရှင်းနိုင်မည်သည့်အခါအဘယ်သူလိုအပ်ပါတယ်) ။
OCR ၏ 2. ဥပမာ
အကြှနျုပျတို့သညျကိုလက်ခံရရှိထားသောအသိအမှတ်ပြုမှုများအတွက်လိုအပ်သောရုပ်ပုံများကို (ကစကင်ဖတ်စစ်ဆေးနေ, ဒါမှမဟုတ် pdf / djvu format နဲ့အွန်လိုင်းစာအုပ်ဒေါင်းလုဒ်လုပ်ပြီးထိုသို့ပြုမှမည်သို့သူတို့၏တပ်မက်လိုချင်သောအပုံရိပ်ထဲကရတယ်။ - ဤဆောင်းပါးကိုရှုပါ။ ) ထိုယူဆ။
1) program ကို CuineForm (ဖိုင် / ပွင့်လင်းသို့မဟုတ် "Cntrl + O") အတွက်အလိုရှိသောရုပ်ပုံလွှာကိုဖွင့်။
2) အသိအမှတ်ပြုမှုမှဆက်လက်ဆောင်ရွက်ရန်အလို့ငှာ - ကပထမဦးဆုံးကွဲပြားခြားနားသောဒေသများသိရှိနိုင်ဖို့လိုအပ်သောဖြစ်ပါသည်: စာသား, ပုံများ, စားပွဲ, etc အဆိုပါအစီအစဉ်ကို Cuneiform ဒီလက်ဖြင့်သာပြုမိပေမယ့်နိုင်ပါသည်။ အလိုအလျှောက်! ဒီလိုလုပ်ဖို့, အထက် pane ထဲကကိုကို "markup" ကိုကလစ်နှိပ်ပါ။
3) 10-15 စက္ကန့်ပြီးနောက်။ program ကိုအလိုအလျှောက်ကွဲပြားခြားနားသောအရောင်များကိုအပေါငျးတို့သဒေသများမီးမောင်းထိုးပြ။ ဥပမာအားဖြင့်, စာသားဧရိယာအပြာအတွက်မီးမောင်းထိုးပြနေသည်။ စကားမစပ်ကမှန်ကန်စွာနှင့်လျင်မြန်စွာအားလုံးလယ်ကွင်းကိုမီးမောင်းထိုးပြပါလိမ့်မယ်။ ရိုးရိုးသားသားပြောရရင်ငါကဒါကြောင့်အစာရှောင်ခြင်းနှင့်မှန်ကန်သောတုံ့ပြန်မှုကိုမျှော်လင့်ခဲ့ပါဘူး ...
4) အလိုအလျှောက် layout ကိုမယုံကြည်ကြဘူး, သင်သည်လက်စွဲသုံးနိုငျသောသူတို့အားသည်။ ဒီလိုလုပ်ဖို့, သင်စာသား, စားပွဲ, ဓါတ်ပုံတွေကိုမီးမောင်းထိုးပြနိုင်သည့်မှတဆင့် tools တွေကို socket (အောက်တွင်ပုံရိပ်ကြည့်ရှုပါ။ ), ရှိပါတယ်။ တိုး / ကနဦးပုံရိပ်လျော့အနားကိုချုံ့, ရွှေ့ပါ။ ယေဘုယျအားဖြင့်ကောင်းတစ်ဦးအစု။
အားလုံးဒေသများမှတ်ပြီးပါပြီပြီးနောက် 5) သင်ဆက်လက်ဆောင်ရွက်နိုင်ပါတယ် မှတ်မိခြင်း။ အောက်မှာပြထားတဲ့အတိုင်းဒီလိုလုပ်ဖို့, ရိုးရိုး, သင့်လျော်တဲ့ခလုတ်ကိုကလစ်နှိပ်ပါ။
6) ရုံ 10-20 စက္ကန့်အကြာတွင်။ သင်အသိအမှတ်ပြုသည့်စာသားနှင့်အတူ Microsoft Word ကိုစာရွက်စာတမ်းဖွင့်လှစ်မီ။ ဒီဥပမာအဘို့အစာသားထဲမှာစိတ်ဝင်စားစရာကောင်းကဘာလဲ, အမှား, သင်တန်းရှိကြ၏, ဒါပေမဲ့သူတို့ကအရမ်းအများကြီးမဟုတျပါ! အထူးသဖြင့်, ထိုကုန်ကြမ်းအဖြစ် nondescript ဘာအတွက်ထည့်သွင်းစဉ်းစား - ပုံ။
အဆိုပါမြန်နှုန်းနှင့်အရည်အသွေး FineReader နှင့်အတူနှိုင်းယှဉ်ပါ!
3. အသုတ်လိုက် OCR
သင်တဦးတည်းရုပ်ပုံထက်ပိုပေမယ့်တော်တော်များများအသိအမှတ်မပြုဖို့လိုအပ်တဲ့အခါဒီအစီအစဉ်ကိုအင်္ဂါရပ်နေရာလေးကိုအတွက်လာနိုင်ပါတယ်။ များသောအားဖြင့်က "အစကတည်းက" မီနူးထဲမှာဝှက်ထားလျက်ရှိသောအသုတ်အသိအမှတ်ပြုမှုကို run ဖို့တစ်ဦးကဖြတ်လမ်း။
1) Program ကိုဖွင့်လှစ်ပြီးနောက်, သငျသညျသစ်တစ်ခုအထုပ်ဖန်တီးတစ်ခုသို့မဟုတ်ယခင်ကသည်ကယ်တင်ခြင်းသို့ရောက်ဖွင့်လှစ်ဖို့လိုအပ်ပါတယ်။ ကျွန်တော်တို့ရဲ့ဥပမာထဲမှာ - အသစ်တစ်ခုကိုတဦးတည်းဖန်တီးပါ။
2) နောက်တစ်ဆင့်မှာတော့ကျနော်တို့ခြောက်လအကြာမှာကြောင့်ကယ်တင်ခြင်းသို့ရောက်ရ၏ထားပြီးကြောင်းမှတ်မိဖို့ပိုကောင်းထိုကဲ့သို့သော, ကနာမည်တစ်ခုပေး။
3) ထို့နောက်စာရွက်စာတမ်းဘာသာစကား (ရုရှား, အင်္ဂလိပ်) ကို select, သင့် Scan ပုံများ, နှင့်စားပွဲအတွက်ပစ္စည်းရှိမရှိဖော်ပြသည်။
4) အခုဆိုရင်သင်ဖိုင်များကိုအသိအမှတ်ပြုမှုများအတွက်တည်ရှိသည်ရှိရာ folder ကိုသတ်မှတ်ဖို့လိုအပ်ပါတယ်။ စကားမစပ်စိတ်ဝင်စားစရာအလုံအလောက်, program ကိုကစီမံကိန်းသူတို့ကိုအသိအမှတ်ပြုရန်နှင့် add နိုင်ပါလိမ့်မည်သည့်အပေါငျးတို့သရုပ်ပုံများနှင့်အခြားပုံရိပ်ဖိုင်များကိုရှာတွေ့ပါလိမ့်မယ်။ သငျသညျပိုလျှံဖယ်ရှားပစ်ရန်ထွက်ခွာလိမ့်မည်။
5) နောက်တစ်ဆင့်အသိအမှတ်ပြုပြီးနောက်, အရင်းအမြစ်ဖိုင်တွေနဲ့အတူဘာလုပ်ရမှန်းကိုရှေးခယျြ vazhen- မဟုတ်ပါဘူး။ ငါက "ဘာမျှမလုပ်ပေး" ကို tick ရွေးချယ်ဖို့အကြံပြုလိုပါတယ်။
6) ဒါဟာသာအသိအမှတ်ပြုစာရွက်စာတမ်းသိမ်းဆည်းထားတဲ့အတွက် format ကိုရွေးဖို့နေဆဲဖြစ်သည်။ အတော်ကြာရွေးချယ်စရာရှိပါတယ်:
- RTF - တစ်ဦးစာရွက်စာတမ်းစကားလုံးကနေဖိုင်တစ်ခု, (program ကိုရန်အခမဲ့, link တစ်ခုအပါအဝင်) အပေါငျးတို့သလူကြိုက်များရုံးများကမ်းလှမ်း;
- TXT - ကသာအစာသား, images နဲ့စားပွဲမဖွစျနိုငျကယ်ဖို့ဖြစ်နိုင်သမျှသောစာသားပုံစံဖြစ်၏
- htm - hypertext ကိုစာမျက်နှာသင်သည်ထို site များအတွက်ဖိုင်များကိုစကင်ဖတ်စစ်ဆေးခြင်းနှင့်အသိအမှတ်မပြုလျှင်, အသုံးဝင်သည်။ ဒါဟာနှင့်ရှေးခယျြကျွန်တော်တို့ရဲ့ဥပမာထဲမှာ။
7) "ပြီးပြီ" ခလုတ်ကိုနှိပ်ခြင်းအားပြီးနောက်သင်၏စီမံကိန်းအပြောင်းအလဲနဲ့စတင်ပါလိမ့်မည်။
8) အဆိုပါအစီအစဉ်တော်တော်လေးမြန်ဆန်စွာအလုပ်လုပ်သည်။ ဖတ်ရှုပြီးနောက်သင် htm ဖိုင်တွေနဲ့ tab ကိုမြင်ရပါလိမ့်မည်။ သင်ထိုကဲ့သို့သောဖိုင်ကို၏ရလဒ်များကိုတွေ့မြင်နိုင်သည်ရှိရာဘရောက်ဇာ, ကိုဖွင့်ဖို့ကိုနှိပ်ပါလျှင်။ စကားမစပ်, သင်ကအတူနောက်ထပ်အလုပ်အတွက်တစ်ဦးအစုအဝေးကိုကယ်တင်နိုင်ပါ။
9) တွေ့မြင်နိုင်ပါသည်အဖြစ်, ရလဒ်များကို အလုပ်ကအရမ်းအထင်ကြီးဖြစ်ပါတယ်။ Image ကိုအစီအစဉ်ကိုအသိအမှတ်မပြုရန်လွယ်ကူကြောင်း, ဒါကြောင့်အောက်စာသားအသိအမှတ်မပြုရန်လွယ်ကူသည်။ အားလုံးစူပါကြောင်း - အစီအစဉ်ကိုအခမဲ့ဖြစ်တယ်, စဉ်တွင်!
4. နိဂုံး
သငျသညျမကြာခဏစကင်ဖတ်စစ်ဆေးဖို့မနှင့် OCR, FineReader ထို့နောက်အစီအစဉ်ကိုဝယ်လျှင်, ဖြစ်ကောင်းသဘောမျိုးလုပ်မထားဘူး။ ပြဿနာများ၏အများစုအလွယ်တကူ Cuneiform ကိုင်တွယ်နိုင်ပါတယ်။
အခြားတစ်ဖက်တွင်, ကနှင့် minuses မှာရှိသည်။
ပထမဦးစွာလည်းအနည်းငယ် tools တွေကိုတည်းဖြတ်အဘို့နှင့်ရလဒ်အတည်ပြု။ အခါဓါတ်ပုံတွေကိုအများကြီးအသိအမှတ်ပြုရန်လိုအပ်ဒုတိယအချက်မှာ - ထို FineReader အတွက်ညာဘက်ကော်လံထဲမှာတစ်ချက်မှာစီမံကိန်းလုပ်ဖို့ကဆက်ပြောသည်ကြောင်းအားလုံးတွေ့မြင်ဖို့ပိုပြီးလွယ်ကူ: လျင်မြန်စွာပိုလျှံဖယ်ရှားပစ်ရန်, အပြောင်းအလဲများကိုလုပ်, etc ပြီးတော့တတိယ, စာရွက်စာတမ်းများပေါ်မှာအလွန်အရည်အသွေးညံ့ဖျင်း, Cuneiform အသိအမှတ်ပြုမှုအဖြစ်ရှုံး :. စာရွက်စာတမ်းစိတ်ထဲရောက်စေဖို့ရှိပါတယ် - အမှားတံဆိပ်ထုပုဒ်ဖြတ်ပုဒ်ရပ်, ကိုးကား, etc အုပ်ချုပ်ဖို့
ဒါကအားလုံးပါပဲ။ တဖန်သင်တို့ကစာသားအသိအမှတ်ပြုမှုများအတွက်အခမဲ့အစီအစဉ်၏အခြားဘယ်အရာကိုခံထိုက်သိ?