မြန်မာဝေါဟာရသရုပ်ခွဲကျမ်း

ဝီကီပီးဒီးယား မှ

မြန်မာဝေါဟာရသရုပ်ခွဲကျမ်း (Myanmar Lexicon) - ဝေါဟာရသရုပ်ခွဲကျမ်းဆိုသည်မှာ အဘိဓာန်ထက်ပိုမိုကျယ်ပြန့်ပြီး ဘာသာစကားတစ်ခု၏ ဝေါဟာရများကို ဘာသာဗေဒနည်းအရ အသေးစိတ် ခွဲခြမ်းစိတ်ဖြာထားခြင်း ဖြစ်သည်။ ၎င်းတွင် ဘာသာစကား၏ အလွန်အသုံးဝင်သော အရင်းအမြစ်များကို ထိန်းသိမ်းပေးထားနိုင်ခြင်း၊ စကားလုံး တစ်လုံးချင်းစီကို သာမက ယင်းစကားလုံးနှင့် ဆက်စပ်လျက် ရှိသော စကားလုံးများကို လေ့လာနိုင်ခြင်း စသည့် အဘိဓာန်တစ်ခုထက် ပိုမိုလေးနက်သော အသုံးဝင်မှုများ ပါဝင်သည်။ ထို့ကြောင့် ဝေါဟာရသရုပ်ခွဲကျမ်းသည် နိုင်ငံတစ်နိုင်ငံ၊ ဘာသာစကားတစ်ခုအတွက် မရှိမဖြစ် လိုအပ်သော အရင်းအမြစ်တစ်ခု ဖြစ်သည်။

မြန်မာဝေါဟာရသရုပ်ခွဲကျမ်းသည် မြန်မာအဘိဓာန်ထက်ပိုမိုကျယ်ပြန့်သည်။ ဘာသာစကားတခုအတွက် အသုံးဝင်သည့် ဝေါဟာရအနက်များအား အခြေခံကျကျ ထိန်းသိမ်းပေးထားနိုင်သည့် ကျမ်းလည်းဖြစ်သည်။ တနည်းအားဖြင့် စကားလုံး တစ်လုံးချင်းစီကိုသာမက ယင်းစကားလုံးနှင့် ဆက်စပ်နေသောအခြား ဝေါဟာရများကိုပါ လေ့လာနိုင်သည်။ ထို့အပြင် ဝေါဟာရတစ်လုံးချင်းကို ခွဲခြားစိတ်ဖြား၍ ထိုဝေါဟာရ၏ အသေးစိတ်ရည်ညွှန်းချက်များကိုလည်း ဖော်ပြသည်။ ထို့ကြောင့် ဝေါဟာရသရုပ်ခွဲကျမ်းသည် ဒေသခံလူမျိုးများတွင် ရှိသော ဘာသာစကားအား ထိန်းသိမ်းပေးနိုင်သည့် အချက်အလက်အစုအဝေးတစ်ခုဖြစ်သည်။

ယခင်ကာလက ဝေါဟာရသရုပ်ခွဲခြင်း လုပ်ငန်းများကို စာရွက်များ အဆင့်ဆင့်ပြုစု ထိန်းသိမ်းခြင်းဖြင့် လုပ်ကိုင်ခဲ့သည်။ ယခုကာလတွင် မြန်မာဝေါဟာရသရုပ်ခွဲကျမ်းအား နိုင်ငံတကာအဆင့်မှီ ကျမ်းတစ်စောင်အဖြစ် ထုတ်လုပ်နိုင်ရန် ကြိုးပမ်းလျက် ရှိသည်။ ယင်းသို့ ကြိုးပမ်းရသည့် လုပ်ငန်းများကို ကွန်ပျူတာသုံး မြန်မာစာစနစ် အကောင်အထည်ဖော်ခြင်းအဖွဲ့‎(Myanmar Natural Language Processing Research Lab) လုပ်ဆောင်လျက် ရှိသည်။ ထိုသို့ လုပ်ဆောင်ခဲ့သည့် အကျိုးရလဒ်အနေဖြင့် မြန်မာဝေါဟာရသရုပ်ခွဲကျမ်း၊ ဗားရှင်း ၁.၀ ကို ၂၀၀၇ ခုနှစ်တွင် ထုတ်ဝေနိုင်ခဲ့သည်။

မြန်မာဘာသာစကားသည် တရုပ်-တိဗက်မျိုးနွယ်ခွဲဖြစ်ပြီး မြန်မာအက္ခရာများမှာ အိန္ဒိယမှ ဆင်းသက်လာကြောင်း လေ့လာမှုများကဆိုသည်။ မြစေတီကျောက်စာ သည် မြန်မာတို့၏ ပထမဆုံးသော ကျောက်စာဖြစ်သည်ဟု ဆိုကြသည်။ ထိုကာလမှ စတင်၍ တွက်ချက်လျှင် မြန်မာဘာသာစကား၏ သက်တမ်းမှာ နှစ်တစ်ထောင် ကာလကို ဖြတ်သန်းခဲ့ပြီး ဖြစ်သည်။ ယနေ့ကာလတွင် မြန်မာနိုင်ငံ၌ တိုင်းရင်းသား မျိုးနွယ်စု တစ်ရာကျော်နေထိုင်လျက် ရှိသည်။ ယင်းလူမျိုးတို့သည် သက်ဆိုင်ရာ လူမျိုးစု ဘာသာစကားများကို အသုံးပြုသကဲ့သို့ ဗမာဘာသာစကားကိုလည်း အသုံးပြုကြသည်။ ထို့အပြင် ဗမာဘာသာစကားသည် နိုင်ငံတော်ဘာသာစကား၊ ရုံးသုံးဘာသာစကားအဖြစ် သတ်မှတ်ခြင်း ခံထားရသည်။ ထို့ကြောင့် မြန်မာဝေါဟာရသရုပ်ခွဲခြမ်းကို စာရွက်ပေါင်းများစွာဖြင့် ထိန်းသိမ်းခဲ့ကြသည်။ နိုင်ငံတကာ၌ ပြုလုပ်လေ့ရှိသည့် အီလက်ထရောနစ်စနစ်ဖြင့် ထိန်းသိမ်းသည့် လုပ်ငန်းများကို ၂၀၀၇ ခုနှစ် အစောပိုင်း ကာလများက ပြုလုပ်ခဲ့ခြင်း မရှိကြောင်း တွေ့ရှိရသည်။

အဘိဓာန် (Dictionary) နှင့် သရုပ်ခွဲကျမ်း(lexicon) ၏ ကွဲခြားချက်[ပြင်ဆင်ရန်]

အဘိဓာန်ဆိုသည်မှာ - ဘာသာစကားတစ်ခု၌ ရှိသော ခေါင်းစီးစကားလုံးများ၏ အဓိပ္ပာယ်ဖွင့်ဆိုချက် များစွာ ပါဝင်နေသော အကိုးအကားတစ်ခု ဖြစ်သည်။ ယေဘူယျအားဖြင့် အဘိဓာန်တွင် တည်ပုဒ်စကားလုံး (head word) တစ်ခုစီအတွက် အဓိပ္ပာယ်ဖွင့်ဆိုချက်၊ အသံထွက်ပုံ၊ ဝါစင်္ဂများ၊ နမူနာဝါကျ၊ အသုံးပြုပုံများနှင့် တစ်ခါတစ်ရံ တွင် ပြန်လည်ရည်ညွှန်းချက်များ ပါဝင်တတ်သည်။

အင်္ဂလိပ်-မြန်မာ အဘိဓာန်၊ မြန်မာ-မြန်မာ အဘိဓာန် စသည်ဖြင့် မြန်မာပြည်တွင် အီလက်ထရောနစ်စနစ်များဖြင့် စာအုပ်များ၊ ဆော့လ်ဝဲများ ထုတ်လုပ်ဖြန့်ချိခဲ့သည်မှာ နှစ်ပေါင်း အတော်ကြာပြီ ဖြစ်သော်လည်း မြန်မာ ဝေါဟာရသရုပ်ခွဲကျမ်း (Myanmar Lexicon) ကို လေ့လာသိရှိသူမှာ အလွန်နည်းပါးခဲ့ကြောင်း တွေ့ရှိရသည်။
ဝေါဟာရသရုပ်ခွဲကျမ်း- ဝေါဟာရသရုပ်ခွဲကျမ်းဆိုသည်မှာ အဘိဓာန်ထက်ပိုမိုကျယ်ပြန့်ပြီး ဘာသာစကားတစ်ခု၏ ဝေါဟာရများကို ဘာသာဗေဒနည်းအရ အသေးစိတ် ခွဲခြမ်းစိတ်ဖြာထားခြင်း ဖြစ်သည်။ ၎င်းတွင် ဘာသာစကား၏ အလွန်အသုံးဝင်သော အရင်းအမြစ်များကို ထိန်းသိမ်းပေးထားနိုင်ခြင်း၊ စကားလုံး တစ်လုံးချင်းစီကို သာမက ယင်းစကားလုံးနှင့် ဆက်စပ်လျက် ရှိသော စကားလုံးများကို လေ့လာနိုင်ခြင်း စသည့် အဘိဓာန်တစ်ခုထက် ပိုမိုလေးနက်သော အသုံးဝင်မှုများ ပါဝင်သည်။

မြန်မာ ဝေါဟာရသရုပ်ခွဲကျမ်း၏ အသေးစိပ်အင်္ဂါရပ်များ[ပြင်ဆင်ရန်]

မြန်မာ ဝေါဟာရသရုပ်ခွဲကျမ်း၏အောက်ပါ အင်္ဂါရပ်များကြောင့် ဘာသာစကား လေ့လာသူများသာမက၊ ကွန်ပျူတာသုံးဘာသာစကားစနစ်၏ လုပ်ငန်းစဉ်များတွင်ပါ တွင်တွင်ကျယ်ကျယ် အသုံးပြုနိုင်ခြင်း ဖြစ်သည်။

  • (က) မြန်မာဝေါဟာရတစ်လုံး၏ အင်္ဂလိပ်အနက်ဖွင့်၊ မြန်မာအနက်ဖွင့်များ တစ်ပြိုင်နက် လေ့လာနိုင်ခြင်း၊
  • (ခ) အင်္ဂလိပ်-မြန်မာ၊ မြန်မာ-အင်္ဂလိပ် ဘာသာပြန်ဆိုရာတွင် အထောက်အကူပြုနိုင်ခြင်း၊
  • (ဂ) မြန်မာဝေါဟာရတို့၏ အသံထွက်ပုံ၊
  • (ဃ) ဝေါဟာရတို့၏ ရင်းမြစ်နှင့် ပြောင်းထုံး၊
  • (င) မြန်မာဝေါဟာရတို့ ပေါင်းစပ်ဖွဲ့စည်းပုံ၊
  • (စ) မြန်မာစကားလုံးများရှိ နှစ်ချက်သင့် ဝေါဟာရများ၊
  • (ဆ) မြန်မာစကားပရိယာယ်များ၊
  • (ဈ) ဝေါဟာရတို့၏ ဝါစင်္ဂများ၊
  • (ည) မျိုးကွဲအလိုက်အသေးစိတ် ဝါစင်္ဂပိုင်းဆိုင်ရာ အခေါ်အဝေါ်များ၊
  • (ဋ) မြန်မာစကား၏ အမျိုးအစား၊
  • (ဌ) ဝေါဟာရတစ်လုံး၏ အသုံးတွင်ဒေသ၊
  • (ဍ) မြန်မာဝေါဟာရတစ်လုံးသုံးစွဲမှု တွင်ကျယ်ချိန်၊ တွင်ကျယ်ရာနေရာ၊
  • (ဎ) ဆက်နွယ်သဖြင့် ပြန်လှန်ညွှန်းပြုနိုင်သော ဝေါဟာရများ၊
  • (ဏ) ဝေါဟာရတို့ကို သုံးစွဲပုံသာဓကအမျိုးမျိုး

စသည်တို့ ဖြစ်ကြသည်။