မာတိကာသို့ ခုန်သွားရန်

တတိုအဲဘ

ဝီကီပီးဒီးယား မှ
တတိုအဲဘ
ဝဘ်ဆိုဒ် အမျိုးအစား
Open collaborative multilingual "sentence dictionary"
ဖတ်ရှုရရှိနိုင်မှု25 languages of the interface; content in 301 languages (May 2016)
ပိုင်ဆိုင်သူTrang Ho, Allan Simon
ဖန်တီးသူTrang Ho, Allan Simon
ဝဘ်ဆိုဒ်tatoeba.org
စီးပွားရေးNo
မှတ်ပုံတင်ခြင်းOptional
လွှင့်တင်ခြင်း2006
လက်ရှိ အခြေအနေOnline; beta
အကြောင်းအရာ လိုင်စင်
Creative Commons Attribution 2.0

တတိုအဲဘ သည် နိုင်ငံခြားသားဘာသာစကားလေ့လာသူများအတွက် ရည်ရွယ်သည့် အခမဲပူးပေါင်းဆောင်ရွက်ကာ အသုံးပြုနိုင်သည့် ဥပမာစာကြောင်းများစွာကို သိမ်းဆည်းထားသည့် အွန်လိုင်းဒေတာဘေ့တစ်ခု ဖြစ်သည်။ ၎င်းအမည်သည် ဂျပန်ဘာသာစကား တတိုအဲဘ "tatoeba" (例えば)ဖြစ်လာသည်။ တတိုအဲဘဆိုသည်မှာ "ဥပမာအားဖြင့်" ဟု အဓိပ္ပာယ်ရသည်။ အခြားအွန်လိုင်းအဘိဓာန်များနှင့် မတူညီသည်မှာ တတိုအဲဘသည် စကားလုံးများပေါ်တွင် အဓိကထားကာ ပြီးပြည့်စုံသည့် ဘာသာပြန်စာကြောင်းများပေါ်တွင် အာရုံထားသည်။

ထို့အပြင် ဒေတာဘေ့၏ တည်ဆောက်ထားပုံသည် တစ်ဦးမျသည် အများဆီသို့ ပတ်သက်သည့်ပုံစံပေါ်တွင် ထားရှိသည်။ စာကြောင်းတစ်ကြောင်းနှင့်ပတ်သက်၍ ဘာသပြန်ျားစွာ ရှိသည့်သာမက ၎င်း၏ အခြားဘာသာစကားများအားလုံးသို့ ဘာသာပြန်ထားမှုကို ကြည့်ရှုနိုင်သည်။

ရည်ရွယ်ချက်[ပြင်ဆင်ရန်]

ဤတတိုအဲဘပရောဂျက်၏ ရည်ရွယ်မှာ ဘာသာပြန်နှင့် စာကြောင်းဒေတာဘေ့တစ်ခုကိ တည်ဆောက်ရန် ဖြစ်သည်။ ၎င်းကို ဘာသာစကားလေ့လာသည့် အပ်ပလီကေးရှင်းတစ်ခုအနေဖြင့် မည်သူမဆို ပါဝင်နိုင်ပြီး အသုံးပြုနိုင်မည် ဖြစ်သည်။ ပရောဂျက်သည်ဒေတာများကို ဖန်တီးနိုင်မည် ဖြစ်ပြီး၊ ပရိုဂရမ်မာများသည် အပ်ပလီကေးရှင်း၏ ကုဒ်ရေးသားမှုအပေါ်တွင်သာ အာရုံစိုက်ရန်သာ ဖြစ်သည်။ ပရောဂျက်မှ စုဆောင်းထားရှိသည့် ဒေတာများကို အခမဲ့အနေဖြင့်  Creative Commons Attribution (CC-BY)  လိုင်စင်ဖြင့် ရရှိနိုင်မည် ဖြစ်သည်။

အကြောင်းအရာ[ပြင်ဆင်ရန်]

၂၀၁၉ ခုနှစ် ဇွန်လတွင် တတိုအဲဘတွင် ဘာသာစကား ၃၃၇ မျိုးဖြင့် စာကြောင်းပေါင်း ၇၅၀၀၀၀၀ ခုကျော် ရှိခဲ့သည်။ ဘာသာစကား ၁၀ မျိုးတို့၏ စာကြောင်းသည် ပရောဂျက်တစ်ခုလုံး၏ ၇၃ ရာခိုင်နှုန်း ရှိသည်။ ဘာသာစကား ၉၈ မျိုးတို့၏ စာကြောင်းများသည်လည်း စာကြောင်းရေ ၁၀၀၀ ကျော် ရှိသည်။ ပထမတန်းဝင် ဘာသာစကား ၁၄ ခုတို့သည်လည်း တစ်ခုချင်းစီတွင် စာကြောင်းရေ ၁၀၀၀၀ ကျော် ရှိနေသည်။

တတိုအဲဘသည် လက်ရှိ Tanaka Corpus ၏ မူလဝဘ်ဆိုက်ဖြစ်သည်။ Tanaka Corpus သည် ဟယောဂိုတက္ကသိုလ်၏ ပါမောက္ခ၏ ၂၀၀၁ ခုနှစ်တွင် ပထမဆုံးထုတ်ဝေခဲ့သည့် အင်္ဂလိပ် - ဂျပန်စာကြောင်းတွဲများ ပါဝင်သည်။[၁][၂]

ဘာသာစကားအားလုံးနှင့် ပတ်သက်သည့် အချက်အလက်များကို [၁] တွင် တွေ့နိုင်သည်။

သမိုင်းကြောင်း[ပြင်ဆင်ရန်]

တတိုအဲဘကို ၂၀၀၆ ခုနှစ်တွင် Trang Ho က တီထွင်ခဲ့သည်။ သူမသည် မူလက "multilangdict"ပရောဂျက်အမည်အောက်တွင် စတင်၍ ဤပရောဂျက်ကို လွှင့်တင်ခဲ့သည်။[၃]

အသွင်အပြင်[ပြင်ဆင်ရန်]

မှတ်ပုံတင်ထားခြင်း မရှိသည့် အသုံးပြုသူများပင်လျှင် စကားလုံးမျိုးကို မည်သည့်ဘာသာစကားဖြင့်မဆို ရှာဖွေနိုင်သည်။ တတိအဲဘရှိ စာကြောင်းတစ်ခုချင်းစီတို့သည် နောက်လာမည့် ပုံစံတူဘာသာပြန်များတွက် ပြသပေးထားသည်။ တိုက်ရိုက်နှင့် တိုက်ရိုက်မဟုတ်သည့် ဘာသာပြန်ထားမှုများကိုလည်း ခွဲခြားပေးထားသည်။ စာကြောင်းများကိုလည်း အကြောင်းအရာအပေါ်မူတည်ကာ တွဲပေးထားသည်။ ၂၀၁၆ ခုနှစ် အစောပိုင်းတွင် ဘာသာစကား ၁၉ မျိုးတွင် စာကြောင်းရေ ၂၀၀၀၀၀ ကျော် ရှိခဲ့သည်။ ၎င်းတို့ကိုလည်း မတူညီသည့် အရည်အသွေးများဖြင့် အသံဖတ်နိုင်သည်။ စာကြောင်းများကို ဘာသာစကား, tag သို့မဟုတ် အသံဖြင့် ဖွင့်လှစ်နိုင်သည်။[၄]

ဒေတာဘေ့ပုံစံ[ပြင်ဆင်ရန်]

လိုင်စင်[ပြင်ဆင်ရန်]

ခွင့်ပြုမှု[ပြင်ဆင်ရန်]

အသုံးပြုမှု[ပြင်ဆင်ရန်]

အော့လိုင်းထုတ်ဝေမှု[ပြင်ဆင်ရန်]

ပြင်ပလင့်များ[ပြင်ဆင်ရန်]

ကိုးကား[ပြင်ဆင်ရန်]

  1. Tanaka CorpusEDRDG Wiki။ Electronic Dictionary Research and Development Group (3 February 2011)။ 20 March 2011 တွင် ပြန်စစ်ပြီး။
  2. Breen၊ Jim (2 March 2011)။ WWWJDIC – InformationWWWJDIC။ Monash University။ 20 March 2011 တွင် ပြန်စစ်ပြီး။
  3. Trang's dictionary projectsourceforge.net
  4. Quick Start Guide