တတိုအဲဘ
ဝဘ်ဆိုဒ် အမျိုးအစား | Open collaborative multilingual "sentence dictionary" |
---|---|
ဖတ်ရှုရရှိနိုင်မှု | 25 languages of the interface; content in 301 languages (May 2016) |
ပိုင်ဆိုင်သူ | Trang Ho, Allan Simon |
ဖန်တီးသူ | Trang Ho, Allan Simon |
ဝဘ်ဆိုဒ် | tatoeba.org |
စီးပွားရေး | No |
မှတ်ပုံတင်ခြင်း | Optional |
လွှင့်တင်ခြင်း | 2006 |
လက်ရှိ အခြေအနေ | Online; beta |
အကြောင်းအရာ လိုင်စင် | Creative Commons Attribution 2.0 |
တတိုအဲဘ သည် နိုင်ငံခြားသားဘာသာစကားလေ့လာသူများအတွက် ရည်ရွယ်သည့် အခမဲပူးပေါင်းဆောင်ရွက်ကာ အသုံးပြုနိုင်သည့် ဥပမာစာကြောင်းများစွာကို သိမ်းဆည်းထားသည့် အွန်လိုင်းဒေတာဘေ့တစ်ခု ဖြစ်သည်။ ၎င်းအမည်သည် ဂျပန်ဘာသာစကား တတိုအဲဘ "tatoeba" (例えば)ဖြစ်လာသည်။ တတိုအဲဘဆိုသည်မှာ "ဥပမာအားဖြင့်" ဟု အဓိပ္ပာယ်ရသည်။ အခြားအွန်လိုင်းအဘိဓာန်များနှင့် မတူညီသည်မှာ တတိုအဲဘသည် စကားလုံးများပေါ်တွင် အဓိကထားကာ ပြီးပြည့်စုံသည့် ဘာသာပြန်စာကြောင်းများပေါ်တွင် အာရုံထားသည်။
ထို့အပြင် ဒေတာဘေ့၏ တည်ဆောက်ထားပုံသည် တစ်ဦးမျသည် အများဆီသို့ ပတ်သက်သည့်ပုံစံပေါ်တွင် ထားရှိသည်။ စာကြောင်းတစ်ကြောင်းနှင့်ပတ်သက်၍ ဘာသပြန်ျားစွာ ရှိသည့်သာမက ၎င်း၏ အခြားဘာသာစကားများအားလုံးသို့ ဘာသာပြန်ထားမှုကို ကြည့်ရှုနိုင်သည်။
ရည်ရွယ်ချက်
[ပြင်ဆင်ရန်]ဤတတိုအဲဘပရောဂျက်၏ ရည်ရွယ်မှာ ဘာသာပြန်နှင့် စာကြောင်းဒေတာဘေ့တစ်ခုကိ တည်ဆောက်ရန် ဖြစ်သည်။ ၎င်းကို ဘာသာစကားလေ့လာသည့် အပ်ပလီကေးရှင်းတစ်ခုအနေဖြင့် မည်သူမဆို ပါဝင်နိုင်ပြီး အသုံးပြုနိုင်မည် ဖြစ်သည်။ ပရောဂျက်သည်ဒေတာများကို ဖန်တီးနိုင်မည် ဖြစ်ပြီး၊ ပရိုဂရမ်မာများသည် အပ်ပလီကေးရှင်း၏ ကုဒ်ရေးသားမှုအပေါ်တွင်သာ အာရုံစိုက်ရန်သာ ဖြစ်သည်။ ပရောဂျက်မှ စုဆောင်းထားရှိသည့် ဒေတာများကို အခမဲ့အနေဖြင့် Creative Commons Attribution (CC-BY) လိုင်စင်ဖြင့် ရရှိနိုင်မည် ဖြစ်သည်။
အကြောင်းအရာ
[ပြင်ဆင်ရန်]၂၀၁၉ ခုနှစ် ဇွန်လတွင် တတိုအဲဘတွင် ဘာသာစကား ၃၃၇ မျိုးဖြင့် စာကြောင်းပေါင်း ၇၅၀၀၀၀၀ ခုကျော် ရှိခဲ့သည်။ ဘာသာစကား ၁၀ မျိုးတို့၏ စာကြောင်းသည် ပရောဂျက်တစ်ခုလုံး၏ ၇၃ ရာခိုင်နှုန်း ရှိသည်။ ဘာသာစကား ၉၈ မျိုးတို့၏ စာကြောင်းများသည်လည်း စာကြောင်းရေ ၁၀၀၀ ကျော် ရှိသည်။ ပထမတန်းဝင် ဘာသာစကား ၁၄ ခုတို့သည်လည်း တစ်ခုချင်းစီတွင် စာကြောင်းရေ ၁၀၀၀၀ ကျော် ရှိနေသည်။
တတိုအဲဘသည် လက်ရှိ Tanaka Corpus ၏ မူလဝဘ်ဆိုက်ဖြစ်သည်။ Tanaka Corpus သည် ဟယောဂိုတက္ကသိုလ်၏ ပါမောက္ခ၏ ၂၀၀၁ ခုနှစ်တွင် ပထမဆုံးထုတ်ဝေခဲ့သည့် အင်္ဂလိပ် - ဂျပန်စာကြောင်းတွဲများ ပါဝင်သည်။[၁][၂]
ဘာသာစကားအားလုံးနှင့် ပတ်သက်သည့် အချက်အလက်များကို [၁] တွင် တွေ့နိုင်သည်။
သမိုင်းကြောင်း
[ပြင်ဆင်ရန်]တတိုအဲဘကို ၂၀၀၆ ခုနှစ်တွင် Trang Ho က တီထွင်ခဲ့သည်။ သူမသည် မူလက "multilangdict"ပရောဂျက်အမည်အောက်တွင် စတင်၍ ဤပရောဂျက်ကို လွှင့်တင်ခဲ့သည်။[၃]
အသွင်အပြင်
[ပြင်ဆင်ရန်]မှတ်ပုံတင်ထားခြင်း မရှိသည့် အသုံးပြုသူများပင်လျှင် စကားလုံးမျိုးကို မည်သည့်ဘာသာစကားဖြင့်မဆို ရှာဖွေနိုင်သည်။ တတိအဲဘရှိ စာကြောင်းတစ်ခုချင်းစီတို့သည် နောက်လာမည့် ပုံစံတူဘာသာပြန်များတွက် ပြသပေးထားသည်။ တိုက်ရိုက်နှင့် တိုက်ရိုက်မဟုတ်သည့် ဘာသာပြန်ထားမှုများကိုလည်း ခွဲခြားပေးထားသည်။ စာကြောင်းများကိုလည်း အကြောင်းအရာအပေါ်မူတည်ကာ တွဲပေးထားသည်။ ၂၀၁၆ ခုနှစ် အစောပိုင်းတွင် ဘာသာစကား ၁၉ မျိုးတွင် စာကြောင်းရေ ၂၀၀၀၀၀ ကျော် ရှိခဲ့သည်။ ၎င်းတို့ကိုလည်း မတူညီသည့် အရည်အသွေးများဖြင့် အသံဖတ်နိုင်သည်။ စာကြောင်းများကို ဘာသာစကား, tag သို့မဟုတ် အသံဖြင့် ဖွင့်လှစ်နိုင်သည်။[၄]
ဒေတာဘေ့ပုံစံ
[ပြင်ဆင်ရန်]လိုင်စင်
[ပြင်ဆင်ရန်]ခွင့်ပြုမှု
[ပြင်ဆင်ရန်]အသုံးပြုမှု
[ပြင်ဆင်ရန်]အော့လိုင်းထုတ်ဝေမှု
[ပြင်ဆင်ရန်]ပြင်ပလင့်များ
[ပြင်ဆင်ရန်]ကိုးကား
[ပြင်ဆင်ရန်]- ↑ Tanaka Corpus။ EDRDG Wiki။ Electronic Dictionary Research and Development Group (3 February 2011)။ 20 March 2011 တွင် ပြန်စစ်ပြီး။
- ↑ Breen၊ Jim (2 March 2011)။ WWWJDIC – Information။ WWWJDIC။ Monash University။ 20 March 2011 တွင် ပြန်စစ်ပြီး။
- ↑ Trang's dictionary project။ sourceforge.net။
- ↑ Quick Start Guide။