ကွန်ပျူတာဘာသာပြန်နည်းစနစ်များကို ကမ္ဘာပေါ်ရှိ နေရာပေါင်းများစွာတွင် ကျယ်ပြန့်စွာ အသုံးပြုနေကြသည်။ နိုင်ငံအသီးသီးရှိ တက္ကသိုလ်များ၊ ပုဂ္ဂလိက အဖွဲ့အစည်းများနှင့် အစိုးရဌာနများက ငွေကြေးအမြောက်အမြား အကုန်ကျခံ သုံးစွဲ၍ အကောင်အထည်ဖော်လျက် ရှိကြသည်။ တစ်ကိုယ်ရေသုံး အိတ်ဆောင် ဘာသာပြန်စက်ငယ်လေးများမှ စစ်မြေပြင်သုံး Smart Phone နည်းပညာများအထိ ရောက်ရှိနေပါသည်။ အမေရိကန်တို့ အာဖကန္နစ္စတန် သို့ ကျူးကျော်တိုက်ခိုက်စဉ်က အဖြစ်အပျက်တစ်ရပ်ကလည်း ဤနည်းပညာ၏ အသုံးဝင်မှုကို ပေါ်လွင်စေခဲ့သည်။ စက်တင်ဘာ ၁၁ ရက် ၂၀၀၁ အမေရိကန်တို့ အာဖကနစ္စတန်ကို တိုက်ခိုက်သိမ်းပိုက်ပြီး နောက်ပိုင်း အာရပ်ဘာသာစကားသည် အဓိကပြဿနာ ဖြစ်ခဲ့သည်။ ကန်တပ်ဖွဲ့ဝင်များနှင့်အတူ လိုက်ပါတာဝန်ထမ်းဆောင်ဖို့ စကားပြန်များခေါ်ယူခဲ့သော်လည်း စစ်ပွဲအတွင်းမို့ လိုက်ပါလိုသူ သိပ်မရှိလှ။ ခေါ်ဆောင်လာသည့် ဘာသာပြန်အတော်များများလည်း သေနတ်ဆံ၊ဗုံးဆံ ကြောက်၍ ပြန်ပြေးကြသူများနှင့်သာ ပြည့်နေသည်။ အမေရိကန်တို့ ခေါင်းချင်းရိုက်ကုန်ကြသည်။ ဘာသာပြန်တွေ မရှိလို့မဖြစ်။ နောက်ဆုံး ဒီပြဿနာက အမေရိကန် အဆင့်မြင့် ကာကွယ်ရေး သုတေသန အေဂျင်စီ (DARPA) သို့ ရောက်ရှိသွားသည်။ DARPA က အမျိုးသား စံသတ်မှတ်ချက်နှင့် နည်းပညာဆိုင်ရာ အဖွဲ့ကြီး(NIST) သို့ လူအစားထိုး အင်္ဂလိပ်-အာဖကန် ကွန်ပျူတာ ဘာသာပြန်စနစ် တစ်ရပ် အကောင်အထည် ဖော်ပေးရန် ပန်ကြားလေသည်။ သို့နှင့် ကွန်ပျူတာ ဘာသာပြန် လုပ်ငန်းစဉ်မှာ နည်းပညာနယ်ပယ်မှသည် စစ်မြေပြင်သို့ပင် ကျယ်ပြန့်စွာရောက်ရှိလာတော့သည်။
ဘာသာစကားတစ်ခုမှ အခြားဘာသာစကားတစ်ခုကို ဘာသာပြန်ဆိုရာမှာ လူဘာသာပြန်များ၏နေရာကို အစားထိုးပြီး ကွန်ပျူတာကို ဘာသာပြန်ဆိုခိုင်းခြင်းပင် ဖြစ်ပါတယ်။ လူဘာသာပြန်များကို အစားထိုးမည်ဆိုတာ့ MT က ဘာတွေကောင်းနေပါသလဲ ?
ကွန်ပျူတာ ဘာသာပြန်လုပ်ငန်းကို အကောင်အထည်ဖော်ဖို့ နည်းစနစ် မြောက်မြားစွာ ရှိပါတယ်။ အဓိက နည်းစနစ်တချို့ကတော့ အောက်ပါအတိုင်း ဖြစ်ပါတယ်။
စကားလုံးတစ်လုံးဟာ အဓိပ္ပာယ်မျိုးစုံ ရှိနေတာမျိုးဟာ ဘာသာစကားတိုင်းလိုလိုပါပဲ။ ဥပမာ Have ဆိုတဲ့စကားလုံးကို စားတယ်၊ သောက်တယ်၊ ရေချိုးတယ် အစရှိဖြင့် စာကြောင်း အနေအထားများအပေါ် မူတည်ပြီးဘာသာပြန်ဆိုနိုင်ပါတယ်။ အဲဒီတော့ ဒါတွေ့ဒါပြန် ဆိုတာမျိုး လုပ်လို့မရတော့တာ၊ စာကြောင်းရှေ့နောက်ဆက်စပ် လေ့လာရတာမျိုးတွေ လိုအပ်လာပါတယ်။
လူနာမည်၊ မြို့ရွာတိုင်းပြည်နာမည်၊ အဖွဲ့အစည်းနာမည် စသည်ဖြင့်နာမည်ပေါင်းများစွာဟာလည်း ဘာသာပြန်လုပ်ငန်းစဉ်ကို များစွာခက်ခဲစေပါတယ်။ စကားလုံးတစ်လုံးတွေ့ရုံနဲ့ နာမည်လား ၊ ရိုးရိုးအဓိပ္ပာယ်ရှိတဲ့ စကားလုံးလားဆိုတာ ခွဲခြားဖို့ ခက်ခဲတတ်ပါတယ်။ ဥပမာ "ဆိတ်ဖြူ" ဆိုတာ မြို့ရွာနာမည်လား? အဖြူရောင်ရှိတဲ့ ဆိတ်ကိုပြောတာလား? "ဖိုးဆိတ်ဖြူ" ဆိုတဲ့ ကာတွန်းဇတ်ကောင်တောင်ရှိနေပါသေးတယ်။ နောက်အခက်အခဲများကတော့
မြန်မာနိုင်ငံမှာလည်း ဤကွန်ပျူတာဘာသာပြန်စနစ် ကို ကွန်ပျူတာသုံး မြန်မာစာ စနစ်၊ စံနှင့် အသုံးချရေး လုပ်ငန်းအဖွဲ့ (Myanmar Unicode And NLP Research Center) က ၂၀၀၉ ခုနှစ်၊ ဇန်နဝါရီလ ၁ ရက် နေ့မှ စတင်၍ အကောင်အထည်ဖော်လျက်ပြီး RMBT နည်းစနစ်ကို အသုံးပြုထားသည့် ဘာသာပြန်စနစ် စမ်းသပ်အဆင့်-၁ (Beta Version-1) ကို အောက်ပါ links များတွင် အခမဲ့ စမ်းသပ်သုံးစွဲနိုင်ပါတယ်။
အထက်ပါ RBMT နည်းစနစ်ထက် ပိုမိုကောင်းမွန်သည့် ဘာသာပြန်စနစ် ထပ်မံပေါ်ထွက်လာစေရန် ရည်ရွယ်၍ လက်ရှိတွင် SMT နည်းစနစ်ကို အသုံးပြု၍ ဘာသာပြန်လုပ်ငန်းများကို ဆက်လက်အကောင်အထည်ဖော်လျက်ရှိပြီး မကြာမီ အသုံးပြုနိုင်တော့မည်ဟု မျှော်မှန်းရပါတယ်။ ထို့အပြင် ရန်ကုန်ကွန်ပျူတာတက္ကသိုလ် NLP သုတေသနဌာနမှလည်း ကွန်ပျူတာဘာသာပြန်စနစ်တစ်ရပ်ကို ၎င်းတို့၏ ဝဘ်စာမျက်နှာ
တွင် လူအများအသုံးပြုနိုင်စေရန် လွှင့်တင်ထားသည်ကို တွေ့ရှိရပါတယ်။
This article uses material from the Wikipedia မြန်မာဘာသာ article ကွန်ပျူတာဘာသာပြန်စနစ်, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). အကြောင်းအရာများကို အခြားမှတ်ချက်မရှိပါက CC BY-SA 4.0 အောက်တွင် ရရှိနိုင်ပါသည်။ Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki မြန်မာဘာသာ (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.