(Zawgyi)
Unicode ဘာေၾကာင့္ သံုးသင့္သလဲ
=================================
ျမန္မာ ယူနီကုတ္ဆိုသည္မွာ ျမန္မာအကၡရာတစ္လံုးခ်င္းစီအတြက္ သီးျခားသတ္မွတ္ေပးထားေသာ တိက်သည့္ ဘံုသံုးစနစ္ (U 1000 မွ U 109F အတြင္းရွိ အကၡရာမ်ား)
Unicode ဆိုသည္မွာ နိုင္ငံနွင့္လူမ်ိုးတိုင္းတြင္ အသံုးျပုလ်က္ရွိေသာ အကၡရာစာလံုးမ်ားအတြက္
မည္သည့္ Platform တြင္ ျဖစ္ေစ
မည္သည့္ Program တြင္ ျဖစ္ေစ
မည္သည့္ ဘာသာစကား language တြင္ ျဖစ္ေစ
သီးျခားသတ္မွတ္ေပးထားသည့္ နံပါတ္မ်ားျဖစ္သည္။ Unicode ဆိုသည္မွာ ကမၻာသံုးဘာသာစကား အားလံုးမွ အကၡရာစာလံုး တစ္လံုးတိုင္းအတြက္ တိက်ေသာ နံပါတ္ တစ္လံုးတည္းသာ သတ္မွတ္ေပးေသာ ဘံုသံုးစနစ္ဟူ၍လည္း ေခၚဆိုျကသည္။
Unicode => Universal Character Encoding
Unicode Consortium ေခၚ NGO အဖြဲ့အစည္းမွ တစ္ကမၻာလံုးရွိ ဘာသာစကားမ်ားကို သိမ္းဆည္းနိုင္ရန္/စာသားမ်ားဖလွယ္နိုင္ရန္ တီထြင္ထားေသာ 16 bit character code set standard ျဖစ္သည္။ ISO (International Organization for Standardization) က ယင္းကို ISO-10646 ဟု သတ္မွတ္ေပးသည္။
Unicode ျဖင့္ ဘာသာစကားေပါင္း မ်ားစြာကို Font တခုတည္းတြင္ ထည့္သြင္းနိုင္ျပီး မည္သည့္ ကြန္ပ်ူတာစနစ္တြင္မဆို အသံုးျပုနိုင္ရမည္ျဖစ္သည္။
Computer ဆိုသည္က ကိန္းဂဏန္းမ်ားကိုသာ သိသည္ဟု ေယဘုယ်အားျဖင့္ ေျပာနိုင္သည္။ ကြန္ပ်ူတာတြင္ ဖတ္မွတ္ျခင္း၊ သိမ္းဆည္းျခင္းမ်ားကို ကိန္းဂဏန္းမ်ားျဖင့္သာ ျပုလုပ္နိုင္သည္။ ယူနီကုဒ္ကို မတီထြင္မီက ကိန္းဂဏန္းတစ္ခုကို သိရွိနိုင္ရန္အတြက္ လွ်ို့ ဝွက္ကိန္းစနစ္မ်ားစြာကို အသံုးျပုျကရသည္။ ဘာသာစကား တစ္ခုအတြက္ ျပည့္စံုလံုေလာက္ေသာ encoding စနစ္မ်ား မရွိေပ။
Myanmar Unicode ၏ သမိုင္းေျကာင္း
ASCII code ေပၚတြင္ ျမန္မာစာကို encode လုပ္၍ အသံုးျပုခဲ့ျကသည္။ အဂၤႅိပ္ Character set ယာယီ ငွားသံုးခဲ့ျကျခင္းျဖစ္သည္။ ဥပမာ- ျမန္မာစာ “က” သည္ အဂၤႅိပ္ အကၡရာ U (ASCII code point 117) ေပၚတြင္ encode လုပ္ထားျခင္းျဖစ္သည္။ သို့ေသာ္ ယူနီကုဒ္တြင္ “က” နွင့္ "u" သည္ အကၡရာတစ္ခုစီ ကြဲျပားေနသည္။ ကြန္ပ်ူတာက စံတစ္ခုကို သိလာမွသာ တစ္ကမၻာလံုး မည္သည့္ကြန္ပ်ူတာကမဆို ျမန္မာစာကို နားလည္လာပါမည္။ ကြန္ပ်ူတာက လက္ခံနိုင္သည့္ စံ ဆိုသည္မွာ ကျကီးကို U+1000 နွင့္ ခေခြးကို U + 1001 အျဖစ္ ကုတ္အေနျဖင့္ ပံုေသ သတ္မွတ္ေပးရပါလိမ့္မည္။ သတ္မွတ္ရံုသာမက တစ္ကမၻာလံုးရွိ Software Developer မ်ား သိေစရန္နွင့္ တေျပးညီအသံုးျပုနိုင္ေစရန္ သတ္မွတ္ျပီး ေျကညာထားျကရပါလိမ့္မည္။ ထိုသို့ သတ္မွတ္ေျကညာမႈ ကို ISO က စံထားျပီးသတ္မွတ္ေပးသည္။
အေျခခံ ျမန္မာ Unicode Character Code ကို 1998 ခုနွစ္တြင္ သတ္မွတ္အတည္ျပု ျပဌာန္းခဲ့ျပီးျဖစ္ပါသည္။ သို့ေသာ္ ထိုအခ်ိန္တြင္ ယူနီကုဒ္ကို လိုက္လံအေကာင္အထည္ေဖာ္ တီထြင္ေဆာင္ရြက္မည့္သူ တစ္ဦးမွ် ျမန္မာနိုင္ငံတြင္ မရွိခဲ့ေပ။ ျမန္မာစာကို ယူနီကုဒ္အျဖစ္ သတ္မွတ္ေပးခဲ့စဉ္က ယူနီကုဒ္ Consortium အဖြဲ့ျကီးတြင္ ျမန္မာစာကို ေကာင္းစြာ တတ္ကြ်မ္းသူ မရွိသည့္အျပင္ ျမန္မာနိုင္ငံတြင္လည္း Unicode related technologies မ်ားကို နားလည္သူ တစ္ဦးမွ် ထြက္ေပၚလာျခင္း မရွိေသးသျဖင့္ ယူနီကုဒ္ဆိုသည္မွာ ခ်ိုနွင့္လား ျပန္ေမးရမည့္ အခ်ိန္ျဖစ္သည္။ ေပးကားေပး၏၊ မရေသးသည့္သေဘာျဖစ္ခဲ့ပါသည္။ အျခားအခက္အခဲတစ္ခုမွာ ထိုအခ်ိန္က Unicode Character Set တြင္ ျမန္မာစကားလံုး အျပည့္အစံုမပါရွိပဲ ျမန္မာစာတြင္ မရွိေသာ စကားလံုးအခ်ို့ပါဝင္ေနခဲ့သည့္အတြက္ အေကာင္အထည္ေဖာ္သူမ်ားအတြက္ သတ္မွတ္ရန္ စံ တစ္ခုတည္း မရွိျခင္းျဖစ္ပါသည္။
1999 ခုနွစ္ ေနာက္ပိုင္းမွ 2002 ခုနွစ္အထိ ျမန္မာစာ ယူနီကုဒ္ကို သံုးစြဲနိုင္ေအာင္ လုပ္ေဆာင္ေနသူမ်ားကို ေလ့လာျကည့္ရာတြင္ Graphite enabled Padauk သည္သာ ထင္ရွားေသာ ျကိုးပမ္းမႈတစ္ခုျဖစ္သည္။ ျမန္မာယူနီကုဒ္နွင့္ ပတ္သက္၍ ပထမဆံုးေသာ ျကိုးပမ္းမႈမွာ မနၱေလးပရိုဂ်က္ျဖစ္မည္ဟု ယူဆရသည္။ ဩစေတးလ်နိုင္ငံမွ ကိုေဇာ္ေအာင္ ဦးေဆာင္၍ ကမၻာတစ္ဝွမ္းလံုးမွ ျမန္မာမ်ားစုစည္းကာ Source forge တြင္ မနၱေလးပရိုဂ်က္ [၁] ကို တည္ေထာင္၍ Opensource Myanmar Language Processing စနစ္ ျကိုးပမ္းေဆာင္ရြက္ခဲ့ေသာ္လည္း မနၱေလး ပရိုဂ်က္မွာ တစ္ဝက္တစ္ပ်က္ျဖင့္ ရပ္တန့္ေနခဲ့ ပါသည္။ ျမန္မာစာလံုးအျပည့္အစံုကို ယူနီကုဒ္ Consortium မွ တရားဝင္စံသတ္မွတ္ေပးရန္ ထိုအဖြဲ့မွျကိုးစားခဲ့ေသာ္လည္း ထိုစဉ္က ေအာင္ျမင္မႈ မရရွိခဲ့ပါ။
2002 ခုနွစ္၊ ဒီဇင္ဘာလ ေရာက္မွ ကိုေငြထြန္း က ျမေစတီ ယူနီကုဒ္ စနစ္ကို တီထြင္နိုင္ခဲ့ျပီး 2003 ခုနွစ္၊ ဇန္နဝါရီလတြင္ etrademyanmar.com ၌ ပထမဦးဆံုး စတင္ အသံုးျပုနိုင္ခဲ့သည္။ ကိုေငြထြန္းသည္ ျမေစတီယူနီကုဒ္ကို ရန္ကုန္ျမို့ရွိ စာခ်ုပ္စာတမ္းမ်ား မွတ္ပံုတင္ရံုးတြင္ ကုန္အမွတ္တံဆိပ္ မွတ္ပံုတင္ျပီး တရားဝင္သံုးစြဲခဲ့ေျကာင္း သိရွိရသည္။
2002 ခုနွစ္တြင္ ျမန္မာနိုင္ငံ၌ အတည္မျပုနိုင္ေသးသည့္ ယူနီကုဒ္စနစ္ကို ျမန္မာနိုင္ငံ ကြန္ပ်ူတာအသင္းခ်ုပ္မွ တာဝန္ယူ လုပ္ေဆာင္ျကရန္ ဝိုင္းဝန္း တိုက္တြန္းျကပါသည္။ ယူနီကုဒ္စနစ္ကိ နိုင္ငံေတာ္စံတစ္ခုအေနျဖင့္ အသံုးျပုနိုင္ေရးအတြက္ လုပ္ငန္းစတင္ရန္ ဘ႑ဍာေရးအေထာက္အပံ့မ်ား စတင္ရွာေဖြခဲ့ျကသည္။ နိုင္ငံေတာ္အျကီးအကဲမ်ားသည္ ျမန္မာ့စံယူနီကုဒ္ျဖစ္ေျမာက္ေရးအတြက္ က်ပ္သိန္း ၅၀ ကို စတင္ေထာက္ပံ့ေပးခဲ့ပါသည္။ ဤသို့ျဖင့္ Myanmar Unicode and NLP Research Centre ကို ျမန္မာနိုင္ငံ ကြန္ပ်ူတာ သင္းခ်ုပ္ျကီး၏ အစီအမံျဖင့္ ဖြဲ့စည္းနိုင္ခဲ့သည္။ ထို့ေျကာင့္ NLP အဖြဲ့ျကီးသည္ 2002 ခုနွစ္မွစတင္ျပီး နိုင္ငံေတာ္အတြက္ ယူနီကုဒ္တာဝန္မ်ားကို အခ်ိန္ျပည့္ တာဝန္ယူ လုပ္ေဆာင္ခဲ့သည္ ဟု ဆိုနိုင္သည္။
ကြန္ပ်ူတာသံုး ျမန္မာစာစနစ္ အေကာင္အထည္ေဖာ္ျခင္းအဖြဲ့ (Myanmar Unicode and NLP Research Centre)
ျမန္မာစာစနစ္အေကာင္အထည္ေဖာ္ျခင္းအဖြဲ့ကို NLP ဟုလည္း ေခၚျကသည္။ NLP ဆိုသည္မွာ Natural Language Processing ကို ေခၚဆိုျခင္းျဖစ္သည္။ NLP အဖြဲ့ျကီးသည္ NGO (non-government organization) တစ္ခု ျဖစ္သလို NPO (non-profit organization) အဖြဲ့လည္း ျဖစ္သည္။ ကိုယ္က်ိုးမဖက္ အမ်ားအက်ိုးသက္သက္ သို့မဟုတ္ နိုင္ငံေတာ္အက်ိုးအတြက္ သက္သက္ ေဆာင္ရြက္ေနသည့္ အဖြဲ့ျကီးဟူ၍လည္း ဆိုနိုင္ေပသည္။
NLP ကို 2003 ခုနွစ္၊ နိုဝင္ဘာလ ၂၇ ရက္ေန့တြင္ စတင္ဖြဲ့စည္းနိုင္ခဲ့ျပီး အဖြဲ့ဝင္ 17 ဦးျဖင့္ အေကာင္အထည္ေဖာ္နိုင္ခဲ့သည္။ 2003 ခုနွစ္ နိုဝင္ဘာလမွစျပီး Pentium IV Server ကြန္ပ်ူတာတစ္လံုးတပ္ဆင္ကာ ျမန္မာနိုင္ငံကြန္ပ်ူတာအသင္းခ်ုပ္ ရွိ Incubation Center တြင္ ျမန္မာယူနီကုဒ္စနစ္ကို စတင္လုပ္ေဆာင္ခဲ့ျကသည္။
NLP အဖြဲ့တြင္ ျမန္မာစာစနစ္ကို အေကာင္အထည္ေဖာ္နိုင္ရန္အတြက္ အဖြဲ့၏ျကီးျကပ္မႈေအာက္တြင္ အခ်ိန္ျပည့္ ပရိုဂရမ္မာ (၃) ဦး၊ ျမန္မာစာ မဟာဝိဇၨာဘြဲ့ရ (၃) ဦး၊ ျမန္မာစာ မဟာဝိဇၨာတန္းတက္ေရာက္ေနသူ (၂)ဦးတို့နွင့္ ခန့္ထားျပီး စတင္လုပ္ေဆာင္ခဲ့ျကသည္။
ျမန္မာတစ္မ်ိုးသားလံုးအသံုးျပုရန္ စံအျဖစ္လုပ္ေဆာင္ျကရသည္ျဖစ္ေသာေျကာင့္ ျမန္မာယူနီကုဒ္ျဖစ္ေျမာက္ေရးအဖြဲ့တြင္ နည္းပညာအရေရာ၊ ျမန္မာစာစနစ္ဆိုင္ရာအတြက္ပါ ျမန္မာစာအဖြဲ့မွ တတ္ကြ်မ္းသူ ပညာရွင္မ်ားနွင့္ ဖြဲ့စည္းထားခဲ့ပါသည္။ ျမန္မာစာအဖြဲ့မွ ညွြန္ျကားေရးမႉးခ်ုပ္ ဦးစံလြင္၊ ျမန္မာစာအဖြဲ့ဝင္ ဦးထြန္းတင့္ ၊ သမိုင္းအဖြဲ့ဝင္ ဦးေသာ္ေကာင္းတို့ ပါဝင္ျကသည္။ ကြန္ပ်ူတာနည္းပညာအတြက္ ပညာရွင္မ်ားျဖစ္ေသာ ဦးသိန္းထြဋ္၊ ဦးေဇာ္ထြဋ္၊ ဦးေငြထြန္း၊ ဦးေဝလင္းေက်ာ္ တို့က စိတ္ေရာကိုယ္ပါ ယေန့တိုင္ အကူအညီေပး ေဆာင္ရြက္လ်က္ ရွိျကသည္။ အတြင္းေရးမႉးမွာ ေဒါက္တာ ေဒၚျမင့္ျမင့္သန္း ျဖစ္သည္။
(Unicode)
မြန်မာအက္ခရာတစ်လုံးချင်းစီအတွက် သီးခြားသတ်မှတ်ပေးထားသော တိကျသည့် ဘုံသုံးစနစ် (U 1000 မှ U 109F အတွင်းရှိ အက္ခရာများ)
This article is titled in another language/script, because there is no suitable name in Myanmar language yet.
Unicode ဆိုသည်မှာ နိုင်ငံနှင့်လူမျိုးတိုင်းတွင် အသုံးပြုလျက်ရှိသော အက္ခရာစာလုံးများအတွက်
မည်သည့် Platform တွင် ဖြစ်စေ
မည်သည့် Program တွင် ဖြစ်စေ
မည်သည့် ဘာသာစကား language တွင် ဖြစ်စေ
သီးခြားသတ်မှတ်ပေးထားသည့် နံပါတ်များဖြစ်သည်။ Unicode ဆိုသည်မှာ ကမ္ဘာသုံးဘာသာစကား အားလုံးမှ အက္ခရာစာလုံး တစ်လုံးတိုင်းအတွက် တိကျသော နံပါတ် တစ်လုံးတည်းသာ သတ်မှတ်ပေးသော ဘုံသုံးစနစ်ဟူ၍လည်း ခေါ်ဆိုကြသည်။
Unicode => Universal Character Encoding
Unicode Consortium ခေါ် NGO အဖွဲ့အစည်းမှ တစ်ကမ္ဘာလုံးရှိ ဘာသာစကားများကို သိမ်းဆည်းနိုင်ရန်/စာသားများဖလှယ်နိုင်ရန် တီထွင်ထားသော 16 bit character code set standard ဖြစ်သည်။ ISO (International Organization for Standardization) က ယင်းကို ISO-10646 ဟု သတ်မှတ်ပေးသည်။
Unicode ဖြင့် ဘာသာစကားပေါင်း များစွာကို Font တခုတည်းတွင် ထည့်သွင်းနိုင်ပြီး မည်သည့် ကွန်ပျူတာစနစ်တွင်မဆို အသုံးပြုနိုင်ရမည်ဖြစ်သည်။
Computer ဆိုသည်က ကိန်းဂဏန်းများကိုသာ သိသည်ဟု ယေဘုယျအားဖြင့် ပြောနိုင်သည်။ ကွန်ပျူတာတွင် ဖတ်မှတ်ခြင်း၊ သိမ်းဆည်းခြင်းများကို ကိန်းဂဏန်းများဖြင့်သာ ပြုလုပ်နိုင်သည်။ ယူနီကုဒ်ကို မတီထွင်မီက ကိန်းဂဏန်းတစ်ခုကို သိရှိနိုင်ရန်အတွက် လျှို့ ဝှက်ကိန်းစနစ်များစွာကို အသုံးပြုကြရသည်။ ဘာသာစကား တစ်ခုအတွက် ပြည့်စုံလုံလောက်သော encoding စနစ်များ မရှိပေ။
Myanmar Unicode ၏ သမိုင်းကြောင်း
ASCII code ပေါ်တွင် မြန်မာစာကို encode လုပ်၍ အသုံးပြုခဲ့ကြသည်။ အင်္ဂလိပ် Character set ယာယီ ငှားသုံးခဲ့ကြခြင်းဖြစ်သည်။ ဥပမာ- မြန်မာစာ “က” သည် အင်္ဂလိပ် အက္ခရာ U (ASCII code point 117) ပေါ်တွင် encode လုပ်ထားခြင်းဖြစ်သည်။ သို့သော် ယူနီကုဒ်တွင် “က” နှင့် "u" သည် အက္ခရာတစ်ခုစီ ကွဲပြားနေသည်။ ကွန်ပျူတာက စံတစ်ခုကို သိလာမှသာ တစ်ကမ္ဘာလုံး မည်သည့်ကွန်ပျူတာကမဆို မြန်မာစာကို နားလည်လာပါမည်။ ကွန်ပျူတာက လက်ခံနိုင်သည့် စံ ဆိုသည်မှာ ကကြီးကို U+1000 နှင့် ခခွေးကို U + 1001 အဖြစ် ကုတ်အနေဖြင့် ပုံသေ သတ်မှတ်ပေးရပါလိမ့်မည်။ သတ်မှတ်ရုံသာမက တစ်ကမ္ဘာလုံးရှိ Software Developer များ သိစေရန င့် တပြေးညီအသုံးပြုနိုင်စေရန် သတ်မှတ်ပြီး ကြေညာထားကြရပါလိမ့်မည်။ ထိုသို့ သတ်မှတ်ကြေညာမှု ကို ISO က စံထားပြီးသတ်မှတ်ပေးသည်။
အခြေခံ မြန်မာ Unicode Character Code ကို 1998 ခုနှစ်တွင် သတ်မှတ်အတည်ပြု ပြဌာန်းခဲ့ပြီးဖြစ်ပါသည်။ သို့သော် ထိုအချိန်တွင် ယူနီကုဒ်ကို လိုက်လံအကောင်အထည်ဖော် တီထွင်ဆောင်ရွက်မည့်သူ တစ်ဦးမျှ မြန်မာနိုင်ငံတွင် မရှိခဲ့ပေ။ မြန်မာစာကို ယူနီကုဒ်အဖြစ် သတ်မှတ်ပေးခဲ့စဉ်က ယူနီကုဒ် Consortium အဖွဲ့ကြီးတွင် မြန်မာစာကို ကောင်းစွာ တတ်ကျွမ်းသူ မရှိသည့်အပြင် မြန်မာနိုင်ငံတွင်လည်း Unicode related technologies များကို နားလည်သူ တစ်ဦးမျှ ထွက်ပေါ်လာခြင်း မရှိသေးသဖြင့် ယူနီကုဒ်ဆိုသည်မှာ ချိုနှင့်လား ပြန်မေးရမည့် အချိန်ဖြစ်သည်။ ပေးကားပေး၏၊ မရသေးသည့်သဘောဖြစ်ခဲ့ပါသည်။ အခြားအခက်အခဲတစ်ခုမှာ ထိုအချိန်က Unicode Character Set တွင် မြန်မာစကားလုံး အပြည့်အစုံမပါရှိပဲ မြန်မာစာတွင် မရှိသော စကားလုံးအချို့ပါဝင်နေခဲ့သည့်အတွက် အကောင်အထည်ဖော်သူများအတွက် သတ်မှတ်ရန် စံ တစ်ခုတည်း မရှိခြင်းဖြစ်ပါသည်။
1999 ခုနှစ် နောက်ပိုင်းမှ 2002 ခုနှစ်အထိ မြန်မာစာ ယူနီကုဒ်ကို သုံးစွဲနိုင်အောင် လုပ်ဆောင်နေသူများကို လေ့လာကြည့်ရာတွင် Graphite enabled Padauk သည်သာ ထင်ရှားသော ကြိုးပမ်းမှုတစ်ခုဖြစ်သည်။ မြန်မာယူနီကုဒ်နှင့် ပတ်သက်၍ ပထမဆုံးသော ကြိုးပမ်းမှုမှာ မန္တလေးပရိုဂျက်ဖြစ်မည်ဟု ယူဆရသည်။ ဩစတေးလျနိုင်ငံမှ ကိုဇော်အောင် ဦးဆောင်၍ ကမ္ဘာတစ်ဝှမ်းလုံးမှ မြန်မာများစုစည်းကာ Source forge တွင် မန္တလေးပရိုဂျက် [၁] ကို တည်ထောင်၍ Opensource Myanmar Language Processing စနစ် ကြိုးပမ်းဆောင်ရွက်ခဲ့သော်လည်း မန္တလေး ပရိုဂျက်မှာ တစ်ဝက်တစ်ပျက်ဖြင့် ရပ်တန့်နေခဲ့ ပါသည်။ မြန်မာစာလုံးအပြည့်အစုံကို ယူနီကုဒ် Consortium မှ တရားဝင်စံသတ်မှတ်ပေးရန် ထိုအဖွဲ့မှကြိုးစားခဲ့သော်လည်း ထိုစဉ်က အောင်မြင်မှု မရရှိခဲ့ပါ။
2002 ခုနှစ်၊ ဒီဇင်ဘာလ ရောက်မှ ကိုငွေထွန်း က မြစေတီ ယူနီကုဒ် စနစ်ကို တီထွင်နိုင်ခဲ့ပြီး 2003 ခုနှစ်၊ ဇန်နဝါရီလတွင် etrademyanmar.com ၌ ပထမဦးဆုံး စတင် အသုံးပြုနိုင်ခဲ့သည်။ ကိုငွေထွန်းသည် မြစေတီယူနီကုဒ်ကို ရန်ကုန်မြို့ရှိ စာချုပ်စာတမ်းများ မှတ်ပုံတင်ရုံးတွင် ကုန်အမှတ်တံဆိပ် မှတ်ပုံတင်ပြီး တရားဝင်သုံးစွဲခဲ့ကြောင်း သိရှိရသည်။
2002 ခုနှစ်တွင် မြန်မာနိုင်ငံ၌ အတည်မပြုနိုင်သေးသည့် ယူနီကုဒ်စနစ်ကို မြန်မာနိုင်ငံ ကွန်ပျူတာအသင်းချုပ်မှ တာဝန်ယူ လုပ်ဆောင်ကြရန် ဝိုင်းဝန်း တိုက်တွန်းကြပါသည်။ ယူနီကုဒ်စနစ်ကို နိုင်ငံတော်စံတစ်ခုအနေဖြင့် အသုံးပြုနိုင်ရေးအတွက် လုပ်ငန်းစတင်ရန် ဘဏ္ဍာရေးအထောက်အပံ့များ စတင်ရှာဖွေခဲ့ကြသည်။ နိုင်ငံတော်အကြီးအကဲများသည် မြန်မာ့စံယူနီကုဒ်ဖြစ်မြောက်ရေးအတွက် ကျပ်သိန်း ၅၀ ကို စတင်ထောက်ပံ့ပေးခဲ့ပါသည်။ ဤသို့ဖြင့် Myanmar Unicode and NLP Research Centre ကို မြန်မာနိုင်ငံ ကွန်ပျူတာ သင်းချုပ်ကြီး၏ အစီအမံဖြင့် ဖွဲ့စည်းနိုင်ခဲ့သည်။ ထို့ကြောင့် NLP အဖွဲ့ကြီးသည် 2002 ခုနှစ်မှစတင်ပြီး နိုင်ငံတော်အတွက် ယူနီကုဒ်တာဝန်များကို အချိန်ပြည့် တာဝန်ယူ လုပ်ဆောင်ခဲ့သည် ဟု ဆိုနိုင်သည်။
ကွန်ပျူတာသုံး မြန်မာစာစနစ် အကောင်အထည်ဖော်ခြင်းအဖွဲ့ (Myanmar Unicode and NLP Research Centre)
မြန်မာစာစနစ်အကောင်အထည်ဖော်ခြင်းအဖွဲ့ကို NLP ဟုလည်း ခေါ်ကြသည်။ NLP ဆိုသည်မှာ Natural Language Processing ကို ခေါ်ဆိုခြင်းဖြစ်သည်။ NLP အဖွဲ့ကြီးသည် NGO (non-government organization) တစ်ခု ဖြစ်သလို NPO (non-profit organization) အဖွဲ့လည်း ဖြစ်သည်။ ကိုယ်ကျိုးမဖက် အများအကျိုးသက်သက် သို့မဟုတ် နိုင်ငံတော်အကျိုးအတွက် သက်သက် ဆောင်ရွက်နေသည့် အဖွဲ့ကြီးဟူ၍လည်း ဆိုနိုင်ပေသည်။
NLP ကို 2003 ခုနှစ်၊ နိုဝင်ဘာလ ၂၇ ရက်နေ့တွင် စတင်ဖွဲ့စည်းနိုင်ခဲ့ပြီး အဖွဲ့ဝင် 17 ဦးဖြင့် အကောင်အထည်ဖော်နိုင်ခဲ့သည်။ 2003 ခုနှစ် နိုဝင်ဘာလမှစပြီး Pentium IV Server ကွန်ပျူတာတစ်လုံးတပ်ဆင်ကာ မြန်မာနိုင်ငံကွန်ပျူတာအသင်းချုပ် ရှိ Incubation Center တွင် မြန်မာယူနီကုဒ်စနစ်ကို စတင်လုပ်ဆောင်ခဲ့ကြသည်။
NLP အဖွဲ့တွင် မြန်မာစာစနစ်ကို အကောင်အထည်ဖော်နိုင်ရန်အတွက် အဖွဲ့၏ကြီးကြပ်မှုအောက်တွင် အချိန်ပြည့် ပရိုဂရမ်မာ (၃) ဦး၊ မြန်မာစာ မဟာဝိဇ္ဇာဘွဲ့ရ (၃) ဦး၊ မြန်မာစာ မဟာဝိဇ္ဇာတန်းတက်ရောက်နေသူ (၂)ဦးတို့နှင့် ခန့်ထားပြီး စတင်လုပ်ဆောင်ခဲ့ကြသည်။
မြန်မာတစ်မျိုးသားလုံးအသုံးပြုရန် စံအဖြစ်လုပ်ဆောင်ကြရသည်ဖြစ်သောကြောင့် မြန်မာယူနီကုဒ်ဖြစ်မြောက်ရေးအဖွဲ့တွင် နည်းပညာအရရော၊ မြန်မာစာစနစ်ဆိုင်ရာအတွက်ပါ မြန်မာစာအဖွဲ့မှ တတ်ကျွမ်းသူ ပညာရှင်များနှင့် ဖွဲ့စည်းထားခဲ့ပါသည်။ မြန်မာစာအဖွဲ့မှ ညွှန်ကြားရေးမှူးချုပ် ဦးစံလွင်၊ မြန်မာစာအဖွဲ့ဝင် ဦးထွန်းတင့် ၊ သမိုင်းအဖွဲ့ဝင် ဦးသော်ကောင်းတို့ ပါဝင်ကြသည်။ ကွန်ပျူတာနည်းပညာအတွက် ပညာရှင်များဖြစ်သော ဦးသိန်းထွဋ်၊ ဦးဇော်ထွဋ်၊ ဦးငွေထွန်း၊ ဦးဝေလင်းကျော် တို့က စိတ်ရောကိုယ်ပါ ယနေ့တိုင် အကူအညီပေး ဆောင်ရွက ဦးဝေလင်းကျော် တို့က စိတ်ရောကိုယ်ပါ ယနေ့တိုင် အကူအညီပေး ဆောင်ရွက်လျက် ရှိကြသည်။ အတွင်းရေးမှူးမှာ ဒေါက်တာ ဒေါ်မြင့်မြင့်သန်း ဖြစ်သည်။
#Togethermobile (Amarapura ု