ମେସିନ ଟ୍ରାନ୍ସଲେସନ ବା ଯାନ୍ତ୍ରିକ ଅନୁବାଦ ହେଉଛି କମ୍ପ୍ୟୁଟେସନାଲ ଲିଙ୍ଗୁଇସ୍ଟିକସର ଏକ ବିଭାଗ ଯେଉଁଠାରେ ସଫ୍ଟୱେରଦ୍ୱାରା ଗୋଟିଏ ଭାଷାରୁ ଆଉ ଅନ୍ଯ ଏକ ଭାଷାକୁ ଅନୁବାଦ କରାଯାଇଥାଏ ।
ସାଧାରଣ କ୍ଷେତ୍ରରେ ମେସିନ ଟ୍ରାନ୍ସଲେସନ କେବଳ ଶବ୍ଦଗୁଡ଼ିକୁ ଗୋଟିଏ ଭାଷାରୁ ଅନ୍ୟ ଏକ ଭାଷାରେ ପ୍ରତିସ୍ଥାପନା କରିଥାଏ । କିନ୍ତୁ କେବଳ ଏତିକିରେ ଅନୁବାଦ ଠିକ ଭାବରେ ହୁଏ ନାହିଁ , କାରଣ ଗନ୍ତବ୍ୟ ଭାଷାର ଶବ୍ଦର ପାଖାପାଖି ଶବ୍ଦଗୁଡ଼ିକୁନେଇ ହେଉଥିବା ସମୂହର ଅର୍ଥକୁ ମଧ୍ୟ ଦେଖିବାକୁ ପଡ଼ିଥାଏ । ଅନୁବାଦ ସମୟରେ ମୂଳ ଏବଂ ଗନ୍ତବ୍ୟ ଭାଷା ମଧ୍ୟରେ ଥିବା ପାର୍ଥକ୍ୟଗୁଡ଼ିକୁ ଷ୍ଟାଟିଷ୍ଟିକାଲ/ପରିସଂଖ୍ୟାନ ତଥା ନ୍ୟୂରାଲ ମେସିନ ଟ୍ରାନ୍ସଲେସନଦ୍ୱାରା ଅନେକ ମାତ୍ରାରେ କମ କରାଯାଇପାରୁଛି ।
ଯାନ୍ତ୍ରିକ ଅନୁବାଦର ଉତ୍ପନ୍ନ ପାଖାପାଖି ୧୭ତମ ଶତକରେ ହୋଇଥିଲା । ୧୬୨୯ ମସିହାରେ ରେନେ ଦେଶକର୍ଟେସ (René Descartes) ଗୋଟିଏ ସାଧାରଣ ଭାଷା ପ୍ରସ୍ତାବ ଦେଇଥିଲେ ଯାହାଦ୍ୱାରା ବିଭିନ୍ନ ଭାଷାଭାଷୀ ଲୋକେ ଗୋଟିଏ ଚିହ୍ନ ଉପଯୋଗ କରିପାରିବେ । ୨୦୧୬ରେ ଗୁଗଲ ନ୍ୟୂରାଲ ମେସିନ ଟ୍ରାନ୍ସଲେସନ ଉପଯୋଗ କରିବା ଆରମ୍ଭ କରିଥିଲା ।
ମନୁଷ୍ୟକୃତ ଅନୁବାଦକୁ ଦୁଇଟି ଉପ-ପ୍ରକ୍ରିୟାରେ କୁହାଯାଇପାରେ:
ମେସିନ ଟ୍ରାନ୍ସଲେସନ ହେଉଛି ଏକ କଠିନ ପ୍ରକ୍ରିୟା। ବିଭିନ୍ନ ପ୍ରକାରର ଉପାୟ ସମୟାନୁକ୍ରମେ ଆବିଷ୍କାର ହୋଇଛି। ସେଗୁଡ଼ିକ ହେଲା:
ନିଉରାଲ ମେସିନ ଟ୍ରାନ୍ସଲେସନକୁ "ଡିପ୍ ଲର୍ଣିଂ" ର ଏକ ଉପାୟ ହିସାବରେ ଧରାଯାଇପାରେ। ନିଉରାଲ ମେସିନ ଟ୍ରାନ୍ସଲେସନ ଏ କିଛି ବର୍ଷ ଭିତରେ ଅନେକ ଉନ୍ନତି କରିଛି ୲ Google ଷ୍ଟାଟିଷ୍ଟିକାଲ ମେସିନ ଟ୍ରାନ୍ସଲେସନ ଅପେକ୍ଷା ଏବେ ନିଉରାଲ ମେସିନ ଟ୍ରାନ୍ସଲେସନ ବ୍ୟବହାର କରୁଥିବାର ଘୋଷଣା କରିଛି । ୨୦୧୮ରେ Microsoft ଟିମ WMT-2017ରେ ମଣିଷମାନଙ୍କ ସ୍ତରରେ ଅନୁବାଦ କରି ଏକ ମାଇଲ ଖୁଣ୍ଟି ତିଆରି କରିଛି ।
ସମୁର୍ଣ୍ଣ ସ୍ୱୟଂଚାଳିତ ଭାବରେ 'ଗଠନ ଅନିୟନ୍ତ୍ରିତ ଲେଖା' (Unstructured text) ର ଉଚ୍ଚମାନର ମେସିନ ଅନୁବାଦ କଲାଭଳି ଯଦିଓ କୌଣସି ବ୍ୟବସ୍ଥା ନାହିଁ, ଅନେକ ବ୍ୟବସ୍ଥା ଅଛି ଯାହା ଅପାତତଃ ଭଲ ଫଳ ଦେଉଛି। ଯଦି ଅନୁବାଦକୁ କୌଣସି ନିର୍ଦ୍ଦିଷ୍ଟ ବିଷୟବସ୍ତୁ ଉପରେ ନିର୍ଦ୍ଧାରିତ କରାଯାଏ ଓ ନିୟନ୍ତ୍ରଣ କରାଯାଏ ତାହେଲେ ମେସିନ ଅନୁବାଦର ମାନର ଉତ୍ତରୋତ୍ତର ଉନ୍ନତି କରାଯାଇପାରେ।
ସେମାନଙ୍କର ଲିମିଟେସନ ଥିଲେ ମଧ୍ଯ MT ପ୍ରୋଗ୍ରାମ ସବୁ ପୃଥିବୀ ସାରା ବ୍ୟବହୃତ ହେଉଛି। ସମ୍ଭବତଃ ଇଉରୋପିଆନ କମିସନ ହେଉଛି ଏହାର ବୃହତ୍ତମ ସାଙ୍ଗଠନିକ ବ୍ୟବହାରକ। ଯେମିତିକି ଗୋଠେନ୍ବେର୍ଗ ବିଶ୍ୱବିଦ୍ୟାଳୟଦ୍ୱାରା ସଂଯୋଜିତ MOLTO ପ୍ରକଳ୍ପ, EUର ଅନେକତମ ଭାଷାମାନଙ୍କୁ ନେଇ ଏକ ବିଶ୍ୱାସଯୋଗ୍ୟ ଅନୁବାଦ ଯନ୍ତ୍ର ପ୍ରକଳ୍ପ ପାଇଁ ୨.୩୫୫ ନିୟୁତ ୟୁରୋରୁ ଅଧିକ ଅନୁଦାନ ପାଇଥିଲା। MT ବ୍ୟବସ୍ଥାମାନଙ୍କର ତତ୍ପର ଉନ୍ନତି, ମନୁଷ୍ୟକୃତ ଅନୁବାଦ ପାଇଁ ଅନୁଦାନ କମ କରିବାରୁ ଆସିଲା, ଯାହାଦ୍ୱାରା EU ଯନ୍ତ୍ର ଚାଳିତ ଅନୁବାଦ ଉପରେ ଅଧିକ ନିର୍ଭର କରିବା ଆରମ୍ଭ କଲା। ଇଉରୋପିଆନ କମିସନ ISA ଯୋଜନା ଦ୍ୱାରା MT@EC ତିଆରି କରିବା ପାଇଁ ୩.୦୭୨ ନିୟୁତ ୟୁରୋ ଦାନ କରିଥିଲା; MT@EC ଏକ ଗଣତିଭିତ୍ତିକ ଯନ୍ତ୍ର ଅନୁବାଦ ପ୍ରକଳ୍ପ ଯାହା EUର ପ୍ରଶାସନିକ ଆବଶ୍ୟକତା ପାଇଁ ତିଆରି ହୋଇଥିଲା ଓ ଏକ ନିୟମଭିତ୍ତିକ ଅନୁବାଦକ ବ୍ୟବସ୍ଥାକୁ ସ୍ଥାନାନ୍ତର କରିଥିଲା।
2005ରେ ଗୁଗୁଲ ଏକ ନିଜସ୍ୱ ଗଣତିଭିତ୍ତିକ ଯନ୍ତ୍ର ଅନୁବାଦ ବ୍ୟବସ୍ଥା ବ୍ୟବହାର କରି ପ୍ରତିଶୃତିଜନକ ଫଳାଫଳର ଦାବି କଲା। National Institute for Standards and Technology.[48]ଦ୍ୱାରା ହୋଇଥିବା ପରୀକ୍ଷାରେ ଗୁଗୁଲର ଏ "ଗଣତିଭିତ୍ତିକ ଯନ୍ତ୍ର ଅନୁବାଦ (Statistical Machine Translation)" ଇଂଜିନ, "ଗୁଗୁଲ ଲାଙ୍ଗୁଏଜ ଟୁଲ"ରେ ବ୍ୟବହାର ହୋଇଥିବା, ଆରବୀ <-> ଇଂରାଜି ଓ ଚାଇନିଜ <-> ଇଂରାଜି ଅନୁବାଦରେ ପାଖାପାଖି ୦.୪୨୮୧ ସ୍କୋର କରି ପ୍ରଥମ ହେଲା, ଗ୍ରୀଷ୍ମ ୨୦୦୬ ରେ IBM ୦.୩୯୫୪ ସ୍କୋର (BLEU ସ୍କୋର) କରି ଦ୍ୱିତୀୟ ହୋଇଥିଲା।
ଏବେକାର ଆତଙ୍କବାଦ ଉପରେ ହେଉଥିବା ଫୋକସ ପାଇଁ , ଆମେରିକାର ସେନା ଓ ସୁରକ୍ଷା ବଳ, ପ୍ରାକୃତିକ ଭାଷା ପ୍ରଯୁକ୍ତିବିଜ୍ଞାନରେ ଅନେକ ସମ୍ବଳ ଖର୍ଚ କରୁଛି। DARPAର ଇନ୍ଫରମେସନ ପ୍ରୋସେସିଂ ଟେକ୍ନୋଲୋଜି ଅଫିସ TIDES ଓ Babylon ଅନୁବାଦକ ଭଳି ଯୋଜନା ଚାଳନା କରୁଛି।
ଏ କିଛିଦିନରେ ଇଣ୍ଟରନେଟରେ ସୋସିଆଲ ନେଟୱର୍କିଙ୍ଗର ଅଭୂତପୂର୍ବ ଆବିର୍ଭାବ ଯାନ୍ତ୍ରିକ ଅନୁବାଦ ସଫ୍ଟୱେର ପ୍ରୟୋଗର ଅନ୍ଯ ଏକ ନୂଆ ସ୍ତର ତିଆରି କରିଛି, ଫେସବୁକରେ ବା ସ୍କାଇପ, ଗୁଗୁଲ ଟକ, MSN ମେସେଞ୍ଜର ଭଳି କ୍ଷଣିକ ଖବର (ଇନ୍ସଟାଣ୍ଟ ମେସେଜିଙ୍ଗ) କ୍ଲାଏଣ୍ଟ ସବୁ, ବ୍ୟବହାରକ ମାନଙ୍କପାଇଁ ଯାନ୍ତ୍ରିକ ଅନୁବାଦ ପରସ୍ପର ସହ ଅଲଗା ଭାଷାରେ କଥାବାର୍ତ୍ତା କରିବାର ସୁବିଧା ତିଆରି କରିଛି। ଅନେକ ମୋବାଇଲ ପାଇଁ ବ୍ୟବହାରିକ ଯାନ୍ତ୍ରିକ ଅନୁବାଦ ବାହାରି ସାରିଛି, ସୁବିଧା ପାଇଁ ମୋବାଇଲ ସବୁକୁ ମୋବାଇଲ ଅନୁବାଦ ଉପକରଣ ଭାବରେ ବ୍ୟବହାର କରାଯାଉଛି ଯାହା ଅଲଗା ଭାଷା କହୁଥିବା ଏବଂ ସାଥିରେ ବ୍ୟବସାୟ କରୁଥିବା ବ୍ୟବସାୟୀ ମାନଙ୍କ ସୁବିଧାରେ ଆସୁଛି, ନୂଆ ବିଦେଶୀ ଭାଷା ଶିଖୁଥିବା ଛାତ୍ରଛାତ୍ରୀ ମାନଙ୍କ କାମରେବି ଆସୁଛି, ଆଉ ନୂଆ ବିଦେଶ ଯାତ୍ରୀଙ୍କୁ ମଣିଷ ଅନୁବାଦକଙ୍କ ବିନା ଭ୍ରମଣ କରିବାରେ ସାହାଯ୍ୟ କରିପାରିଛି।
୧୯୬୬ରେ ଯୁକ୍ତରାଷ୍ଟ୍ର ଆମେରିକାରେ ତିଆରି ହୋଇଥିବା ଅଟୋମେଟେଡ଼ ଲାଙ୍ଗୁଏଜ ପ୍ରୋସେସିଂ ଆଡ଼ଭାଇଜରି କମିଟୀ ଦ୍ୱାରା ମନୁଷ୍ୟ ଅନୁବାଦର ଅଯୋଗ୍ୟ ପ୍ରତିଦ୍ୱନ୍ଦୀ, ଭାବରେ ବର୍ଣ୍ଣିତ ହୋଇ ମଧ୍ୟ, ଯାନ୍ତ୍ରିକ ଅନୁବାଦର ମାନକ ମୂଲ୍ୟରେ ଏବେ ଏତେ ଉନ୍ନତି ହୋଇଛି ଯେ, ଅନଲାଇନ ସହଯୋଗ ଓ ଭେଷଜବିଦ୍ୟା ଆଦି କ୍ଷେତ୍ରରେ ଏହାର ବ୍ୟବହାର ଖୋଜା ଚାଲିଛି। ମଣିଷ ଅନୁବାଦକମାନଙ୍କ ଅନୁପସ୍ଥିତିରେ, ମେଡିକାଲ ସେଟିଙ୍ଗରେ, ଏ ଟେକ୍ନୋଲୋଜିର ଉପଯୋଗିତା ଅନ୍ୟ ଏକ ଅନୁସନ୍ଧାନର କ୍ଷେତ୍ର, କିନ୍ତୁ ମେଡିକାଲ ଡାଇଗ୍ନୋସିଶରେ ସମ୍ପୁର୍ଣ୍ଣ ସଠିକ ଅନୁବାଦର ଆବଶ୍ୟକତା ପାଇଁ ଅସୁବିଧା ସୃଷ୍ଟି ହେଉଛି।
ମେସିନ ଟ୍ରାନ୍ସଲେସନରେ ବ୍ୟବସ୍ଥା ମାନଙ୍କର ମୂଲ୍ୟାଙ୍କନ, ବିଭିନ୍ନ ଗୁଣାବଳୀ ଉପରେ ନିର୍ଭର କରେ। ଅନୁବାଦର ବ୍ୟବହାର ସ୍ଥାନ, ମେସିନ ଟ୍ରାନ୍ସଲେସନ ସଫ୍ଟୱେରର ମୂଳ ପ୍ରକୃତି ଓ ଅନୁବାଦ ପ୍ରକ୍ରିୟାର ପ୍ରକୃତି ସେ ଗୁଣାବଳୀରେ ଅନ୍ତର୍ଭୁକ୍ତ।
ବିଭିନ୍ନ ଯୋଜନା ସବୁ ବିଭିନ୍ନ ଉଦ୍ଦେଶ୍ୟରେ ଭଲ କାମ କରିପାରେ, ଯେମିତିକି, ଗଣତିଭିତ୍ତିକ ଯନ୍ତ୍ରାନୁବାଦ(SMT) (ଷ୍ଟାଟିଷ୍ଟିକାଲ ମେସିନ ଟ୍ରାନ୍ସଲେସନ), ଉଦାହରଣ ଭିତ୍ତିକ ଯନ୍ତ୍ରାନୁବାଦ (EBMT) ଅପେକ୍ଷା ସାଧାରଣତଃ ଭଲ କାମ କରେ, କିନ୍ତୁ ଅନୁସନ୍ଧାନୀମାନେ ଦେଖିଛନ୍ତି ଯେ ଇଂରାଜୀରୁ ଫ୍ରେଞ୍ଚକୁ ଅନୁବାଦ କଲାବେଳେ EBMT ଭଲ କାମ କରୁଛି । ସମାନ କଥା ଟେକ୍ନିକାଲ ଡକୁମେଣ୍ଟରେ ମଧ୍ୟ ସତ୍ୟ, ସେମାନଙ୍କ ବିଧିବଦ୍ଧ ପ୍ରକୃତି ପାଇଁ, SMT ବ୍ୟବହାର କରି ଅଧିକ ସହଜରେ ଅନୁବାଦ କରିହେବ।
କିନ୍ତୁ କିଛି ବ୍ୟବହାରରେ, ଯେମିତିକି ନିୟନ୍ତ୍ରିତ ଭାଷାରେ ଲିଖିତ, ବସ୍ତୁ (ପ୍ରଡକ୍ଟ) ବର୍ଣ୍ଣନାକୁ, ଅଭିଧାନ ଭିତ୍ତିକ ଯନ୍ତ୍ରାନୁବାଦ (dictionary-based machine-translation), କେବଳ ମାନ ନିରୀକ୍ଷଣ ବିଭାଗକୁ ଛାଡ଼ିଦେଲେ, ମଣିଷର କୌଣସି ନିର୍ଦ୍ଦେଶ ନଥାଇ ସଠିକ ଅନୁବାଦ କରିପାରିଛି।
ଯନ୍ତ୍ରାନୁବାଦର ମାନ ମୂଲ୍ୟାଙ୍କନ ପାଇଁ ବିଭିନ୍ନ ଉପାୟ ଅଛି। ସବୁଠୁଁ ପୁରୁଣା ହେଉଛି ମଣିଷ ବିଚାରକ ମାନଙ୍କଦ୍ୱାରା ଅନୁବାଦର ମାନ ନିରୂପଣ କରିବା। ଯଦିଓ ମନୁଷ୍ୟ ବିଚାର ଭିତ୍ତିକ ମୂଲ୍ୟାଙ୍କନ ସମୟସାପେକ୍ଷ, ତଥାପି ଏପର୍ଯ୍ୟନ୍ତ ତାହାହିଁ ବିଭିନ୍ନ ଅନୁବାଦ ବ୍ୟବସ୍ଥା ମାନଙ୍କର (ଯେମିତିକି RBMT ଓ SMT) ତୁଳନା ପାଇଁ ସବୁଠୁ ବିଶ୍ୱାସଜନକ ଉପାୟ୲ ସ୍ୱୟଂଚାଳିତ ମୂଲ୍ୟାଙ୍କନ କରିବାର ଉପାୟ ସବୁ ହେଉଛି BLEU , NIST, METEOR ଓ LEPOR
This article uses material from the Wikipedia ଓଡ଼ିଆ article ମେସିନ ଟ୍ରାନ୍ସଲେସନ, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). ଦର୍ଶାଯାଇନଥିଲେ ସମସ୍ତ ବିଷୟବସ୍ତୁ CC BY-SA 4.0 ରେ ଉପଲବ୍ଧ । Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki ଓଡ଼ିଆ (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.