অন্যযুগ/


গুগল অনুবাদকত অসমীয়া ভাৰ্চুৱেল কী-ব’ৰ্ড : এক চিন্তনীয় দিশ

  ভাস্কৰজ্যোতি শৰ্মা

গুণদীপ চেতিয়া

 

       ভাষা-প্ৰযুক্তিৰ জগতখনত প্ৰতিটো দিশেই অতি সূক্ষ্মভাৱে বিচাৰ-বিশ্লেষণ কৰি নাচালে বহু সময়ত আমাৰ চকুৰ সন্মুখতে বহু আঁসোৱাহ অথবা সমস্যা ৰৈ যায় আৰু ইতিহাস সাক্ষী যে এই আঁসোৱাহ অথবা সমস্যাসমূহ আৰম্ভণিতেই সমাধানৰ ব্যৱস্থা নকৰিলে আৰু এই বিষয়ত সচেতন নহলে ভাষাটোৰ ক্ষেত্ৰত যথেষ্ট ক্ষতি হোৱাৰ আশঙ্কা থাকে৷ এই প্ৰসংগতে কব বিচৰা হৈছে যে, সদ্যচৰ্চিত গুগল অনুবাদকত অসমীয়া ভাষাৰ অন্তৰ্ভুক্তিয়ে আমাক যথেষ্ট আনন্দিত কৰিছে যদিও এই বিষয়ত আমাৰ কৰণীয় এতিয়াও বহু বাকী আছে৷ গুগল অনুবাদকত প্ৰদান কৰা তথ্যৰ শুদ্ধতাৰ দিশত থকা দায়িত্ব আৰু কৰ্তব্যৰ বিষয়ে ইতিমধ্যে বহু চৰ্চা হৈছে, কিন্তু প্ৰকৃততে এই কামবোৰনো কেনে ধৰণে কৰিব পৰা যায় আৰু কেনে ধৰণে কৰা উচিত সেই বিষয়ে বিশেষ চৰ্চা আৰু বিচাৰ-বিশ্লেষণ কৰাৰ উপৰি আমাৰ কিছু ব্যৱহাৰিক দায়িত্বও আছে৷ কিন্তু গুগল অনুবাদকৰ এই প্ৰক্ৰিয়াটোত যদি কিবা কাৰিকৰী আঁসোৱাহ ৰৈ যায়, যিবোৰ আঁসোৱাহে ভাষাটোৰ প্ৰসাৰ আৰু প্ৰতিষ্ঠাৰ ক্ষেত্ৰত ভৱিষ্যতে জটিল সমস্যাৰ সৃষ্টি কৰাৰ আশঙ্কা থাকে সেইবোৰ দিশত আমি অধিক গুৰুত্ব দিয়া প্ৰয়োজন৷ কাৰণ ইউনিকত অসমীয়া লিপিৰ স্বকীয়তা প্ৰতিষ্ঠাৰ বাবে চলি থকা যুঁজখনে আমাক বহুত শিকাইছে, আৰু ভৱিষ্যতেও বহু শিকাব৷ এই সমস্যাটো ক্ৰমে জটিলৰ পৰা জটিলতৰ অৱস্থাৰ ফাললৈ গতি কৰি থকা কথাটো এই ক্ষেত্ৰখনত অহৰহ লাগি থকা ব্যক্তিসকলে ভালদৰেই উপলব্ধি কৰি আহিছে৷ গতিকে গুগল অনুবাদকত অসমীয়া ভাষা প্ৰদান কৰাৰ ক্ষেত্ৰতো তেনে দিশবোৰ উলাই কৰিবলগীয়া নহয়৷ আমি এই গুগল অনুবাদকৰ কাৰ্যপ্ৰণালী আৰু ইয়াত উপলব্ধ ব্যৱস্থাসমূহৰ ভাষাগত আৰু কাৰিকৰী দিশসমূহৰ পৰীক্ষা-নিৰীক্ষা কৰি থকা সময়তে তেনে এক গুৰুতৰ বুলি অনুভৱ কৰা আৰু হয়তো বহুতৰে চকুত নপৰা বিষয়েই ইয়াত প্ৰকাশ কৰিবলৈ যত্ন কৰিছোঁ৷

       গুগল অনুবাদকত গুগলৰ তৰফৰ পৰা এখন ভাৰ্চুৱেল কী-বৰ্ডৰ ব্যৱস্থা কৰিছে যাতে অসমীয়াৰপৰা বেলেগ ভাষালৈ অনুবাদ কৰোঁতে আন বাহিৰা কী-বৰ্ড (External Key-Board)-ৰ ব্যৱহাৰ নকৰাকৈ অসমীয়া শব্দ বা বাক্য লিখিব পৰা যায়৷ এই কী-বৰ্ডখন পৰীক্ষা কৰি থকাৰ সময়ত এটা বৰ চিন্তনীয় কথা আমাৰ দৃষ্টিগাচৰ হল৷ ইয়াত যিখন ভাৰ্চুৱেল কী-বৰ্ড সংযুক্ত কৰি দিয়া আছে, সেইখন প্ৰকৃততে বাংলা ফনেটিক কী-বৰ্ডহে৷ আমি অসমীয়া ভাষাৰ শব্দ, বাক্য অনুবাদৰ বাবে এইখন ভাৰ্চুৱেল কী-বৰ্ড ব্যৱহাৰ কৰিলে তাৰদ্বাৰা বাংলা ভাষাটোহে লিখা যায়৷ অথচ অনুবাদকৰ লিখিবলগীয়া স্থানৰ ওপৰৰ ফালে বাছনি কৰি থোৱা ভাষাটো অসমীয়া বুলিয়েই লিখা থাকে৷ কিন্তু আচৰিত কথা এই যে, সেই বিশেষ স্থানত অসমীয়া ভাষাত শব্দ বা বাক্যটো লিখাৰ পাছত তলৰ ফালে ‘Translate from : Bengali’ বুলিহে প্ৰতিফলিত হয়৷ ইয়াৰ অৰ্থ এইটোৱেই যে এই কী-বৰ্ডখনেৰে নামত অসমীয়া লিখা হয় যদিও, সেই তথ্য গুগল অনুবাদকে স্বয়ংক্ৰিয়ভাৱে বেংগলী বুলিহে চিনাক্ত কৰে৷ ইয়াৰ উপৰিও উল্লেখযোগ্য কথাটো হ, এই কী-বৰ্ডখনেৰে অসমীয়া আৰু আখৰ দুটা লিখিব পৰা কোনো ব্যৱস্থা নাই৷ মন কৰিবলগীয়া যে এই কী-বৰ্ডখনেৰে যেতিয়া বাংলা ‘র’ যুক্ত সংযুক্ত আখৰ লিখিবলৈ যাওঁ (যিহেতু অসমীয়া কী-বৰ্ডখনত নায়েই), তেতিয়া বৰ্ণ দুটা সংযুক্ত হোৱাৰ পাছত সেইটো অসমীয়া শব্দৰ দৰেই দেখা যায় যদিও (যেনে- তর + = তৰ্ক, + রহণ = গ্ৰহণ ইত্যাদি, এই ব্যাখ্যাৰ তথ্য হিচাপে ‘Screenshot’ সংলগ্ন কৰি দিয়া হৈছে) তাত কিন্তু ইউনিকডে প্ৰদান কৰা বেংগলী ‘র’ ৰ কডটোহে সংযুক্ত হৈ থাকে৷ ফলত দেখাত সেইটো অসমীয়া শব্দ যেন লাগিলেও কিন্তু কাৰিকৰীভাৱে সেই শব্দবোৰ বাংলা ভাষাৰ শব্দ বুলিয়েই চিনাক্ত হৈ গৈ থাকিব৷

       এই ধৰণৰ সমস্যা এটা আমি দেখিছিলোঁ ২০১০-১১ চনতেই৷ তেতিয়াও অভ্ৰ ফনেটিক কী-বৰ্ডখনেৰে লিখাৰ সময়তো এই সমস্যাটোৱেই দেখা দিছিল, অৰ্থাৎ অসমীয়া ’-ৰ ঠাইত বাংলা ‘র’ আৰু ইয়াৰ ইউনিকড মানৰ ব্যৱহাৰ হৈছিল৷ ইয়াৰ ফলত সেই সময়ৰ পৰাই বহু অসমীয়া সমলত আমি নেদেখাকৈয়ে বাংলা ‘র’ সোমাই থকাৰ বাবে এতিয়াও ইণ্টাৰনেটৰ বহু অসমীয়া সমল বাংলা হিচাপেই চিনাক্তকৰণ হৈ থকাৰ সম্পূৰ্ণ আশঙ্কা আছে৷ সেই একে ধৰণৰ সমস্যাৰ মুখামুখি আজিও হবলগীয়া হোৱাটো আমাৰ বাবে অতি চিন্তনীয় বিষয়৷ প্ৰসংগক্ৰমে এই কথাও উল্লেখ কৰা প্ৰয়োজন যে, গুগল অনুবাদকত বাহিৰা কী-বৰ্ড ব্যৱহাৰ কৰিও অসমীয়া শব্দ বা বাক্য অন্তৰ্ভুক্ত তথা অনুবাদ কৰিব পাৰি৷ সেয়েহে বহুতে হয়তো বিষয়টো সাধাৰণভাৱে লৈ এই বুলিও মন্তব্য কৰিব পাৰে যে, ভাৰ্চুৱেল কী-বৰ্ডখন যদি বাংলা হৈ আছে, তেন্তে তাক ব্যৱহাৰ নকৰি বাহিৰা কী-বৰ্ড ব্যৱহাৰ কৰিলেই হয়চোন৷ কিন্তু প্ৰকৃততে সমস্যাটো সেই ধৰণে উলাই কৰিব পৰা বিধৰ নহয়৷ এই প্ৰসংগত আমাৰ প্ৰশ্ন হ, যদি গুগলে দিয়া ভাৰ্চুৱেল কী-বৰ্ডখনেৰে অসমীয়া লিখিবই নোৱাৰি, তেন্তে সেইখন অসমীয়াৰ বাবে কি যুক্তিত তাত অন্তৰ্ভুক্ত কৰা হৈছে? আনকি ইয়াত কেৱল অন্তৰ্ভুক্ত কৰাই নহয় অসমীয়া ভাষাত লিখাৰ পাছত ‘Translate from: Bengali’ হিচাপে প্ৰতিফলিত হৈ উঠা বিষয়টো কাৰিকৰীভাৱেই হওক বা ভাষাৰ দিশৰ পৰাই হওক, কোনো এটা ক্ষেত্ৰতেই মানি লব পৰা নাযায়৷ বিষয়টো অতি গুৰুত্বসহকাৰে লৈ এই নিবন্ধৰ লেখকদ্বয়ৰ দ্বাৰা ইতিমধ্যে গুগল ইণ্ডিয়াৰ বিশেষ শাখাত যোৱা ২৪-০৫-২০২২ তাৰিখে তথ্যসহকাৰে লিখিত আপত্তি জনোৱা হৈছে আৰু অনলাইন ফিডবেকোদিয়া হৈছে৷ কিন্তু এনে গুৰুত্বপূৰ্ণ বিষয়বোৰত অসমৰ বিভিন্ন পৰ্যায়ৰ পৰা প্ৰতিক্ৰিয়া প্ৰকাশ কৰাটো অত্যন্ত প্ৰয়োজন৷ অন্যথা পুৰণি বেমাৰ নিৰাময় কৰাত যি জটিলতাৰ সৃষ্টি হয় আৰু কেতিয়াবা কেতিয়াবা তেনে সমস্যা সমাধান সম্ভৱ হৈ নুঠিবও পাৰে, তেনে ধৰণে এই সমস্যাটোৱেও অতি গুৰুতৰ অথবা সমাধান কৰিব নোৱৰা সমস্যাৰ সৃষ্টি কৰিব পাৰে বুলিলেও বঢ়াই কোৱা নহয়৷ এই সন্দেহ হোৱাৰ কাৰণ হ, যথা সময়ত আমি কোনো ধৰণৰ প্ৰতিক্ৰিয়া নেদেখুউৱা বা একো ব্যৱস্থা নোলোৱা বাবেই অসমীয়া ভাষাই ইতিমধ্যে বহু সম্পদ হেৰুৱাবলগীয়া হৈছে৷

       ওপৰত উল্লেখ কৰা দিশবোৰৰ উপৰি আৰু কেইটামান দিশ আমি চৰ্চাৰ মাজলৈ অনাটো প্ৰয়োজন বুলি ভবাৰ থল আছে৷ উদাহৰণ স্বৰূপে, গুগল অনুবাদকত তথ্য প্ৰদান কৰা আৰু পুনৰীক্ষণ কৰাৰ সময়ত বাংলা ভাষাৰ ‘র’ যুক্ত কড ব্যৱহাৰ কৰা সঁজুলি যাতে ব্যৱহাৰ কৰা নহয় তাৰ প্ৰতি সচেতন হৈ থকা প্ৰয়োজন৷ অন্যথা আমাৰ অলক্ষিতে আমি লিখা সমলবোৰ বাংলা সমললৈ ৰূপান্তৰিত হোৱাৰ অৱকাশ নথকা নহয়৷ সেইদৰে, গুগল অনুবাদকত এতিয়াও সম্পূৰ্ণ শুদ্ধ ৰূপত অসমীয়া অনুবাদ লাভ কৰাৰ পৰ্যায়লৈ অহা নাই৷ ইয়াৰ কাৰণ দুটা, প্ৰথমটো হল- শেহতীয়াকৈ গুগলে সংযোগ কৰা অসমীয়াকে ধৰি ২৪ টা ভাষাৰ বাবে zero shot machine translation নামৰ এক নতুন প্ৰযুক্তিগত-পদ্ধতিৰ প্ৰয়োগ কৰিছে৷ এই নতুন পদ্ধতিটো যথেষ্ট প্ৰভাৱশালী, কিন্তু এতিয়াও নিখুঁট ৰূপত কৰ্যক্ষম হৈ উঠা নাই৷ দ্বিতীয়তে গুগল অনুবাদকৰ শুদ্ধতাৰ মাত্ৰা বঢ়োৱাৰ ক্ষেত্ৰত আমাৰো এটা গুৰুদায়িত্ব আছে৷ ৰাইজে অৱদান যোগাব পৰাকৈ গুগলে উপলব্ধ কৰি দিয়া ব্যৱস্থাত আমি যিমান শুদ্ধকৈ শব্দ, শব্দগুচ্ছ, বাক্যাংশ বা বাক্যসমূহৰ অনুবাদ প্ৰদান আৰু পুনৰীক্ষণ কৰিম গুগলৰ মেচিন লাৰ্নিং এল্গৰিথিমে এটা সময়ত শিকি শিকি সিমানেই শুদ্ধ অনুবাদ আমাক দিব পাৰিব৷ বহু ক্ষেত্ৰত দেখা যায় যে কেৱল নিজৰ অৱদানৰ সংখ্যা বঢ়াবলৈকে বহুতে কিছুমান অদ্ভুত অনুবাদ গুগলত প্ৰদান কৰিছে৷ এনে কাৰ্যই আমাৰ ভাষাটোৰ শুদ্ধতাৰ এক অন্যতম প্ৰতিবন্ধক বুলিব পাৰি৷

(বিষয়ৰ গুৰুত্ব বুজি 'নিয়মীয়া বাৰ্তা' কাকতৰ ২১ মে; সংখ্যাত প্ৰকাশিত এই প্ৰবন্ধটো লেখকদ্বয়ৰ অনুমতিসাপেক্ষে পুনৰাই প্ৰকাশ কৰা হৈছে।)


ঠিকনা :

ভাস্কৰজ্যোতি শৰ্মা                                          গুণদীপ চেতিয়া

সহযোগী অধ্যাপক                                          প্ৰগ্ৰেমাৰ, ডিব্ৰুগড় বিশ্ববিদ্যালয়

ভাষা আৰু ভাষাবিজ্ঞান বিভাগ                                    ফোন- ৯৯৫৪৪৫৩৩৩

আনন্দৰাম বৰুৱা ভাষা-কলা-সংস্কৃতি সংস্থা                                           

ফোন- ৯৮৫৪৫১৪৫০৭

      

অন্যযুগৰ প্ৰকাশিত সংখ্যাসমূহ