শিরোনাম
প্রচ্ছদ / গণমাধ্যম / আমরা তথ্যপ্রযুক্তিতে বাংলা ভাষায় অনেকদুর এগিয়ে গেছি — মোস্তাফা জব্বার

আমরা তথ্যপ্রযুক্তিতে বাংলা ভাষায় অনেকদুর এগিয়ে গেছি — মোস্তাফা জব্বার

বাংলা ভাষায় ইউনিকোড ফন্ট ব্যবহার করা হয়েছে। বাংলা ইউনিকোড আইএসও স্ট্যান্ডার্ড ১৫২০:২০১১ স্বীকৃতি পেয়েছে। ইউটিএফ ৬ থেকে শুরু হওয়ার পর ইউটিএফ ১০ ভার্সন নিয়ে কাজ চলছে। ভাষা গবেষণা এবং প্রযুক্তিতে বাংলা ভাষার প্রমিতরুপ ব্যবহারের জন্য ১৫৯ কোটি ২ লাখ টাকার প্রকল্প পাশ হয়েছে। কৃত্তিম বুদ্ধিমত্তা ব্যবহার করে একটি সময় সম্মেলন কক্ষে বাংলায় কথা বললে সেই ভাষা অনুবাদ হয়ে তাৎক্ষণিক বিভিন্ন ভাষায় শোনার প্রযুক্তিও আমরা তৈরি করতে সক্ষম হব।

বেসিস সফট এক্সপোর দ্বিতীয় দিনে বঙ্গবন্ধু আন্তর্জাতিক সম্মেলন কেন্দ্রের উইন্ডি টাউন হলে ‘তথ্য প্রযুক্তিতে বাংলা ভাষা’ শীর্ষক গোল টেবিল বৈঠক অনুষ্ঠিত হয়।

বেসিস সভাপতি মোস্তাফা জব্বারের সঞ্চালনায় সভায় কি-নোট স্পিকার ছিলেন বাংলাদেশ কম্পিউটার কাউন্সিলের প্রাক্তন নির্বাহী পরিচালক এস এম আশরাফুল ইসলাম। বৈঠকে প্যানেলিস্ট আলোচকদের মধ্যে বাংলাদেশ কম্পিউটার কাউন্সিলের পরিচালক ইঞ্জিনিয়ার এনামুল কবির,টিম ইঞ্জিন লিমিটেডের ব্যবস্থাপনা পরিচালক সামিরা জুবেরি হিমিকা,ইউনাইটেড ইন্টারন্যাশনাল বিশ্ববিদ্যালয়ের (ইউআইইউ) অধ্যাপক ড. হাসান সরওয়ার, প্রথম আলো ইয়ুথ গ্রুপের সমন্বয়ক মুনির হাসান,জাহাঙ্গীরনগর বিশ্ববিদ্যালয়ের অধ্যাপক এ. এফ. এম দানিয়াল হক, বাংলাদেশ কম্পিউটার কাউন্সিলের নির্বাহী পরিচালক স্বপন কুমার সরকার এবং ঢাকা বিশ্ববিদ্যালয়ের অধ্যাপক মনসুর মুসা ।

আশরাফুল ইসলাম বলেন, বাংলা ভাষায় ফন্ট, কি-বোর্ড, অনুবাদ, বাংলা বাণীকে লিখিত বাক্যে রুপান্তর (ভয়েস টু টেক্সট), টেক্সট টু ভয়েস, বাংলা ও সি আর ও বাংলা হাতের লেখা চিহ্নিতকরণ বিষয়ে এখনো অনেক প্রতিবন্ধকতা রয়েছে। সবচেয়ে বড় সমস্যা রয়ে গেছে বাংলা বানান ঠিক করা নিয়ে। যতগুলো কি-বোর্ড বাংলায় ব্যবহৃত হয় তার মধ্যে একটি কি-বোর্ডও এখনো পরিপূর্ণভাবে বানান শুদ্ধকরণে সফলতা অর্জন করতে পারেনি। আইসিটি ডিভিশনের উচিৎ বাংলা ভাষায় ও সি আর করে তা উন্মুক্ত করে দেয়া। তাহলে অ্যাপস ডেভেলপারসরা এই বিষয়ে কাজ করতে পারবেন। বাংলা ভাষায় দুটি স্টাইল গাইড ব্যবহৃত হয়। যার একটি পশ্চিম বঙ্গের এবং অন্যটি বাংলাদেশের। পশ্চিম বঙ্গের স্টাইল গাইড প্রণয়ন হয়ে গেলেও বাংলাদেশেরটা এখনো চালু হয়নি। আমাদের স্টাইল গাইড নিয়ে কাজ করতে হবে। এছাড়াও ক্ষুদ্র নৃ-গোষ্ঠীদের ভাষা নিয়েও গবেষণা চলছে। ইতোমধ্যে মারমা, চাকমা ভাষায় পাঠ্যবই রচিত হয়েছে।

ইঞ্জিনিয়ার এনামুল কবির বলেন, ইংরেজী, ফ্রেঞ্চ, চাইনিজ ভাষায় অনেক কনটেন্ট থাকলেও বাংলা ভাষায় কনটেন্টের সংখ্যা খুবই অল্প। একটি অ্যানালাইটিক্যাল সাইটের পরিসংখ্যান অনুসারে এই সংখ্যা .১ শতাংশেরও কম। তথ্য প্রযুক্তিতে বাংলা ভাষার প্রমিতকরণে আমাদের দক্ষ লোক দরকার। কিন্তু এই জায়গায় আমরা সঠিক কাজ সঠিক মানুষকে দিয়ে করানোর লোক খুঁজে পাইনা। এছাড়াও গুগল দেবনগরী ফন্টের জন্য দাড়ি এবং ডাবল দাড়িতে ইউনিকোড দিলেও আমাদের জন্য এখনো সেই জায়গা খালি রয়ে গেছে।

জুবেরি হিমিকা বলেন, ২০১২ সাল থেকে আমরা বাংলা কনটেন্ট নিয়ে কাজ শুরু করি। ইংরেজীতে অনেক লাইব্রেরি ডিজিটাল করা হলেও দেশে এই ধরণের ডিজিটাল লাইব্রেরির সংখ্যা নেহায়েত কম। ইংরেজী করা সম্ভব হলে বাংলাও করা সম্ভব। নিজেদের অর্থ খরচ করে আমরা একটা ওসিআর তৈরি করি। কিন্তু আক্ষেপের বিষয় হচ্ছে সরকারের কাছে এই প্রজেক্ট জমা দেয়ার পরেও সরকারিভাবে এই ওসিআর ব্যবহৃত হয় না। আমরা নিজেরাই ৬০ টি প্রতিষ্ঠানে এই ওসিআর ইন্সটল করে দিয়ে এসেছিলাম। আমরা আমাদের প্রজেক্টের এপিআই এক্সচেঞ্জ উন্মুক্ত রেখেছি। ভাষাকে তথ্যপ্রযুক্তিতে সমৃদ্ধ করতে আমাদের গ্লোবাল টিম তৈরি করা দরকার। এতে আমরা দেশে-বিদেশে সবখানেই লাভবান হব।

অধ্যাপক ড. হাসান সরওয়ার বলেন, ২০০৫ থেকে কম্পিউটার সায়েন্সের পাশাপাশি আমি ভাষা নিয়ে কাজ করছি। বাংলা বইগুলোকে স্ক্যান করে অটোমেশন রিডারে নিয়ে এসে ফন্টে ব্যবহার করার জন্য অনেক বছর আগে ২৩ লাখ টাকার প্রকল্প পেয়ে একটি ওসিআর তৈরি করেছিলাম। তখন খুব অল্প টাকার ফান্ড ছিল। এখন টাকা হয়েছে। যোগ্য লোক দিয়ে কাজ করানো গেলে আমরা ৩বছরে পরিপূর্ণ না হলেও একটি গাইডলাইন পেয়ে যাবো।

মুনির হাসান বলেন, শাহজালাল বিশ্ববিদ্যালয়ের তৈরি ২ লাখ করপাস (ভাষাংশ) আছে। গুগলে ২৪ লাখ করপাস আছে। ৪ দিনে ৭ লাখ এবং ২ বছরে আমরা তৈরি করেছি আরো ৭ লাখ করপাস। কিন্তু গুগলে এই সংখ্যা নগণ্য। শুধু ইংরেজিতে গুগলে করপাস জমা আছে ৬ কোটি। ন্যুনতম ৫০ লাখ করপাস হলেও গুগলে আমাদের অবস্থান ভালো হবে। আমাদের কল সেন্টারে কাজ করার জন্য যোগ্য শিক্ষার্থী পাওয়া যায় না। অথচ মাত্র ৬০০ শব্দ আর ১৫০ টি বাক্য জানলেই কল সেন্টারে কাজ করা সম্ভব।

অধ্যাপক এ. এফ. এম দানিয়াল হক বলেন, ভাষার প্রমিতকরণ নিয়ে তথ্যপ্রযুক্তিতে কাজ করার প্রাথমিক স্টেজে রয়েছি আমরা। একসময় ঢাকা বিশ্ববিদ্যালয়ে রেমিংটন মেশিন দিয়ে কাজ করা হত। আমাদের বাংলা ফন্টগুলো এখনো পর্যন্ত প্রমিত হয়নি। সরকারি, আধা-সরকারি এবং বেসরকারি এ তিন স্থানে একসঙ্গে কাজ করতে হবে। এজন্য অনলাইনে গ্রুপিং করে কাজ করা যেতে পারে।

স্বপন কুমার সরকার বলেন, তথ্যপ্রযুক্তির এ বিভাগে আমার কাজের কোন অভিজ্ঞতা নেই। নতুন হিসেবে আমি আপনাদের সবার সহযোগিতা কামনা করি। কীভাবে কাজ করবো এবং কাকে কাজে নিয়োগ দিবো এ ব্যাপারে আপনারা আমাকে নির্ধিদ্বায় পরামর্শ দেবেন। আপনাদের আমি সবসময় স্বাগত জানাই।

অধ্যাপক মনসুর মুসা বলেন, দেশের ৯৯ শতাংশ মানুষ জানেই না ভাষা কি? অথচ আমাদের সবার মধ্যে ব্যাকরণ আছে। বাংলা ব্যাকরণ না জানলে ভাষা জানা যাবে না। আমি চট্টগ্রামের ভাষা নিয়ে গবেষণা করেছি। চট্টগ্রামের ভাষা নিয়ে গবেষণা করতে গিয়ে দেখেছি, প্রতি ৫ কিলোমিটার পর পর ভাষার পরিবর্তন আছে। জীবিত পরিবর্তনশীল। বাংলা ভাষায় তুমি, তুই এবং আপনি তিনটি ভাগ থাকলেও ইংরেজীতে নেই। কৃত্তিম ভাষা মানুষের মনের ভাব বুঝতে পারে না। বাংলার ক্ষেত্রে কৃত্তিম ভাষা ব্যবহার করে ভাষা বুঝা আরো কঠিন। দেশে ভাষা গবেষণা এবং প্রমিতকরণ করে প্রযুক্তিতে ব্যবহারের জন্য যে প্রকল্প করা হয়েছে তার জন্য প্রধানমন্ত্রীকে আন্তরিক ধন্যবাদ। আগামী পাঁচ বছরে এ কাজ সম্পন্ন হবে বলে আমি আশাবাদী।

মোস্তাফা জব্বার বলেন, আমরা তথ্যপ্রযুক্তিতে বাংলা ভাষায় অনেকদুর এগিয়ে গেছি। অনেক প্রতিবন্ধকতা ছিল। ভবিষ্যতেও থাকবে। তবে জয়ী আমরা হবোই। ১৯৬৯ সালে দেশে প্রথম বাংলা টাইপ রাইটার মেশিন আছে। ১৯৭২ সালে বঙ্গবন্ধু প্রথম অপ্টিমা মুনীর টাইপ রাইটার মেশিন দেশে নিয়ে আসেন। ভাষার ১৬টি টুলস বানাতে প্রকল্প হাতে নেয়া হয়েছে। আশা করা যায়, এই প্রকল্প সম্পন্ন হলে আমাদের সমস্যাগুলোর সমাধান অতি দ্রুত হয়ে যাবে।

পড়ে দেখুন

অধিক শস্য ফলনের জন্য বিদ্যুৎ ব্যবহারে সবাইকে সাশ্রয়ী হবার আহ্বান প্রধানমন্ত্রীর

॥ ডেস্ক রিপোর্ট ॥ প্রধানমন্ত্রী শেখ হাসিনা বিদ্যুৎ ব্যবহারে সাশ্রয়ী হবার পাশাপাশি সকলকে সঞ্চয় করার …