Embibe হল একটি এআই প্ল্যাটফর্ম যার থেকে ব্যাপক হারে শিক্ষাদান করা যায় [5][6]। আমরা সারা বিশ্বের শিক্ষার্থীদের জন্য প্রতিশ্রুতিবদ্ধ, যেকোনো ভাষায় অধ্যয়নের জন্য ।  অনুবাদ প্রকল্পের লক্ষ্য হল ভারতের লক্ষ লক্ষ শিক্ষার্থীদের স্থানীয় ভাষায় শিক্ষামূলক বিষয়বস্তু প্রদান করা। শিক্ষার্থীদের শিক্ষা সফরের সময় তাদের ব্যক্তিগত শিক্ষণ, অনুশীলন এবং মূল্যায়নের বিষয়বস্তু নিশ্চিত করার জন্য বিষয়বস্তু তৈরি করা, তৈরি করা বা অনুবাদ করা গুরুত্বপূর্ণ[7][8]।

বেশিরভাগ উচ্চ-মানের অধ্যয়ন বিষয়ক বিষয়বস্তু ইংরেজিতে পাওয়া যায়। এটা আমাদের ছাত্রদের জন্য দারুণ হবে যদি আমরা সেগুলোকে ভারতীয় স্থানীয় ভাষায় অনুবাদ করতে পারি। তাই এর জন্য, আমরা ভারতের প্রতিটি প্রধান স্থানীয় ভাষার জন্য ইন-হাউস এনএমটি (নিউরাল মেশিন ট্রান্সলেশন) মডেল তৈরি করেছি। প্রতিটি মডেল ইনপুট হিসাবে অধ্যয়ন বিষয়ক ইংরেজি বাক্যগুলি গ্রহন করবে  এবং প্রদত্ত লক্ষ্য ভাষায় অনুবাদিত বাক্যগুলির আউটপুট প্রদান করবে।

বর্তমানে, আমরা 11টি ভারতীয় ভাষায় কাজ করছি এগুলি হল,

  1. হিন্দি 
  2. গুজরাটি
  3. মারাঠি 
  4. তামিল 
  5. তেলেগু  
  6. বাংলা  
  7. কন্নড়  
  8. অসমীয়া  
  9. ওড়িয়া  
  10. পাঞ্জাবি 
  11. মালায়ালাম   

গুগল অনুবাদ কখনও কখনও ভুল করে কারণ এটি অধ্যয়ন বিষয়ক কার্যক্ষেত্রের জন্য বিশেষভাবে নির্মিত নয়। তারই কিছু উদাহরণ তুলে ধরা হলো-

EnglishGoogle translationNMT translation
which of the following law was given by Einstein:নিচের কোন আইনটি আইনস্টাইন দিয়েছিলেন:আইনস্টাইন নিম্নলিখিত সূত্রগুলোর মধ্যে কোনটি দিয়েছিলেন:
which one of the following is not alkaline earth metal?নিচের কোনটি ক্ষারীয় আর্থ ধাতু নয়?নিচের কোনটি ক্ষারীয় মৃত্তিকা ধাতু নয়?
Endogenous antigens are produced by intra-cellular bacteria within a host cell.অন্তঃসত্ত্বা অ্যান্টিজেনগুলি একটি হোস্ট কোষের মধ্যে আন্তঃকোষীয় ব্যাকটেরিয়া দ্বারা উত্পাদিত হয়।অন্তঃকোষীয় ব্যাকটেরিয়া একটি হোস্ট কোষের মধ্যে অন্তঃকোষীয় অ্যান্টিজেন তৈরি করে।

দৃষ্টিভঙ্গি

এখন, স্ক্র্যাচ থেকে NMT মডেল তৈরি করতে, আমাদের প্রচুর এবং প্রচুর তথ্যের প্রয়োজন (কয়েক মিলিয়ন বাক্য)। তাই, আমরা একটি প্রতিক্রিয়া লুপ তৈরি করেছি যা সময়ের সাথে সাথে উন্নতি করতে থাকে। আমরা এখানে সব ভাষাতেই একাডেমিক অনুবাদকদের সাহায্য নিয়েছি।

আমরা একাডেমিক অনুবাদকদের মেশিন-অনুবাদিত (এনএমটি ব্যবহার করে) বাক্যগুলি প্রদান করি, এবং তারপরে মডেলটিকে অভিযোজিতভাবে আপডেট করার জন্য একাডেমিক অনুবাদকদের প্রতিক্রিয়া একত্রিত করা হয়। এটি নিশ্চিত করে যে মেশিন-অনুবাদিত বাক্যগুলির গুণমান সময়ের সাথে উন্নত হয়।

এখানে একটি চিত্র রয়েছে যা পুরো প্রকল্পের সামগ্রিক কাঠামো দেখায়।

সুতরাং, আমাদের সমাধান হল “মানব + এআই” ব্যবহার। উভয়ই বিশ্বের সেরা কাজে ব্যবহার হয়। 

চিত্র-অনুবাদ:

আমরা চিত্র অনুবাদ সমাধানের সমস্যাটিও গ্রহন করেছি। যেখানে ইংরেজি লেবেল সহ একটি চিত্র দেওয়া হবে এবং আউটপুট আসবে লক্ষ্য ভাষায় লেবেল সহ একটি চিত্র।

উদাহরণস্বরূপ, এই বাম দিকের ইনপুট চিত্রটি স্বয়ংক্রিয়ভাবে ডান পাশের আউটপুট চিত্রে রূপান্তরিত হবে।

আমরা এটিকে নিখুঁত করতে এই আউটপুট চিত্রটির উপরে ছোটখাটো অক্ষরের ধরণ আপডেট করতে পারি।

এই প্রকল্পের জন্য, আমরা প্রথমে চিত্র থেকে পাঠ্য লেবেল সনাক্ত করি, তারপর প্রতিটি পাঠ্য লেবেলের জন্য ওসিআর করি, তারপর এনএমটি  এপিআই ব্যবহার করে অনুবাদ করি। তারপর সেই অনূদিত পাঠ্যটি চিত্রে সংশ্লিষ্ট স্থানে রাখা হয় । 

সুতরাং, আমরা দেখেছি কিভাবে আমরা কোন কিছুর সাথে আপস না করে অনুবাদের মোট খরচ উল্লেখযোগ্যভাবে কমাতে পারি। পাঠ্য অনুবাদ অটোমেশনের কারণে, আমরা দেখেছি মানব অনুবাদকদের ম্যানুয়াল কাজ ~75% থেকে 80% পর্যন্ত হ্রাস পেয়েছে, তাদের উৎপাদনশীলতা উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে। যা শেষ পর্যন্ত অনুবাদের মোট খরচ কমিয়ে দিয়েছে।

এই এনএমটি মডেলগুলির কর্মক্ষমতা উন্নত করতে আমরা ভবিষ্যতে আরও অনেক কিছু করতে পারি। আমরা KI-BERT[2] ব্যবহার করে এই এনএমটি মডেলগুলিতে আমাদের অভ্যন্তরীণ একাডেমিক জ্ঞান গ্রাফ থেকে জ্ঞান প্ররোচিত করার চেষ্টা করতে পারি । নলেজ গ্রাফ থেকে অতিরিক্ত প্রাসঙ্গিক জ্ঞান ট্রান্সফরমারের মতো মনোযোগ ভিত্তিক মডেলের দৃঢ়তা উন্নত করতে পারে যা আমরা এনএমটি মডেলগুলিতে ব্যবহার করি [3][4]।

← AI হোমে ফিরে যাও