বিজ্ঞান ব্লগ

মেশিন লার্নিং- ডেটা সায়েন্স এবং বাংলাদেশে ক্যাগল

মেশিন লার্নিং:

মেশিন লার্নিং হলো এমন একটা ফিল্ড, যেখানে বিভিন্ন অ্যালগরিদম ও প্রসেসের মাধ্যমে কীভাবে কম্পিউটারকে একটা জিনিস শেখানো যায়, সে নিয়ে কাজ করা হয়। এটা আর্টিফিশিয়াল ইন্টেলিজেন্স বা কৃত্রিম বুদ্ধিমত্তার একটা অংশ। মেশিন লার্নিং-এর মূল তত্ত্ব হচ্ছে, বিপুল পরিমাণ ডেটা বা তথ্য-উপাত্ত থেকে কোনো নির্দিষ্ট তথ্যের প্যাটার্ন বা ‘মডেল’ সঠিকভাবে বের করা। মেশিন লার্নিং ডেটা সায়েন্স-এর অন্যতম একটি ক্ষেত্র।

তাহলে, সহজে বললে, মেশিন লার্নিং হচ্ছে কম্পিউটার তথা মেশিনকে একটা কাজ শিখানো, যাতে সে পরে কোনো সুপারভাইজিং ছাড়া নিজে নিজেই সে কাজটা করতে পারে।

মেশিন লার্নিং সম্পর্কে আরো পড়ুন: মেশিন লার্নিং- কম্পিউটার যেভাবে শিখে

ডেটা সায়েন্স: 

ডেটা সায়েন্স হলো এমন একটা ক্ষেত্র, যেখানে বিভিন্ন সোর্স থেকে তথ্য সংগ্রহ, ভিজ্যুয়ালাইজ, মডেলিং ও বিশ্লেষণ করে নানারকম অ্যালগরিদম ও সফটওয়্যার ব্যবহার করে ডেটা থেকে নানারকম ইনসাইট বের করা হয়, যা পরবর্তীতে গবেষণা বা ব্যবসায়িক কাজে ব্যবহার করা হয়। এক কথায়, ডেটার উপর স্ট্যাটিস্টিক্স ও মেশিন লার্নিং খাটিয়ে ডেটাকে কাজে লাগানোই ডেটা সায়েন্স। 

ক্যাগল: 

শুধু কি ডেটা সায়েন্স- মেশিন লার্নিং শিখলেই হবে? নাহ! এটা কাজেও লাগানোও জানতে হবে। আর, রিয়েল লাইফে কাজ করা অনেক অনেক কঠিন ও ঝামেলার ব্যাপার। আর, বই পড়েও সব শিখা বলতে গেলে অসম্ভব। প্রতিদনই নিত্যনতুন জিনিস- এলগরিদমস আসছে। তাই এসব শিখার বেস্ট উপায় হচ্ছে একদম ‘আসল’ কাজ করতে করতে শেখা, ‘সিমুলেশন’ নয়। আসল প্রোডাকশন এনভায়রনমেন্টে এক্সেস নেওয়া। বিপদ তো হবে কিছুটা। তবে সেটার আউটপুট তৈরিকৃত সমস্যা থেকে কম। লং টার্মে সিমুলেশন শেখার চেয়ে মূল কাজটা শেখা কাজে দেয় ভালো। বই ক্লাস বাদ, আসল কাজ করতে করতেই শিখি আমরা। উই লার্ন বাই ডুইং ইট।

ডেটা সায়েন্স মেশিন লার্নিং ক্যাগল Data science Machine learning kaggle science bee
www.kaggle.com

সেকারণে ডেটা সায়েন্টিস্টদের পছন্দের জায়গা ‘ক্যাগল.কম‘। এখানে মেশিন লার্নিং নিয়ে সব কাজ হয়। কেউ মেশিন লার্নিং শিখতে চাইলে, এই লাইনের চাকরির খোঁজ, ভবিষ্যৎ ধারণা, কাজ শেখার নিজের অভিজ্ঞতা শেয়ারিং, মেশিন লার্নিং নিয়ে হাজারো সমস্যার পুরস্কার- তার সবকিছুই আছে এই জায়গায়। যারা শিখতে চান, তাদের মধ্যে বিভিন্ন ক্যাটাগরি ধরে আছে সব ধরণের “হাতে করি” রকমের কাজ।

ক্যাগল শুরু কিন্তু ‘কে’ দিয়ে। রিয়েল ওয়ার্ল্ড সমস্যা দেয়া আচ্ছে ওখানে। এ মুহুর্তে দেখছি একটা ‘ক্যান্সার’ রিলেটেড সমস্যা চলছে এক নম্বরে। দিয়েছে ইন্টেল। পুরস্কার এক লাখ ডলার। ফেলে দিন, ক্লাসে নম্বর পাওয়ার জন্য ওই ভুয়া প্রজেক্ট। বরং খুঁজে বের করুন রিয়েল ওয়ার্ল্ড ‘আসল’ প্রজেক্ট। ব্যাপারটা এমন – কাজ করে সাহায্য করো মানবতাকে। ফাঁকে আয় করো কিছু পয়সা। (সোর্সঃ হাতেকলমে মেশিন লার্নিং – রকিবুল হাসান)

২০১৭ সালের মার্চে টেকজায়ান্ট গুগল ‘ক্যাগল’ অধিগ্রহণ করে। ২০১৭ সালের জুনে, Kaggle ঘোষণা করেছে যে, এটি ১ মিলিয়ন নিবন্ধিত ব্যবহারকারী, বা Kagglers এর সংখ্যা অতিক্রম করেছে এবং ২০২১ সাল নাগাদ ৮ মিলিয়নেরও বেশি নিবন্ধিত ব্যবহারকারী রয়েছে। এটি ১৯৪ টি দেশে বিস্তৃত, যেখানে মাত্র মেশিন লার্নিং বা ডেটা সায়েন্স নিয়ে কাজ শুরু করা মানুষ থেকে শুরু করে বিশ্বের সেরা গবেষকরাও নিয়মিত কাজ করেন।

Kaggle competitions পেজ (kaggle.com/competitions)

দেখা যাচ্ছে, ১০ হাজার ডলার থেক শুরু করে দেড় লাখ ডলার পর্যন্ত প্রাইজমানি পাওয়া যায় একটা কম্পিটিশন করে! গুগল, আমেরিকান এক্সপ্রেস সহ আরো নামীদামী কোম্পানি এখানে প্রতিযোগীতার আয়োজন করে। ফাইনানশিয়াল থেকে শুরু করে, টেক্সট, স্পোর্টস, ইমেজ, মেডিকেল রিসার্চ- সবই হয় এখানে!

ক্যাগলে কাজের স্বীকৃতিস্বরূপ মেডেল দেয়া হয়। ৩ রকমের মেডেল আছে। গোল্ড, সিলভার ও ব্রোঞ্জ। 

ক্যাগলের সেগমেন্টস:

ক্যাগলে ৪টা সেগমেন্ট আছে: 

ক্যাগলের প্রোগ্রেশনস সিস্টেম:

ক্যাগলে ৫টা প্রোগ্রেশনস টাইটেল আছে। 

ক্যাগলারস:

বাংলাদেশেও অনেক ভালো ও দক্ষ ক্যাগলার আছেন। উপরের আলোচনা থেকে আমরা বুঝতে পারি, ক্যাগলে মাস্টার কিংবা গ্র্যান্ড মাস্টার হওয়া বেশ কঠিন কাজ। দক্ষ না হলে ও নিয়মিত পরিশ্রম ছাড়া মাস্টার ও গ্র্যান্ডমাস্টার হওয়া অসম্ভব।

যদি কিছু সংখ্যা দিতে হয়, এই আর্টিকেল লিখার সময়, ক্যাগল প্রতিষ্ঠার প্রায় ১২ বছর পর, বর্তমানে ৮+ মিলিয়ন ইউজারের মাঝে:

গ্র্যান্ডমাস্টার আছেন:

মাস্টার আছেন:

বাংলাদেশের ক্যাগলারস:

বাংলাদেশ হতে এখন পর্যন্ত ক্যাগলে ২ জন গ্র্যান্ডমাস্টার ও ১৩ জন মাস্টার আছেন। মোট ১৫ জন মাত্র! সুতরাং, বোঝাই যাচ্ছে তাদের এচিভমেন্ট টা কত্তো বড়! (তথ্যসূত্র: Kaggle Grand/Masters Map by steubk)

বাংলাদেশের প্রথম গ্রান্ডমাস্টার হলেন, Mobassir Hossen (Linkedin : Mobassir Hossen – Double GrandMaster – Kaggle | LinkedIn | Kaggle: Mobassir | Grandmaster | Kaggle )। ২০২০ সালের ২ ফেব্রুয়ারি তিনি ক্যাগলের নোটবুকস গ্রান্ডমাস্টার হন। তিনি ড্যাফোডিল ইন্টারন্যাশনাল ইউনিভার্সিটি থেকে সফটওয়্যার ইঞ্জিনিয়ারিং এ ব্যাচেলরস ডিগ্রি পাশ করেন। তিনি বাংলাদেশের একমাত্র ডাবল গ্রান্ডমাস্টার। ২০২০ সালেরই ২৪শে মার্চ তিনি ডিস্কাশনস সেগমেন্টেও গ্র্যান্ডমাস্টার হন। 

বাংলাদেশের দ্বিতীয় ক্যাগল গ্রান্ডমাস্টার হলেন, Md Awsafur Rahman (Linkedin: Md Awsafur Rahman – Notebook Grandmaster & Competition Master – Kaggle | LinkedIn | Kaggle: Awsaf | Grandmaster | Kaggle )। তিনিও ক্যাগলের নোটবুকস গ্রান্ডমাস্টার। তিনি বুয়েট এর ইইই তে পড়াশোনা করছেন। 

বিশ্বের মোট ২৩ জন ডাবল গ্র্যান্ডমাস্টারের মাঝে বাংলাদেশের ১ জন, ৮৮ জন নোটবুকস গ্র্যান্ডমাস্টারের মধ্যে বাংলাদেশের ২ জন আছেন; ডিস্কাশনে মাত্র ৫৫ জন গ্র্যান্ডমাস্টারের মধ্যে আমাদের ১ জনের উপস্থিতি আমাদের জন্য অনেক গর্বের।

Exit mobile version