মেশিন লার্নিং:
মেশিন লার্নিং হলো এমন একটা ফিল্ড, যেখানে বিভিন্ন অ্যালগরিদম ও প্রসেসের মাধ্যমে কীভাবে কম্পিউটারকে একটা জিনিস শেখানো যায়, সে নিয়ে কাজ করা হয়। এটা আর্টিফিশিয়াল ইন্টেলিজেন্স বা কৃত্রিম বুদ্ধিমত্তার একটা অংশ। মেশিন লার্নিং-এর মূল তত্ত্ব হচ্ছে, বিপুল পরিমাণ ডেটা বা তথ্য-উপাত্ত থেকে কোনো নির্দিষ্ট তথ্যের প্যাটার্ন বা ‘মডেল’ সঠিকভাবে বের করা। মেশিন লার্নিং ডেটা সায়েন্স-এর অন্যতম একটি ক্ষেত্র।
তাহলে, সহজে বললে, মেশিন লার্নিং হচ্ছে কম্পিউটার তথা মেশিনকে একটা কাজ শিখানো, যাতে সে পরে কোনো সুপারভাইজিং ছাড়া নিজে নিজেই সে কাজটা করতে পারে।
মেশিন লার্নিং সম্পর্কে আরো পড়ুন: মেশিন লার্নিং- কম্পিউটার যেভাবে শিখে
ডেটা সায়েন্স:
ডেটা সায়েন্স হলো এমন একটা ক্ষেত্র, যেখানে বিভিন্ন সোর্স থেকে তথ্য সংগ্রহ, ভিজ্যুয়ালাইজ, মডেলিং ও বিশ্লেষণ করে নানারকম অ্যালগরিদম ও সফটওয়্যার ব্যবহার করে ডেটা থেকে নানারকম ইনসাইট বের করা হয়, যা পরবর্তীতে গবেষণা বা ব্যবসায়িক কাজে ব্যবহার করা হয়। এক কথায়, ডেটার উপর স্ট্যাটিস্টিক্স ও মেশিন লার্নিং খাটিয়ে ডেটাকে কাজে লাগানোই ডেটা সায়েন্স।
ক্যাগল:
শুধু কি ডেটা সায়েন্স- মেশিন লার্নিং শিখলেই হবে? নাহ! এটা কাজেও লাগানোও জানতে হবে। আর, রিয়েল লাইফে কাজ করা অনেক অনেক কঠিন ও ঝামেলার ব্যাপার। আর, বই পড়েও সব শিখা বলতে গেলে অসম্ভব। প্রতিদনই নিত্যনতুন জিনিস- এলগরিদমস আসছে। তাই এসব শিখার বেস্ট উপায় হচ্ছে একদম ‘আসল’ কাজ করতে করতে শেখা, ‘সিমুলেশন’ নয়। আসল প্রোডাকশন এনভায়রনমেন্টে এক্সেস নেওয়া। বিপদ তো হবে কিছুটা। তবে সেটার আউটপুট তৈরিকৃত সমস্যা থেকে কম। লং টার্মে সিমুলেশন শেখার চেয়ে মূল কাজটা শেখা কাজে দেয় ভালো। বই ক্লাস বাদ, আসল কাজ করতে করতেই শিখি আমরা। উই লার্ন বাই ডুইং ইট।
সেকারণে ডেটা সায়েন্টিস্টদের পছন্দের জায়গা ‘ক্যাগল.কম‘। এখানে মেশিন লার্নিং নিয়ে সব কাজ হয়। কেউ মেশিন লার্নিং শিখতে চাইলে, এই লাইনের চাকরির খোঁজ, ভবিষ্যৎ ধারণা, কাজ শেখার নিজের অভিজ্ঞতা শেয়ারিং, মেশিন লার্নিং নিয়ে হাজারো সমস্যার পুরস্কার- তার সবকিছুই আছে এই জায়গায়। যারা শিখতে চান, তাদের মধ্যে বিভিন্ন ক্যাটাগরি ধরে আছে সব ধরণের “হাতে করি” রকমের কাজ।
ক্যাগল শুরু কিন্তু ‘কে’ দিয়ে। রিয়েল ওয়ার্ল্ড সমস্যা দেয়া আচ্ছে ওখানে। এ মুহুর্তে দেখছি একটা ‘ক্যান্সার’ রিলেটেড সমস্যা চলছে এক নম্বরে। দিয়েছে ইন্টেল। পুরস্কার এক লাখ ডলার। ফেলে দিন, ক্লাসে নম্বর পাওয়ার জন্য ওই ভুয়া প্রজেক্ট। বরং খুঁজে বের করুন রিয়েল ওয়ার্ল্ড ‘আসল’ প্রজেক্ট। ব্যাপারটা এমন – কাজ করে সাহায্য করো মানবতাকে। ফাঁকে আয় করো কিছু পয়সা। (সোর্সঃ হাতেকলমে মেশিন লার্নিং – রকিবুল হাসান)
২০১৭ সালের মার্চে টেকজায়ান্ট গুগল ‘ক্যাগল’ অধিগ্রহণ করে। ২০১৭ সালের জুনে, Kaggle ঘোষণা করেছে যে, এটি ১ মিলিয়ন নিবন্ধিত ব্যবহারকারী, বা Kagglers এর সংখ্যা অতিক্রম করেছে এবং ২০২১ সাল নাগাদ ৮ মিলিয়নেরও বেশি নিবন্ধিত ব্যবহারকারী রয়েছে। এটি ১৯৪ টি দেশে বিস্তৃত, যেখানে মাত্র মেশিন লার্নিং বা ডেটা সায়েন্স নিয়ে কাজ শুরু করা মানুষ থেকে শুরু করে বিশ্বের সেরা গবেষকরাও নিয়মিত কাজ করেন।
দেখা যাচ্ছে, ১০ হাজার ডলার থেক শুরু করে দেড় লাখ ডলার পর্যন্ত প্রাইজমানি পাওয়া যায় একটা কম্পিটিশন করে! গুগল, আমেরিকান এক্সপ্রেস সহ আরো নামীদামী কোম্পানি এখানে প্রতিযোগীতার আয়োজন করে। ফাইনানশিয়াল থেকে শুরু করে, টেক্সট, স্পোর্টস, ইমেজ, মেডিকেল রিসার্চ- সবই হয় এখানে!
ক্যাগলে কাজের স্বীকৃতিস্বরূপ মেডেল দেয়া হয়। ৩ রকমের মেডেল আছে। গোল্ড, সিলভার ও ব্রোঞ্জ।
ক্যাগলের সেগমেন্টস:
ক্যাগলে ৪টা সেগমেন্ট আছে:
- কম্পিটিশনস: ক্যাগলে আয়োজিত সবরকম কম্পিটিশন এই ক্যাটাগরির আওতায় পড়ে। সাধারণত কম্পিটিশনে টপ ১% র্যাংক-এ থাকলে গোল্ড, টপ ৫% এ থাকলে সিলভার ও টপ ১০% এ থাকলে ব্রোঞ্জ মেডেল পাওয়া যায়। টিম করে বা সলো (একা একা) কম্পিটিশন করা যায়।
- ডাটাসেটস: ডাটাসেট হলো, একটা টপিকের উপর কালেকটেড ডাটার একটা গোছানো রূপ। ক্যাগলে ব্যবহারকারীরা নিজেদের তৈরি বা কিউরেটেড ডাটাসেট পাবলিশ করতে পারেন, যাতে তিনি নিজে ও অন্যান্য মেশিন লার্নিং ইঞ্জিনিয়ার বা ডাটা সায়েন্টিস্টরা এসব নিয়ে কাজ করতে পারে। ডাটাসেট ভালো হলে, অন্যান্য ব্যবহারকারীরা এতে আপভোট দিতে পারে। ৫ টি আপভোটে ব্রোঞ্জ, ২০ আপভোটে সিলভার ও ৫০ আপভোটে গোল্ড মেডেল পাওয়া যায়।
- নোটবুকস: নোটবুকস হলো, জুপিটার নোটবুক ফরম্যাটে ক্যাগলে প্রকাশিত একটা প্রজেক্ট বা টিউটোরিয়াল বা কোডিং ম্যাটেরিয়াল। নোটবুক ভালো হলে, অন্যান্য ব্যবহারকারীরা এতে আপভোট দিতে পারে। ৫ টি আপভোটে ব্রোঞ্জ, ২০ আপভোটে সিলভার ও ৫০ আপভোটে গোল্ড মেডেল পাওয়া যায়।
- ডিসকাশনস: ডিসকাশনস হলো, ক্যাগলে বিভিন্ন টপিকে অন্যকে হেল্প করা, বা কোনো তথ্য শেয়ার করা। ভালো টপিক বা কমেন্টে, অন্যান্য ব্যবহারকারীরা এতে আপভোট দিতে পারে। ১ টি আপভোটে ব্রোঞ্জ, ৫ আপভোটে সিলভার ও ১০ আপভোটে গোল্ড মেডেল পাওয়া যায়।
ক্যাগলের প্রোগ্রেশনস সিস্টেম:
ক্যাগলে ৫টা প্রোগ্রেশনস টাইটেল আছে।
- নোভিস (Novice): ক্যাগলে আইডি খুললেই সবার টাইটেল থাকে- নোভিস। মানে, একেবারে নতুন। কয়েকটা সিম্পল কাজ করেই কন্ট্রিবিউটর হয়ে যাওয়া যায়।
- কন্ট্রিবিউটর (Contributor): কন্ট্রিবিউটর হল, যে ক্যাগল প্লাটফর্মের সাথে পরিচিত। এবং, বিভিন্ন ভাবে নোটবুকস, ডাটাসেটস বা ডিস্কাশনসে কন্ট্রিবিউট করছে।
- এক্সপার্ট (Expert): এক্সপার্ট হলো, ৪ টা সেগমেন্টের এক বা একাধিক সেকশনে সে দক্ষ। কোনো সেগমেন্টে এক্সপার্ট হতে হলে সে সেগমেন্টে নির্দিষ্ট সংখ্যাক মেডেল অর্জন করতে হয়।
- কম্পিটিশনস এক্সপার্ট: ২ টা ব্রোঞ্জ মেডেল
- ডাটাসেটস এক্সপার্ট: ৩ টা ব্রোঞ্জ মেডেল
- নোটবুকস এক্সপার্ট: ৫ টা ব্রোঞ্জ মেডেল
- ডিস্কাশন এক্সপার্ট: ৫০ টা ব্রোঞ্জ মেডেল
- মাস্টার (Master): মাস্টার হলো, ৪ টা সেগমেন্টের এক বা একাধিক সেকশনে সে খুবই দক্ষ। কোনো সেগমেন্টে মাস্টার হতে হলে সে সেগমেন্টে নির্দিষ্ট সংখ্যাক মেডেল অর্জন করতে হয়।
- কম্পিটিশনস মাস্টার: ১ টা গোল্ড ও ২টা সিলভার মেডেল
- ডাটাসেটস মাস্টার: ১ টা গোল্ড ও ৪টা সিলভার মেডেল
- নোটবুকস মাস্টার: ১০ টা সিলভার মেডেল
- ডিস্কাশন মাস্টার: ৫০ টা সিলভার মেডেল, মোট ২০০ টা মেডেল
- গ্র্যান্ডমাস্টার (Grand Master): গ্র্যান্ডমাস্টার হলো, ৪ টা সেগমেন্টের এক বা একাধিক সেকশনে সে খুবই খুবই দক্ষ, বস লেভেলের। কোনো সেগমেন্টে গ্র্যান্ডমাস্টার হতে হলে সে সেগমেন্টে নির্দিষ্ট সংখ্যাক মেডেল অর্জন করতে হয়।
- কম্পিটিশনস মাস্টার: ৫ টা গোল্ড ১ টা সলো গোল্ড (এক একাই গোল্ড পাওয়া)
- ডাটাসেটস মাস্টার: ৫ টা গোল্ড ও ৫ টা সিলভার মেডেল
- নোটবুকস মাস্টার: ১৫ টা গোল্ড মেডেল
- ডিস্কাশন মাস্টার: ৫০ টা গোল্ড মেডেল, মোট ৫০০ টা মেডেল
ক্যাগলারস:
বাংলাদেশেও অনেক ভালো ও দক্ষ ক্যাগলার আছেন। উপরের আলোচনা থেকে আমরা বুঝতে পারি, ক্যাগলে মাস্টার কিংবা গ্র্যান্ড মাস্টার হওয়া বেশ কঠিন কাজ। দক্ষ না হলে ও নিয়মিত পরিশ্রম ছাড়া মাস্টার ও গ্র্যান্ডমাস্টার হওয়া অসম্ভব।
যদি কিছু সংখ্যা দিতে হয়, এই আর্টিকেল লিখার সময়, ক্যাগল প্রতিষ্ঠার প্রায় ১২ বছর পর, বর্তমানে ৮+ মিলিয়ন ইউজারের মাঝে:
গ্র্যান্ডমাস্টার আছেন:
- কম্পিটিশনে মাত্র ২৫৬ জন,
- ডাটাসেটসে মাত্র ২৫ জন,
- নোটবুকসে মাত্র ৮৮ জন,
- ডিস্কাশনে মাত্র ৫৫ জন ; এবং
মাস্টার আছেন:
- ডাটাসেটসে মাত্র ৫২ জন,
- নোটবুকসে মাত্র ৯৪ জন,
- ডিস্কাশনে মাত্র ৩৪৩ জন।
বাংলাদেশের ক্যাগলারস:
বাংলাদেশ হতে এখন পর্যন্ত ক্যাগলে ২ জন গ্র্যান্ডমাস্টার ও ১৩ জন মাস্টার আছেন। মোট ১৫ জন মাত্র! সুতরাং, বোঝাই যাচ্ছে তাদের এচিভমেন্ট টা কত্তো বড়! (তথ্যসূত্র: Kaggle Grand/Masters Map by steubk)
বাংলাদেশের প্রথম গ্রান্ডমাস্টার হলেন, Mobassir Hossen (Linkedin : Mobassir Hossen – Double GrandMaster – Kaggle | LinkedIn | Kaggle: Mobassir | Grandmaster | Kaggle )। ২০২০ সালের ২ ফেব্রুয়ারি তিনি ক্যাগলের নোটবুকস গ্রান্ডমাস্টার হন। তিনি ড্যাফোডিল ইন্টারন্যাশনাল ইউনিভার্সিটি থেকে সফটওয়্যার ইঞ্জিনিয়ারিং এ ব্যাচেলরস ডিগ্রি পাশ করেন। তিনি বাংলাদেশের একমাত্র ডাবল গ্রান্ডমাস্টার। ২০২০ সালেরই ২৪শে মার্চ তিনি ডিস্কাশনস সেগমেন্টেও গ্র্যান্ডমাস্টার হন।
বাংলাদেশের দ্বিতীয় ক্যাগল গ্রান্ডমাস্টার হলেন, Md Awsafur Rahman (Linkedin: Md Awsafur Rahman – Notebook Grandmaster & Competition Master – Kaggle | LinkedIn | Kaggle: Awsaf | Grandmaster | Kaggle )। তিনিও ক্যাগলের নোটবুকস গ্রান্ডমাস্টার। তিনি বুয়েট এর ইইই তে পড়াশোনা করছেন।
বিশ্বের মোট ২৩ জন ডাবল গ্র্যান্ডমাস্টারের মাঝে বাংলাদেশের ১ জন, ৮৮ জন নোটবুকস গ্র্যান্ডমাস্টারের মধ্যে বাংলাদেশের ২ জন আছেন; ডিস্কাশনে মাত্র ৫৫ জন গ্র্যান্ডমাস্টারের মধ্যে আমাদের ১ জনের উপস্থিতি আমাদের জন্য অনেক গর্বের।