কী করবো সামনে?

If we have data, let’s look at data. If all we have are opinions, let’s go with mine.

– Jim Barksdale, former Netscape CEO

অনেকটাই রিসার্চের ফসল এই বই। প্রথম বই, এবং তার পরের দ্বিতীয় সংস্করণ লিখতে গিয়ে বুঝলাম কয়েকটা গ্রাউন্ড রিয়েলিটি। কারণ, প্রচুর ফোন, মেসেজ পাবার পর এই ধারণাগুলো এসেছে আমার কাছে। মাঝেমধ্যে একটু "ওভার-হোয়েলমড" হয়ে গিয়েছিলাম এতোগুলো কমিউনিকেশন চ্যানেল নিয়ে, তবে সেগুলো আমাকে অনেক সাহায্য করেছে এই বইটা লিখতে। আপনাদের মেশিন লার্নিং রাস্তায় তোলার বই। মেশিন লার্নিং নতুন প্রযুক্তিতে অনেকটাই মাথার খেলা। অনেক দেশ প্রচুর ইনভেস্ট করছেন এই ফিল্ডে। জনবলে।

এখন আসি, আমার রিসার্চে। নতুন প্রজন্মদের মধ্যে একদল আছেন যারা ইংরেজি মাধ্যমে ফ্লুয়েন্ট এবং কৃত্রিম বুদ্ধিমত্ত্বা স্কিলসেট নিয়ে অনলাইনে খোঁজ খবর রাখেন। তাদের অনেক বন্ধুবান্ধব/আত্মীয় স্বজন দেশে বিদেশে থাকেন। বাইরে থেকে বই আনাও সমস্যা নয় তাদের। দ্বিতীয় দল, মেশিন লার্নিং ব্যাপারটা নিয়ে বেশ ইন্টারেস্টেড কিন্তু সরাসরি পথ পাচ্ছেন না - কারণ ব্যাপারটা অনেকটাই ওভার হাইপ্ড। ইন্টারনেটে প্রচুর ম্যাটেরিয়াল - কোথায় শুরু করবেন সেটা নিয়ে একটু সমস্যায় আছেন। তৃতীয় দল, ইংরেজিতে একটু সমস্যা আছে, অনলাইনের মিডিয়ামগুলোকে পুরোপুরি ফলো করতে পারেন না। তবে, জানার ইচ্ছে প্রবল। চতুর্থ দল চাকরির জন্য নতুন যেকোন প্রযুক্তি শিখতে রাজি। কীওয়ার্ড "চাকরি" পেতে হবে জিনিসটা শিখে। পঞ্চম দল, মেশিন লার্নিং ব্যাপারটা শুনতে রাজি নন, একদম শুরুতেই ডিপ লার্নিং, নিউরাল নেটওয়ার্ক ইত্যাদি। আমরা সবাই ফেরারি চালাতে চাই, কিন্তু বেসিক না জানলে ফেরারি কী কাজে দেবে?

এই বইটা সব দলের জন্য প্রযোজ্য। কারণ, বেসিক ঠিকমতো না জানার ফলে অনেকে বেশ ভেতরে ঢুকেও ইন্টারেস্ট হারিয়ে ফেলছেন এই নতুন প্রযুক্তি নিয়ে। "এন্ড টু এন্ড ইকোসিস্টেম" না বুঝলে এই সমস্যাটা হয় অনেকের। এই সমস্যাটার জন্য - যিনি শিখছেন তিনিও দায়ী নন। তিনি আসলে সিস্টেমেটিকভাবে একটা কমপ্লিট "এন্ড টু এন্ড" প্রজেক্ট করতে পারছেন না বলে ভেতরের অনেক কিছুই অজানা থেকে যাচ্ছে শেষে। এই সমস্যাটা আসল সমাধান হচ্ছে একটা বাস্তব/নিজের সমস্যা নিয়ে প্রসেস অনুযায়ী স্টেপ বাই স্টেপ সমাধান করা।

অনেককে দেখছি - একটা লেভেলে যাবার পর আর ভেতরে ঢুকতে পারছেন না। আর সেকারণে ডিপ লার্নিং নিয়ে লেখা বইটা শিঁকেয় তুলে নেমে গেলাম এই "হাঁটি হাঁটি পা পা পাইথন" সিরিজে। এখানে পুরো মেশিন লার্নিং গল্প নিয়ে আলাপ না করে একদম শুরুটা নিয়ে আলাপ করেছি। তাও শুধুমাত্র সুপারভাইজ্ড লার্নিং এর গোড়া দিয়ে। একদম বেসিক দিয়ে। পাইথনের মেশিন লার্নিং লাইব্রেরি হিসেবে সাইকিট লার্ন যে কতোটা জনপ্রিয় তা বোঝাতে আমাকে লিখতে হবে আরো কয়েকটা বই। "টেন্সর-ফ্লো" তো আরেকটা জিনিস।

আমার কাজ হচ্ছে আপনাকে রাস্তায় তুলে দেয়া, বাকিটা নিজেরাই খুঁজে নিতে পারবেন আশা করি। আমি ধারণা করছি, সামনে কী কী দেখতে চাইবেন আপনারা, সেটাই বলছি এখানে। দিয়ে দিচ্ছি কী কী বই আর সেগুলোর চ্যাপ্টারগুলো লাগবে আপনার। এই বইগুলোর ইনফ্লুয়েন্স অনেক বেশি আমার ওপর। একেকটা থেকে আরেকটা পাগল করা বই। ভাববেন না, পৃথিবীর সেরা বইগুলো সংগ্রহ করা আমার নেশা।

১. Learning scikit-learn: Machine Learning in Python, by Raúl Garreta, Guillermo Moncecchi - চ্যাপ্টার ২, টাইটানিক হাইপোথেসিস উইথ ডিসিশন ট্রিজ, প্রেডিকটিং হাউজ প্রাইসেস উইথ রিগ্রেশন, চ্যাপ্টার ৪, ফিচার এক্সট্রাকশন, ফিচার সিলেকশন, গ্রিড সার্চ ইত্যাদি।

২. Data Science from Scratch: First Principles with Python, by Joel Grus - চ্যাপ্টার ১১, মেশিন লার্নিং, চ্যাপ্টার ১২, কে নিয়ারেস্ট নেইবার্স চ্যাপ্টার ১৪, সিম্পল লিনিয়ার রিগ্রেশন, চ্যাপ্টার ১৭, ডিসিশন ট্রিজ।

৩. Python Data Science Handbook: Essential Tools for Working with Data, by Jake VanderPlas, - চ্যাপ্টার ৪, হাইপার-প্যারামিটার এন্ড মডেল ভ্যালিডেশন, ফিচার ইঞ্জিনিয়ারিং, ইন ডেপ্থ - লিনিয়ার রিগ্রেশন, রেগুলারাইজেশন ইন ডেপ্থ - ডিসিশন ট্রিজ এন্ড র‌্যান্ডম ফরেস্ট।

৪. Introduction to Machine Learning with Python: A Guide for Data Scientists by by Andreas C. Müller, Sarah Guido - চ্যাপ্টার ২, সুপারভাইজ্ড লার্নিং, চ্যাপ্টার ৫, মডেল ইভালুয়েশন, গ্রিড সার্চ উইথ ক্রস ভ্যালিডেশন, মেট্রিকস এন্ড স্কোরিং।

আর যারা যেতে চান আরো দূরে, বহুদূরে - অসাধারণ কিছু বই

৫. Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow by Sebastian Raschka, Vahid Mirjalili - চ্যাপ্টার ২, ট্রেনিং সিম্পল মেশিন লার্নিং এলগরিদম ফর ক্লাসিফিকেশন, চ্যাপ্টার ৩, এ ট্যুর অফ মেশিন লার্নিং ক্লাসিফায়ার ইউজিং সাইকিট লার্ন, চ্যাপ্টার ৩, বিল্ডিং গুড ট্রেনিং সেটস - ডেটা প্রি-প্রসেসিং

৬. Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems by Aurélien Géron - চ্যাপ্টার ২, এন্ড টু মেশিন লার্নিং প্রজেক্ট, ফাইন টিউন ইয়োর মডেল, চ্যাপ্টার ৩, ক্লাসিফিকেশন, পারফরমেন্স মেজার, চ্যাপ্টার ৪, ট্রেনিং মডেলস, চ্যাপ্টার ৭, এনসেম্বল লার্নিং এন্ড র‌্যান্ডম ফরেস্টস।

৭. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython by Wes McKinney - চ্যাপ্টার ৩, বিল্টইন ডেটা স্ট্রাকচার, ফাংশন। এটা একটা অসাধারণ বই, ডেটা অ্যানালাইসিসের জন্য।

৮. ডেটাস্কুলের কেভিন মার্কহামের শুরুর দিকের ভিডিও টিউটোরিয়াল: www.youtube.com/dataschool পাশাপাশি ডাক্সএর মেশিন লার্নিং এর অংক http://bit.ly/2Sp6h7A

৯. Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die by Eric Siegel - অসাধারণ একটা বই, পার্সপেক্টিভ পাবার জন্য। সময় থাকলে পুরো বই।

এরপর যদি মনে হয় আরো দরকার বই বাংলায়, এই পাইথন সিরিজের দ্বিতীয় বইটা লিখে ফেলবো সময় পেলে। তবে, এই বইটা শেষ করে "হাতেকলমে মেশিন লার্নিং" বইটার পাইথন দিয়ে করে দেয়া প্রজেক্ট টাইটানিক করতে ভুলবেন না। কিনতে হবে না, দুটো বইই দেয়া আছে অনলাইনে।

তবে, আপনাকে ছাড়ছি না এখনই। ছোট্ট একটা রেকমেন্ডার সিস্টেম তৈরি করার একটা ধারণা আর লিংক দিয়ে রাখছি আপনাদের জন্য। এতো কিছু শিখলাম সেটার একটা রিয়েল ওয়ার্ল্ড কানেকশন তৈরি করবো আমরা।