Mizan Institute of Technology - MiT🇪🇹 | United States America (US)
Create: Update:
ስለምንሰጣቸው ኮርሶች ማብራሪያ ✅ ክፍል 3️⃣
የዳታ ሳይንስ (Data Science): የመረጃን ምስጢር መፍታትና መተንተን!
ከዚህ በፊት ስለ ፉል ስታክ ዌብ ደቨሎፕመንት (ክፍል 1) እና በተወሰነ መልኩ ስለ ፕሮግራሚንግ ቋንቋዎች ጥቅል ገለፃ እና በተለይም ስለ ፓይተን (ክፍል 2) አይተናል። አሁን ደግሞ ወደ ዳታ ሳይንስ እንሸጋገራለን።
ዳታ ሳይንስ ምንድን ነው? ለምን ይጠቅማል? እንዴትስ እንማረው? እነዚህን እና ሌሎች ጥያቄዎችን እንመልሳለን።
✅ዳታ ሳይንስ ምንድን ነው? (What is Data Science?)
በዙሪያችን ያለው ዓለም በመረጃ (data) የተሞላ ነው። የአየር ሁኔታ፣ የሽያጭና የግብይት መረጃ፣ የማህበራዊ ሚዲያ ልጥፎች (ፖስቶች)፣ የጤና መረጃ፣ የትራፊክ ፍሰት፣ የትምህርት ተቋማት መረጃዎች፣ የመንግስትና የግል የአገልግሎት ተቋማት... ሁሉም መረጃ ነው። ግን ይህ መረጃ ብቻውን ብዙም ትርጉም የለውም። ልክ ያልተሰራና ያልተነጠረ አልማዝ ወይም ወርቅ ነው። የወርቅ ወይም የአልማዝ ማዕድን ተነጥሮና ተሠርቶ በቀለበት መልክ፣ በአንጌት ጌጥ መልክ፣ በጆሮ ጌጥ መልክ… ወዘረ ካልተዘጋጀ ዝም ብሎ ቅርፅ የሌለው ድቡልቡል ነገር ከሆነ ምን እንኳ ወርቅ ወይም አልማዝ ቢሆንም ምናችን ላይ እናደርገዋለን? ውበቱም ሆነ ጥቅሙ የሚታየን በጌጥ መልክ ለፈለግነው ነገር ሲዘጋጅ ነው።
ዳታ ሳይንስ ይህንን በየቦታው (በጤና ተቋማት፣ በግብርና ተቋማት፣ በትምህርት ተቋማት… ወዘተ) የሚገኝ ጥሬ መረጃ (raw data) ወስዶ፣ አቀናጅቶ፣ ተንትኖ፣ ትርጉም ያለው ድምዳሜ (insight) የሚያወጣበት ሂደት ነው። በሌላ አነጋገር፣ የመረጃን ምስጢር መፍታት እንደማለት ነው! ልክ ወርቅና አልማዙ ተነጥሮና በጌጥ መልክ ተሠርቶ ካላየነው በስተቀር ውበትና ጥቅሙ እንደማይታየን ሁሉ፤ በየቦታው የምናየውና የምናገኘው ጥሬ መረጃም ካልተቀናጀና ካልተተነተነ ትርጉም አይሰጠንም።
💰ዳታ ሳይንስ እንደ ታሪክ ተራኪ (Data Science as Storytelling)
ዳታ ሳይንስን ለመረዳት አንድ ምሳሌ እንውሰድ። አንድ መርማሪ (detective) የወንጀል ቦታ ላይ የተለያዩ ፍንጮችን (መረጃዎችን) ይሰበስባል። የጣት አሻራ፣ የደም ናሙና፣ የምስክሮች ቃል... እነዚህን ፍንጮች በማቀናጀት እና በመተንተን የወንጀለኛውን ማንነት እና የወንጀሉን ሂደት ይደርስበታል። ልክ እንደዚሁ፣ ዳታ ሳይንቲስትም የተለያዩ መረጃዎችን በመሰብሰብ፣ በማቀናጀት እና በመተንተን ጠቃሚ ድምዳሜዎችን ያገኛል። መረጃው የሚናገረውን ታሪክ ይገልፃል።
💰የዳታ ሳይንስ ጥቅሞች (Benefits of Data Science):
➡️የተሻሉ ውሳኔዎችን ማድረግ (Better Decision Making): ኩባንያዎች፣ መንግስታት፣ ግለሰቦች... ሁሉም የተሻሉ ውሳኔዎችን ለማድረግ ዳታ ሳይንስን መጠቀም ይችላሉ። ለምሳሌ፡- አንድ ኩባንያ የደንበኞቹን ፍላጎት በመተንተን የትኞቹን ምርቶች ማምረት እንዳለበት መወሰን ይችላል።
➡️አዳዲስ ግኝቶችን ማግኘት (Discovering New Insights): ዳታ ሳይንስ ከዚህ በፊት ያልታወቁ ነገሮችን ለማግኘት ይረዳል። ለምሳሌ፡- አዳዲስ የመድሃኒት ግኝቶችን፣ አዳዲስ የግብይት ስልቶችን።
➡️ችግሮችን መፍታት (Solving Problems): ዳታ ሳይንስ ውስብስብ ችግሮችን ለመፍታት ይረዳል። ለምሳሌ፡- የትራፊክ መጨናነቅን ለመቀነስ፣ የወንጀል መጠንን ለመቀነስ።
➡️የወደፊቱን መተንበይ (Predicting the Future): ዳታ ሳይንስ ያለፉትን መረጃዎች በመተንተን የወደፊቱን ለመተንበይ ይረዳል። ለምሳሌ፡- የአክሲዮን ገበያን ለመተንበይ፣ የደንበኞችን ባህሪ ለመተንበይ። 100% ፐርፌክት ላይሆን ይችላል፣ የሚተነብየውም ዝም ብሎ በደፈናው ሳይሆን ያለፉ መረጃዎችና ፍንጮች ላይ ተመርኩዞ ነው።
💰የስራ እድል (Career Opportunities): ዳታ ሳይንቲስቶች በአሁኑ ጊዜ በዓለም ላይ በጣም ተፈላጊ ከሆኑ ባለሙያዎች መካከል ናቸው። በተለይም አርቲፊሻል ኢንተሊጀንስ ከምንግዜውም በላይ እያደገ መምጣቱን ተከትሎ፣ ዳታ ሳይንቲስቶች ተፈላጊ ሆነዋል። ምክንያቱም ያለ ዳታ አርቲፊሻል ኢንተሊጀንስ ምሰሶ የሌለው ቤት ነው።
💰የዳታ ሳይንስ የስራ ሂደት (Data Science Workflow):
ዳታ ሳይንስ በአጠቃላይ የሚከተሉትን ደረጃዎች ያካትታል፡-
➡️ችግሩን መረዳት (Understanding the Problem): ምን አይነት ጥያቄ ነው መመለስ የምንፈልገው? ምን አይነት መረጃ ነው የሚያስፈልገን?
➡️መረጃ መሰብሰብ (Data Collection): ከድረ-ገጾች (web scraping), ከመረጃ ቋቶች (databases), ከዳሰሳ ጥናቶች (surveys)... መረጃዎችን መሰብሰብ።
➡️መረጃ ማጽዳት (Data Cleaning): የተሳሳቱ መረጃዎችን ማረም፣ የጎደሉ መረጃዎችን መሙላት... መረጃውን ለትንተና ዝግጁ ማድረግ።
➡️መረጃን መመርመር (Data Exploration): መረጃውን በግራፎች እና በቻርቶች መልክ ማየት፣ መሰረታዊ ስታቲስቲክሶችን (ለምሳሌ፡ አማካይ፣ መደበኛ መዛባት) ማስላት።
➡️ሞዴል መገንባት (Model Building): የማሽን ለርኒንግ ሞዴሎችን በመጠቀም መረጃውን መተንተን እና ትንበያዎችን ማድረግ።
➡️ውጤቶችን መገምገም (Model Evaluation): ሞዴሉ ምን ያህል ትክክለኛ እንደሆነ መገምገም። ይህን evaluate ማድረጊያ ራሳቸውን የቻሉ ሜትሪክሶች አሉ።
➡️ውጤቶችን ማስተላለፍ (Communicating Results): ውጤቶችን ለሌሎች ሰዎች (ለምሳሌ፡ ለደንበኞች፣ ለአለቆች) ግልፅ በሆነ መንገድ ማቅረብ።
💰በዳታ ሳይንስ ውስጥ ጥቅም ላይ የሚውሉ መሳሪያዎች (Tools Used in Data Science):
➡️Python (ፓይተን): ለዳታ ሳይንስ በጣም ታዋቂው የፕሮግራሚንግ ቋንቋ ነው። (ስለ ፓይተንክፍል 2ን ይመልከቱ!)
➡️NumPy: ለቁጥራዊ ስሌቶች።
➡️Pandas: መረጃዎችን ለማቀናጀት እና ለመተንተን።
➡️Matplotlib & Seaborn: መረጃዎችን በግራፍ እና በቻርት መልክ ለማሳየት።
➡️Scikit-learn: ለማሽን ለርኒንግ።
➡️R: ሌላው ታዋቂ የፕሮግራሚንግ ቋንቋ ለዳታ ሳይንስ።
➡️SQL: ከመረጃ ቋቶች (databases) ጋር ለመገናኘት የሚያገለግል ቋንቋ።
➡️Tableau & Power BI: መረጃዎችን የተገናኘ (interactive) በሆነ መልኩ ለማሳየት የሚያገለግሉ መሳሪያዎች።
➡️Jupyter Notebook/Lab.
➡️Excel. (አሁን ላይ በ5 ሚሊዮን ኮደርስ ላይ እንደ ጀማሪ የሚሰጠው ኮርስ)
✅በMizan Institute of Technology (MiT) የዳታ ሳይንስ ስልጠና የምንሸፍናቸው ርዕሶች (በዝርዝር):
✅የፕሮግራሚንግ መሰረታዊ ነገሮች (Programming Fundamentals): በፓይተን ላይ ትኩረት እናደርጋለን። (ክፍል 2ን ይመልከቱ!)
✅ስታቲስቲክስ (Statistics): መሰረታዊ የስታቲስቲክስ ፅንሰ-ሀሳቦችን እናስተምራለን።
✅የመረጃ አያያዝ (Data Handling): መረጃዎችን እንዴት መሰብሰብ፣ ማጽዳት፣ ማቀናጀት እና መተንተን እንደሚቻል እናስተምራለን።
✅የመረጃ ምስላዊነት (Data Visualization): መረጃዎችን በግራፎች እና በቻርቶች መልክ እንዴት ማሳየት እንደሚቻል እናስተምራለን።
✅ማሽን ለርኒንግ (Machine Learning): የተለያዩ የማሽን ለርኒንግ ስልተ-ቀመሮችን (algorithms) እናስተምራለን።