Classification Algorithm And It's Types
जैसे की हम Last Post मे Supervised Learning के बारे मे पढ़ चुके है तो उसी को और आगे बढ़ाते हुए आज हम Supervised
Learning के Type के बारे मे विस्तार से पढ़ेंगे तो आज हम Supervised Learning Algorithe के Classification Algorithm के
बारे मे जानेगे विस्तार से तो चलिए सुरु करते है और अगर आपने Supervised Learning के बारे मे नहीं पढ़ा तो मे आपसे
Request करूँगा की आप पहले Supervised Learning के बारे मे जान लीजिये नहीं तो आज आपको Classification Algorithm के बारे
मे कुछ नहीं समझ आएगा।
यहाँ से पढ़े :- Supervised Learning.
तो जैसा की हमने Last Post मे पढ़ चुके है की Classification
Algorithm क्या होती है इसके Types और भी बहुत कुछ फिर भी मे आपको थोड़ा सा Recall करा देता हु. Classification Algorithm
की मदत से Datasets को Categories में बांटा जाता है, यहाँ पर अलग-अलग Parameters या Attributes के आधार पर Datasets को
Categories में बाँट दिया जाता है,
उदाहरण के तोर पर जैसे Gmail अपने Mail Data को Categories में बाँट देता है,जैसे
:-Email, SPAM,advertisement, Promotion इत्यादि, तो यदि आपको Data का Output Categories में चाहिए तो वहां पर
Classification Algorithm का उयपोग किया जाएगा। तो जब हमे किसी एसी Problem को solve करना है जहा पर Datasets Categories
मे है तो हम Classification Algorithm का उपयोग कर सकते है जैसे उदारहण के लिए जैसे हमे हमारे पास एक Handwriting style
का Datasets है तो हमे Handwriting के style के आधार पर हमे ये बताना है की ये Male है या Femail. तो हमारी जो
Pridiction होगी वो Categories मे होगी जेसे Male और Femal तो जब हमारा Output Categories मे होतो हम Classification
Algorithm का Use करते है। तो जैसे की हमने पढ़ा था की Classification को भी 2 Catogorie मे बाटा गया है।
- Binary Classification/Single Class Classification
- Multi Class Classification
तो अब एक - एक इन दोनो के मे Detail मे जानते है। Single Class Classification :- Single Class Classification का उपयोग जब लिया जाता है जब Data को सिर्फ 2 Catogorie classify करना हो तो Single Class Classification का Use किया जाता है जैसे True या False और Yes या No. इसे Binary Classification नाम से भी जाना जाता है। Multi Class Classification :- वही Multi Class Classification का उपयोग जब लिया जाता है जब Data को सिर्फ 2 से अधिक Catogorie classify करना हो तो Multi Class Classification का Use किया जाता है जैसे Color की Catogorie Red ,Blue और Green आदि। ये कुछ Algorithms है जो Classification Problems मे उपयोग ली जाती है
- Decision Trees
- Random Forests
- Neural Networks
- K-Nearest Neighbors(KNN)
- Support Vector Machines(SVM)
- Naive Bayes
तो चलिए इन Algorithms के बारे मे थोड़ा बहुत Introduction देख लेते है आगे विस्तार से इनके बारे मे उदहारण और Programme
की मदत से समझेंगे क्योकि ये थोड़े बड़े Topic है अगर इसी Artical मे बताऊंगा तो ये बहुत बड़ा Article हो जायेगा और शायद आप
बोर भी हो जाये तो Tention मत करीये आगे आपको हर चीज बताई जाएगी वो भी with Practical .
तो सबसे पहले हम बात करते है K-Nearest Neighbor Algorithm के बारे में।
K-Nearest Neighbor Algorithm
K-Nearest Neighbor Algorithm का उपयोग Classification के सात सात Regression Problems मे भी किया जाता है पर ज्यादा तर
इसका Use Classification Problems को Solve किया जाता है।
अगर K-Nearest Neighbor Algorithm की बात करे तो ये सबसे Simple और आसान Machine Learning Algorithm मे से एक आती है। अब
बात करते है की ये और Algorithm से अलग कैसे है और कोनसे Method पर काम करती है तो K-Nearest Neighbor Algorithm अगर आप
थोड़ा धयान दे तो आप इसके नाम मे इसका काम समझ सकते हो K-Nearest Neighbor Algorithm मतलब ये अपने Nearest Neighbor Data
और उसके Features के आधार पर New Data को Define या Catagaries करता है।
K-Nearest Neighbor Algorithm ये अपनी Traning Phase मे ये New Dataset को सिर्फ Store करता है और जब इसको New Dataset
मिलता है तो ये अपने पुराने Dataset और Features के आधार पर उसको categories कर देता है अगर उसके Features अलग होते है तो
वो new Catagaries बना देता है ऐसे ये Data के हिसाब से new categories बना देता है .
अब इसको थोड़ा Example से समझने की कोशिस करते है।
Example 1 :
चलो मे आपको Gernel Life का Example देता हु जैसा की आपने देखा होगा और सायद किया भी होगा मान लीजिये आपके घर कोई मेहमान
आये है और आप उनके लिए चाय बना रहे है और आपको पता चला की घर में तो चीनी तो खत्म हो गयी और आज किराने की दूकान भी बंद
अब तो आप क्या करोगे वही जो हर कोई करता है अपने पडोसी(Neighbor) के पास जायेंगे पर आप उन्ही के पास जायेगे जो पास मे
होगा और आपको लगता है यहाँ चीनी मिल सकती है भले आपको पता है की दूर वाले पडोसी के पास भी मिल सकती है पर आप अपने पास
वाले पडोसी को चुनोगे जहा आपको उम्मीद है की यहाँ मेरा काम हो जायेगा।
Example 2 :
मान लीजिये आपके पास 2 categories है categories 1 और categories 2 और जब New Data आता है तो ये देखता है की इसका Data
और Feature किस categories के ज्यादा Match खाते है तो बहुत की categories मे से चुना जाता है मतलब ये अपने Nearest
Neighbor Data के आधार पर categories किया जायेगा. जैसा की आप ऊपर Image मे देख सकते हो।
इसकी Working हम Next Post मे Detail मे जानेंगे.
Support Vector Machine
Support Vector Machine Algorithms को हम बाकि की तरह Classification Problems और regression Problems दोनों तरह की Problems को Solve करने के लिए Use करते है पर हम Classification Algorithms के बारे में पढ़ रहे है तो Classification मे कैसे Use की जाती है वो पढ़ेंगे।
तो इस Algorithms को हम Daigram की मदत से समझते है जैसा की आप ऊपर Daigram 1 मे देख सकते है हमारे पास दो catagories है मे data है red bols मे और Squre shape मे अगर मे कहु आप इस Data को 2 अलग Catogari मे Devide करना है तो आप आसानी से कर सकते जैसा की आप Daigram 1 मे देख सकते हो आप अलग अलग Lines से Devide या Classcife कर सकते हो जो की एक तरह से ठीक है पर पूरी तरह से सही भी नहीं है क्योकि आप देख सकते हो कोई Line किस point के ज्यादा करबी है तो कोई Point Line ज्यादा ही दूर तो इस Problem को Solve करने के लिए हम दूसरी Approch Use कर सकते है.
जैसा की आप दूसरे Daigram 2 मे देख सकते हो हमने इस बार जो Class A या Catagorie A और Class B या Catagorie B के सबसे
करीब Point पर हमने एक Line Draw कर दी ऐसे ही दूसरी तरफ और इन दोनों Lines के बिच बराबर Margin मे एक Hyper Vector Line
खीच दी याद रखे Hyper Vector Line Support Vector Line 1 और Support Vector Line2 दोनों के बिच बराबर Margin होना चाइये
अब आप देख सकते हो हर Point Hyper Line से दोनों तरह बराबर दुरी पर है पहले वाले Daigram 1 मे सही नहीं था तो इसी तरह से
Classification को Support Vector Machine कहते है.
दोस्तों जरूरी नहीं की हर बार हमे ऐसे ही Case मिले मतलब ऐसा Dataset मिले इसमें तो आसान था पर अगर हमे n -Daimention
वाला डाटा मिले तो जैसा की आप निचे Image मे देख सकते हो।
तो इस Condition मे हम Data को उसके Features या Attribute के हिसाब से n - Daimention मे बाँट देते है जैसे की आप Image मे 3 - Daimention का example देख सकते हो, यहाँ पर Daimention मतलब उसके Features या Attribute होंगे।
Decision Trees Classifier Algorithm
वैसे अगर आप Computer Science Field से होतो आपने DSA(Data Structures And lgorithm) मे इसके बारे मे पढ़ा होगा अगर नहीं तो मे आपको समझाता हु Decision Trees जैसा की इसके नाम मे इसका अर्थ छुपा है ये Decision लेता है मतलब जैसे बहुत सारा डाटा है उसमे से ये Decide करेगा और 2 Catagari मे बाट देगा पर इसकी खासियत ये है की ये Problems को तब तक बाटता रहता है जब तक इसको आगे बाटा ना जा सके इसको आप पैड की तरह समझ सकते हो जैसे उसका इस Core root होती फिर उसकी बहुत सी शाखा होती है फिर उन शाखाओ मे से छोटे तने मे बटा होते है फिर उन तनो मे से छोटे छोटे पतों मे devide होती है तो अब सायद आप समझ चुके होंगे की इसको Decision Trees क्यों कहा जाता है। तो इस प्रकार Decision Trees Algorithm का उपयोग Classification Problems मे लिया जाता है Problems को अलग - अलग Catagori मे बताता रहता है जब तक मुमकिन हो।
जैसे की आप ऊपर Image मे देख सकते हो हम Decision Trees Classifier Algorithm का use करके एक ऐसा Classifier बनाना चाहते
है जो User के Input के आधार पर वो बताये की अगर वो फ्री है तो क्या कर सकता है और नहीं तो क्या करे तो ऊपर के Example
को समझते है सबसे पहले Input होगा की क्या वो Free है तो user का Answer Yes और No ही हो सकता तो इसने 2 catagorie मे
devide कर दिया अगर free तो 2 Output Pridict कर सकता है अगर User Yes कहता है Yes तो Output होगा Stay In और No होता है
उसके आधार पर एक और Tree Form मे Qustion होगा और ये जब तक नहीं रुकेगा तब तक ये Final Pridiction या Output नहीं दे
देता जैसा की आप Daigram में देख सकते हो।
दोस्तों मे आपको बता दू की इसका Use Classification Problems मे ही नहीं regression Problems मे भी किया जाता है।
Random Forests / random decision forests Classifier Algorithm
Random Forests Algorithm Ensemble learning method उपयोग करता है अब आप सोच रहे होंगे की भाई अब ये कोनसा learning method आ गया दोस्तों
Ensemble learning वो Ensemble learning method होता है जिसमे जो पहले से Algorithms है उनका Use कर के एक New Algorithm
बनाई जाती है ताकि एक बेहतर Pridiction के लिए और Random Forests Algorithm , Decision Trees Algorithm उपयोग करतीं है ,
दोस्तों Random Forests या इसे एक और नाम से भी जाना जाता है random decision forests Algorithm इसका भी Use
Classification Problems और regression Problems दोनों मे Use किया जाता है।
Naive Bayes Classifier
Naive Bayes Classifier किसी Dataset मे ये Posiblity को Calculate करता है की ये ये perticulart Data इस Catagory से
belog करता है की है या नहीं जैसे Text analaysis मे हम check कर सकते है की ये perticulart String या Pharases इस
Catagrie से belong करते है या नहीं चलो एक Example से समझते है मान lijiye हम एक ऐसा Model तैयार कर रहे है जो Title को
पढ़ कर वो Decide कर सके की ये Sport catogari की news है या नहीं अगर होगी तो वो इसको Label कर देगा Sport और अगर नहीं
तो Not Sport Label कर देगा।
तो दोस्तों उम्मीद है की आप को समझ आया होगा मेने पूरी कोसिस करी है की जितना simple भाषा मे समझा सकू फिर भी अगर कोई
Point नहीं समझ आता तो Comment Box मे कमेंट कर के हमें बताये मे पूरी कोसिस करूँगा आपकी Query solve करने की.
Thank You जल्द मिलते है New पोस्ट में।
Nice article sir.
ReplyDelete#máxx
Thank you #máxx.
Delete