ट्रेंड रणनीतियाँ

मॉडल वर्गीकरण

मॉडल वर्गीकरण

कचरा वर्गीकरण को आसानी से पूरा करने के लिए Python का उपयोग करें (छवि मान्यता के आधार पर)

यह देखकर, क्या आप अचानक दूध चाय पीना नहीं चाहते हैं, हाहा. हालाँकि, यह कोई फर्क नहीं पड़ता। हालांकि कचरा वर्गीकरण को निष्पादित करने की आवश्यकता है, दूध की चाय भी पिया जा सकती है.

इसलिए, यहां हम चर्चा करना चाहते हैं कि आर्टिफिशियल इंटेलिजेंस और डेटा साइंस की विधि हमें बेहतर कचरा वर्गीकरण बनाने में मदद कर सकती है?इसलिए हमें इस बारे में चिंता करने की ज़रूरत नहीं है कि किस कचरे को फेंकना हो सकता है.

2 सोच

इस समस्या के एक से अधिक समाधान हो सकते हैं. यहाँ जेड को आकर्षित करने और कुछ सरल अंतर्दृष्टि प्रदान करने के लिए सिर्फ एक ईंट है.

पहला समाधान कचरे की जानकारी तालिका -आधारित डेटा में बना सकता है, और फिर पारंपरिक मशीन सीखने की विधि का उपयोग कर सकता है.

दूसरी योजना को सभी कचरा वर्गीकरण जानकारी को एक ज्ञान मानचित्र में बनाया जाता है। प्रत्येक क्वेरी एक शब्दकोश की तरह जानकारी की जाँच करने जैसा है.

तीसरे समाधान का उपयोग वर्तमान गहरे सीखने के तरीकों की मदद से कचरे को पहचानने और वर्गीकृत करने के लिए किया जा सकता है. हर बार जब हम कचरे की तस्वीर देते हैं, तो मॉडल को यह पहचानने दें कि यह किस श्रेणी में है: सूखा कचरा, गीला कचरा, हानिकारक कचरा या पुनर्नवीनीकरण कचरा.

3 छवि वर्गीकरण

छवि वर्गीकरण गहरी सीख का एक क्लासिक अनुप्रयोग है. इसका इनपुट एक चित्र है, और फिर कुछ प्रसंस्करण के माध्यम से, एक गहन शिक्षण मॉडल दर्ज करें, यह मॉडल इस तस्वीर में कचरे की श्रेणी में लौट आएगा. यहां हम चार श्रेणियों पर विचार करते हैं: शुष्क कचरा, गीला कचरा, हानिकारक कचरा या पुनर्नवीनीकरण कचरा.

अखबार: पुनर्नवीनीकरण कचरा

निपटान बॉक्स: सूखी कचरा

हम चित्र में आइटम को वर्गीकृत करते हैं, यह छवि प्रसंस्करण और मान्यता का क्षेत्र है. आर्टिफिशियल इंटेलिजेंस में, इस प्रकार की समस्या को हल करने के लिए कन्व्यूशनल न्यूरल नेटवर्क्स (Convolutional Neural Network, CNN) का उपयोग.

मैं keras पैकेज और Tensorflow बैक एंड के साथ एक मॉडल का निर्माण करूंगा. क्योंकि प्रशिक्षण सेट के नमूनों में अस्थायी रूप से कमी है, आप केवल यहां विचारों और कोड का एक सेट दे सकते हैं।. प्रशिक्षण मॉडल के प्रशिक्षण से पहले, डेटा की एक लहर का प्रदर्शन किया जाना चाहिए.

आइए एक नज़र डालते हैं कि कोड कैसा दिखता है

पहले कुछ आवश्यक पैकेज आयात करें.

ऊपर, हमने कुछ चर को इनिशियलाइज़ किया, batch size 128 है; num_classes = 4, क्योंकि वर्गीकरण की संख्या 4 है, चार प्रकार के शुष्क कचरा, गीला कचरा, हानिकारक कचरा और पुनर्नवीनीकरण कचरा है. epochs हम उस समय की संख्या है जिसे हम प्रशिक्षित करना चाहते हैं. अगला, img_rows, img_cols = 28, 28 हमने चित्र का अक्षांश दिया.

में, reshape(60000,28,28,1), 60000 चित्रों की संख्या (चर) है, 28 चित्र का आकार है (समायोज्य), और 1 channel, channel = 1 का अर्थ है, काले और सफेद तस्वीरों को संदर्भित करता है. .reshape(10000,28,28,1) भी समान है, लेकिन चित्रों की संख्या 10000 है.

अंतिम दो पंक्तियों में, हमने अपने लक्ष्य चर के मूल्य को एक दूसरी श्रेणी में बदल दिया, जिसे एक वेक्टर (मैट्रिक्स) द्वारा दर्शाया गया है. उदाहरण के लिए, सूखे कचरे को संदर्भित करता है, गीला कचरा और इतने पर संदर्भित करता है.

अगला मॉडलिंग पार्ट है.

हमने मॉडल में प्रवेश करने के लिए कन्व्यूशनल लेयर और पूलिंग लेयर को जोड़ा. सक्रियण फ़ंक्शन है relu,relu फ़ंक्शन लगभग व्यापक रूप से कन्व्यूशनल न्यूरल नेटवर्क और डीप लर्निंग में उपयोग किया जाता है. हमने ओवरफिटिंग को कम करने के लिए परतों और परतों के बीच dropout भी जोड़ा. Dense layer का उपयोग श्रेणी की भविष्यवाणी करने के लिए किया जाता है.

मॉडल के निर्माण के बाद, हमें सटीकता सुनिश्चित करने के लिए मॉडल को सत्यापित करने की आवश्यकता है.

इस बिंदु पर, हमारा मॉडलिंग पूर्वानुमान संभवतः पूरा हो गया है. एक अच्छा मॉडल इसे अनुकूलित करना और सटीकता और अन्य संकेतकों में सुधार करना जारी रखना चाहिए, जब तक कि यह स्वीकार्य डिग्री तक नहीं पहुंचता.

अनुकूलन की प्रक्रिया, हम यहां गहराई से चर्चा नहीं करेंगे, और जारी रखेंगे.

4 समन

यह ध्यान देने योग्य है कि यद्यपि विधि संभव है, यह वास्तविक संचालन में अधिक जटिल होना चाहिए, विशेष रूप से सटीकता के लिए उच्च आवश्यकताओं.

और जब एक तस्वीर में कई प्रकार के कचरे होते हैं, जो हमारे वर्गीकरण मॉडल के विकास को बहुत जटिल बना देगा और कठिनाई को बढ़ाएगा.

उदाहरण के लिए, हम एक कप दूध की चाय को वर्गीकृत करना चाहते हैं। फोटो में कई कचरा प्रकार होते हैं, जो अपेक्षाकृत बड़ा है, क्योंकि यह एक ही श्रेणी नहीं है.

सड़क में कठिनाइयाँ होनी चाहिए, लेकिन यह साझा करने के लिए यहां साझा करने के लिए एक शुरुआती बिंदु है।.

आखिरकार, ली बाई ने यह भी कहा, "कभी -कभी लंबी हवा लहरों को तोड़ती है, और बादलों को सीधे लटका दिया जा सकता है।".

CG AGDO Data Entry Operator Question Paper 2021 With Answer Key

CG Sahayak Grade 3 Question Paper 2021 PDF Download

CG AGDO Model Answer

छत्तीसगढ़ डाटा एंट्री ऑपरेटर क्वेश्चन पेपर 2021

CG Vyapam AGDO Question Paper 2021 PDF Download

सहायक ग्रेड -3 एवं डाटा एंट्री ऑपरेटर संयुक्त भर्ती 2021

EXAM DATEDate 19-12-2021

CG Sahayak Grade 3 Avm Data Entry Operator Question Paper 2021 PDF Download : छत्तीसगढ़ सहायक ग्रेड -3 एवं डाटा एंट्री ऑपरेटर संयुक्त भर्ती का एग्जाम 19 दिसम्बर 2021 को हुआ जिसका Question Paper पीडीऍफ़ इस वेबसाइट में आपको देखने को मिलेगा

CG AGDO Question Paper 2021

CG Data Entry Operator model answer 2021

मॉडल वर्गीकरण CG Sahayak Grade 3 question paper 2021 pdf download

CG AGDO Solution 2021

CG VYAPAM Data Entry Operator 2021 Model Answer

छत्तीसगढ़ सहायक ग्रेड -3 एवं डाटा एंट्री ऑपरेटर परीक्षा 19 12-2021 का हल प्रश्न पत्र

Chhattisgarh AGDO Exam Answer Key 19 December 2021

CG AGDO Question Paper 2021 With Answers Hindi

EXAM-CG AGDO -21
प्रथम प्रश्न-पत्र /Question Paper-I
छत्तीसगढ़ का सामान्य ज्ञान, भाषा एवं योग्यता परीक्षा CG GK/General Studies

अंक : 200
Exam date : 19 दिसंबर 2021

SET – D

  1. इस प्रश्न-पत्र में 100 प्रश्न हैं । प्रत्येक प्रश्न 2 अंक का है ।
  2. प्रश्नों के उत्तर देने की विधि सम्बन्धी निर्देश जो आखिरी पृष्ठ पर दिये गये हैं, ध्यान से पढ़िये । प्रश्नों के उत्तर, दी गई उत्तर-शीट (आन्सर शीट) पर अंकित कीजिये ।
  3. किसी भी तरह के कैलकुलेटर या लॉग टेबल एवं मोबाइल फोन का प्रयोग वर्जित है।
  4. कोरोना वायरस से से बचाव के लिए मास्क का उपयोग करें

CG AGDO Question Paper 2021

CGPSC AGDO 2021 Question Paper Pdf Download CLICK HERE

प्रश्नों का आंसर आपको कल देखने को मिलेगा

(2) राज्य का सामान्य ज्ञान

1. सूची- | (नगर) का सूची – || (नदी) से मिलान कीजिए और सूचियों के नीचे दिए गए कूट से सही

CTET 2022: जीन पियाजे के सिद्धांत से जुड़े ऐसे सवाल जो सीटेट परीक्षा में हर बार पूछे जाते हैं, एक बार जरूर पढ़े

Jean Piaget Theory Most Repeated Question for CTET: केंद्रीय माध्यमिक शिक्षा बोर्ड के द्वारा प्रतिवर्ष आयोजित की जाने वाली सीटेट परीक्षा के माध्यम से अभ्यर्थी आगामी शिक्षक भर्ती परीक्षा में आवेदन करने का अवसर प्राप्त होता है। इस बार यह परीक्षा आने वाले दिसंबर माह के दूसरे व तीसरे सप्ताह से कई चरणों में और माध्यम से आयोजित की जाएगी, जिसके लिए आवेदन की प्रक्रिया अभी जारी है जो कि 24 नवंबर तक चलेगी। यहां रोजाना नियमित रूप से परीक्षा के पैटर्न के अनुसार प्रैक्टिस सेट उपलब्ध कराए जाते हैं इसी क्रम में आज के इस लेख में Jean पियाजे के सिद्धांत पर आधारित प्रश्नों (Jean Piaget Theory Most Repeated Question for CTET) को साझा किया है, अतः इस टॉपिक से परीक्षा में एक या दो अंक के प्रश्न अवश्य पूछे जाते हैं इसीलिए परीक्षा में सम्मिलित होने से पूर्व सवालों को एक नजर अवश्य पढ़ ले।

सीटीईटी 2022 ऑनलाइन एग्जाम में पूछे जाने वाले ‘जीन पियाजे’ के सिद्धांत से जुड़े संभावित सवाल, यहां पढ़िए—Jean Piaget Theory Expected MCQ for CTET Exam 2022

Q. एक छोटी बालिका प्रतीकात्मक खेल कर पाती है पर अभी दूसरे व्यक्ति का दृष्टिकोण नहीं समझ पाती है और वह अपनी पकड़ से बाहर की घटनाओं की वजह से आसानी से परेशान हो जाती है। जीन पियाजे द्वारा सुझाए चरणों में से कौन-सा चरण, इस बालिका के वर्तमान स्तर को अंकित करता है।

(c) मूर्त संक्रियात्मक

(d) औपचारिक संक्रियात्मक

Ans- b

Q. पियाजे द्वारा अधिगम को सुगम बनाने के लिए निम्नलिखित में से कौन-से कारक महत्त्वपूर्ण माने जाते हैं?

l. शिक्षक की गतिशीलता i.

ii. विविध सामग्रियों का प्रावधान

iii. मध्य स्तरीय नवीन अनुभव प्रदान करना

iv. सकारात्मक और नकारात्मक पुनर्बलन सुनिश्चित करना

Ans- b

Q. किस स्तर पर बच्चों में अपने आस-पास की दुनिया के बारे में एक जीववादी दृष्टिकोण होता है और वे मानते हैं कि पेड़-पौधों और चलते हुए बादलों और लुढ़कते पत्थरों की मंशाएँ और इरादे हो सकते हैं?

(a) संवेदी चालक अवस्था

(b) पूर्व संक्रियात्मक अवस्था

(c) मूर्त संक्रियात्मक अवस्था

(d) अमूर्त संक्रियात्मक अवस्था

Ans- b

Q. जीन पियाजे के अनुसार पूर्व-संक्रियात्मक चरण में बच्चे निम्न में से क्या कर पाते हैं?

(b) प्रतीकात्मक खेल

(c) अनुक्रमिक वर्गीकरण

Ans- b

Q. पियाजे के अनुसार आनुवंशिक रूप से क्रमादेशिक जैविक परिवर्तनों का होना क्या कहलाता है?

(a) संतुलन / equilibration

(b) अनुकूलन/ adaption

(c) परिपक्वता / maturation

(d) सामाजिक प्रसारण / social transmission

Ans- c

Q. पाँच वर्षीय नसीमा को यह लगता है कि चिकनी मिट्टी के गोले को यदि दबा कर एक साँप के रूप में परिवर्तित करें तो चिकनी मिट्टी बढ़ जाती है। जीन पियाजे के अनुसार उसकी इस सोच के पीछे कौन-सा तर्क है?

(c) परिकल्पित निगमनात्मक

(d) संक्रमक परिणाम निकलना

Ans- b

Q. जीन पियाजे के सिद्धांत में, क्रमबद्धता किस संदर्भ में प्रयोग हुआ है-

(a) वस्तुओं को किसी एक आयाम जैसे – ‘लंबाई’ पर आधारित क्रम देना

(b) दूसरों का परिपेक्ष लेने की क्षमता

(c) चिन्तन का वर्णनात्मक रूप, जैसा कहानी कथन में होता है

(d) स्थानों, मॉडल वर्गीकरण जैसे ‘अपने विद्यालय’ का स्थानकीय मानचित्रण की क्षमता

Ans- a

Q. जीन पियाजे के अनुसार, एक सतत प्रक्रिया जो मानसिक संरचनाओं को परिष्कृत और परिवर्तित करती है —————– कहलाती है।

(a) नकल उतारने और व्यवहार / Deferred Imitation

(b) वस्तु – स्थायित्व / Object Permanece

(c) समावेशन / Asismilation

(d) संतुलीकरण / Equilibration

Ans- d

Q. पियाजे के सिद्धांत में संज्ञानात्मक प्रणाली के लिए स्कीमाओं को पुनर्व्यवस्थित करना, उन्हें स्कीमाओं से जोड़ने को क्या कहा जाता है। ?

(a) समायोजन / Assimilation.

(b) अनुकूलन / Accommodation.

(c) संगठन / Organization.

(d) परिपक्वता / Maturation.

Ans- c

Q. ————— में बच्चे मानसिक रूप से समस्याओं को हल कर सकते हैं लेकिन समस्याओं को स्वयं सामग्री से संबंधित होना चाहिए, न कि प्रतीकों से।

(a) अमूर्त संक्रियात्मक अवस्था । / Formal operational

(b) मूर्त संक्रियात्मक अवस्था । / Concrete operational

(c) संवेदी-चालाक अवस्था । / Sensori-motor

(d) पूर्व संक्रियात्मक अवस्था / Pre-operational

Ans- b

Q. जीन पियाजे के संज्ञानात्मक सिद्धांत के अनुसार, बच्चे किस अवस्था में अवस्था में वस्तुओं को कहे गए क्रम में लगाने की योग्यता पा लेते हैं?

(a) सावेदिक पेशीय / Sensory motor

(b) पूर्व संक्रियात्मक / Pre operational

(c) मूर्त संक्रियात्मक / Concrete operational

(d) अमूर्त संक्रियात्मक / Formal operational

Ans- c

Q. एक बच्चे को तीन पर्वतों का एक थ्री डी (त्रिआयामी) मॉडल दिखाया जाता है। एक अन्य व्यक्ति इस मॉडल को एक भिन्न जगह से देख रही है। बच्चे को इस दूसरे व्यक्ति के दृष्टि क्षेत्र से देखे गए मॉडल को बनाने के लिए कहा जाता है पर वह सही तरीके से नहीं कर पाता। जीन पियाजे के अनुसार यह क्या दर्शाता है?

(c) वस्तु स्थायित्व

(d) परिकल्पनात्मक चिंतन

Ans- a

Q. जीन पियाजे के अनुसार सीखने के लिए निम्नलिखित में से क्या सबसे आवश्यक है?

(a) पुनर्बलन का सजा

(b) विद्यार्थियों द्वारा सक्रिय खोजबीन

(c) अवलोकन एवं अनुकरण

(d) भाषात्मक विकास जो सामाजिक अंतः क्रिया को सुसाध्य करता है।

Ans- b

Q. बालिका स्वयं से क्या कर सकती है और क्या कुछ सहायता द्वारा पूरा कर सकती है। लेब ब्यागोत्सकी ने इनके बीच के अंतर को किस रूप में संबोधित किया है?

(b) समीपस्थ विकास का क्षेत्र

Ans- a

Q. जीन पियाजे ने प्रतिपादित किया कि बच्चों के सोचने की प्रक्रिया वयस्कों ……….. |

मॉडल वर्गीकरण

निर्णय ट्री का उपयोग करके आप एक वर्गीकरण मॉडल कैसे बनाते हैं?

किसी भी निर्णय वृक्ष एल्गोरिथ्म के पीछे मूल विचार इस प्रकार है:

  1. रिकॉर्ड्स को विभाजित करने के लिए विशेषता चयन उपायों (एएसएम) का उपयोग करके सर्वोत्तम विशेषता का चयन करें।
  2. उस विशेषता को निर्णय नोड बनाएं और डेटासेट को छोटे सबसेट में तोड़ दें।

निर्णय वृक्ष में वर्गीकरण का उपयोग कैसे किया जाता है?

डिसीजन ट्री रिप्रेजेंटेशन : डिसीजन ट्री इंस्टेंस को रूट से पेड़ को कुछ लीफ नोड में सॉर्ट करके वर्गीकृत करते हैं, जो इंस्टेंस का वर्गीकरण प्रदान करता है।

निर्णय वृक्ष के लिए किस प्रकार का डेटा उपयुक्त है?

गैर-रैखिक डेटा सेट को प्रभावी ढंग से संभालने के लिए निर्णय पेड़ों का उपयोग किया जाता है। डिसीजन ट्री टूल का उपयोग वास्तविक जीवन में कई क्षेत्रों में किया जाता है, जैसे इंजीनियरिंग, सिविल प्लानिंग, कानून और व्यवसाय। निर्णय वृक्षों को दो प्रकारों में विभाजित किया जा सकता है; श्रेणीबद्ध चर और निरंतर परिवर्तनशील निर्णय वृक्ष।

जब हम वर्गीकरण पर विचार करते हैं तो डेटा को प्रीप्रोसेस करने के लिए निम्नलिखित में से कौन सा सही कदम है?

15. प्रतिगमन या वर्गीकरण करते समय, निम्न में से कौन सा डेटा प्रीप्रोसेस करने का सही तरीका है? व्याख्या: आपको पहले डेटा को हमेशा सामान्य बनाना होगा। यदि नहीं, तो पीसीए या अन्य तकनीकें जो आयामों को कम करने के लिए उपयोग की जाती हैं, अलग-अलग परिणाम देंगी।

निर्णय वृक्ष वर्गीकरण के प्रमुख चरण क्या हैं?

  • चरण 1: पेड़ की जड़ का निर्धारण करें।
  • चरण 2: कक्षाओं के लिए एन्ट्रापी की गणना करें।
  • चरण 3: प्रत्येक विशेषता के लिए विभाजन के बाद एन्ट्रापी की गणना करें।
  • चरण 4: प्रत्येक विभाजन के लिए सूचना लाभ की गणना करें।
  • चरण 5: स्प्लिट करें।
  • चरण 6: आगे विभाजन करें।
  • चरण 7: निर्णय वृक्ष को पूरा करें।

निर्णय वृक्ष कितने प्रकार के होते हैं?

निर्णय ट्री एल्गोरिदम के 4 लोकप्रिय प्रकार हैं: ID3, CART (वर्गीकरण और प्रतिगमन पेड़), ची-स्क्वायर और विचरण में कमी।

वर्गीकरण के लिए किस प्रकार के आउटपुट डेटा का उपयोग किया जाता है?

वर्गीकरण एल्गोरिदम का उपयोग असतत डेटा के साथ किया जाता है। रिग्रेशन में, हम सबसे अच्छी फिट लाइन खोजने की कोशिश करते हैं, जो आउटपुट का अधिक सटीक अनुमान लगा सकती है। वर्गीकरण में, हम निर्णय सीमा को खोजने का प्रयास करते हैं, जो डेटासेट को विभिन्न वर्गों में विभाजित कर सकता है।

कौन सी एक आवश्यक प्रक्रिया है जहां डेटा पैटर्न निकालने के लिए बुद्धिमान तरीकों को लागू किया जाता है?

डेटा माइनिंग यह एक आवश्यक प्रक्रिया है जहां डेटा पैटर्न निकालने के लिए बुद्धिमान तरीकों को लागू किया जाता है। तरीके संक्षेपण, वर्गीकरण, प्रतिगमन, संघ या क्लस्टरिंग हो सकते हैं।

डेटा संरचनाओं में निर्णय वृक्ष क्या है?

एक निर्णय वृक्ष एक फ्लोचार्ट जैसी संरचना है जिसमें प्रत्येक आंतरिक नोड एक विशेषता पर "परीक्षण" का प्रतिनिधित्व करता है (उदाहरण के लिए एक सिक्का फ्लिप सिर या पूंछ आता है), प्रत्येक शाखा परीक्षण के परिणाम का प्रतिनिधित्व करती है, और प्रत्येक पत्ता नोड एक का प्रतिनिधित्व करता है वर्ग लेबल (सभी विशेषताओं की गणना के बाद लिया गया निर्णय)।

निर्णय वृक्ष तकनीक क्या है?

एक निर्णय वृक्ष एक निर्णय समर्थन उपकरण है जो एक पेड़ के समान निर्णयों के मॉडल और उनके संभावित परिणामों का उपयोग करता है, जिसमें मौका घटना के परिणाम, संसाधन लागत और उपयोगिता शामिल हैं। यह एक एल्गोरिथ्म प्रदर्शित करने का एक तरीका है जिसमें केवल सशर्त नियंत्रण विवरण होते हैं।

निर्णय वृक्ष के लिए खनन मॉडल कैसे बनाएं?

अधिक जानकारी के लिए, निर्णय ट्री मॉडल के लिए खनन मॉडल सामग्री (विश्लेषण सेवाएं – डेटा खनन) देखें।

वर्गीकरण के लिए निर्णय वृक्ष का निर्माण कैसे करें?

डिसीजन ट्री एक ट्री जैसी संरचना है जिसका उपयोग डेटा को वर्गीकृत करने के लिए एक मॉडल के रूप में किया जाता है। एक निर्णय वृक्ष अन्य उप-पेड़ों और/या पत्ती नोड्स से बने उप-पेड़ों में डेटा को विघटित करता है। प्रश्न यह है कि हम निर्णय वृक्ष कैसे बनाते हैं?

निर्णय ट्री मॉडल क्वेरी का उपयोग कब करें?

क्योंकि डिसीजन ट्री का उपयोग वर्गीकरण, रिग्रेशन और यहां तक कि एसोसिएशन सहित विभिन्न कार्यों के लिए किया जा सकता है, जब आप डिसीजन ट्री मॉडल पर एक प्रेडिक्शन क्वेरी बनाते हैं तो आपके पास आपके लिए कई विकल्प उपलब्ध होते हैं। आपको उस उद्देश्य को समझना चाहिए जिसके लिए भविष्यवाणी के परिणामों को समझने के लिए मॉडल मॉडल वर्गीकरण बनाया गया था।

निर्णय वृक्ष में वृक्षों को किस प्रकार संग्रहित किया जाता है?

प्रत्येक वृक्ष संरचना अपने स्वयं के नोड में संग्रहीत होती है। क्योंकि इस मॉडल में एक एकल पूर्वानुमान योग्य विशेषता है, केवल एक ट्री नोड है। हालांकि, अगर आप डिसीजन ट्री एल्गोरिथम का उपयोग करके एक एसोसिएशन मॉडल बनाते हैं, तो सैकड़ों पेड़ हो सकते हैं, प्रत्येक उत्पाद के लिए एक।

VotingClassifier in sсikit-learn: वर्गीकरण मॉडल का एक संयोजन का निर्माण और अनुकूलन

सेंटीमेंट एनालिसिस (समीक्षाओं का विश्लेषण) के बड़े कार्य के कार्यान्वयन के हिस्से के रूप में, मैंने कुछ समय इसके अलग-अलग तत्व के अतिरिक्त अध्ययन के लिए समर्पित करने का फैसला किया - वर्गीकरण मॉडल के कलाकारों की टुकड़ी के निर्माण के लिए एक उपकरण मॉडल वर्गीकरण के रूप में sklearn.ensemble मॉड्यूल से VotingClassifier का उपयोग करना और भविष्यवाणियों की अंतिम गुणवत्ता में सुधार करना। यह महत्वपूर्ण क्यों है और बारीकियों क्या हैं?

अक्सर ऐसा होता है कि डेटा विश्लेषण की लागू समस्या को हल करने के दौरान, यह तुरंत स्पष्ट नहीं है (या बिल्कुल स्पष्ट नहीं) जो प्रशिक्षण मॉडल सबसे उपयुक्त है। उपलब्ध डेटा की प्रकृति के आधार पर सबसे लोकप्रिय और / या सहज ज्ञान युक्त उपयुक्त मॉडल का चयन करने के लिए एक समाधान हो सकता है। इस मामले में, चयनित मॉडल के मापदंडों को अनुकूलित किया जाता है (उदाहरण के लिए, ग्रिडसर्चसीवी के माध्यम से) और इसका उपयोग कार्य में किया जाता है। एक अन्य दृष्टिकोण मॉडल के एक संयोजन का उपयोग करने के लिए हो सकता है जब उनमें से कई के परिणाम एक साथ अंतिम परिणाम के गठन में शामिल होते हैं। मैं अभी यह कहना चाहूंगा कि लेख का उद्देश्य मॉडल या इसके निर्माण के सिद्धांतों (यह
इस समस्या को हल करने के लिए , स्किट-लर्न लाइब्रेरी में एक वोटिंगक्लासीफायर मॉड्यूल है , जो कई का उपयोग करने, एक दूसरे से अलग, मशीन लर्निंग मॉडल और उन्हें एक क्लासिफायर में संयोजित करने के लिए एक उत्कृष्ट उपकरण है। मॉडल वर्गीकरण इससे रिट्रेनिंग का जोखिम कम होता है, साथ ही किसी एक विशेष मॉडल के परिणामों की गलत व्याख्या भी होती है। VotingClassifier मॉड्यूल को निम्न कमांड के साथ आयात किया जाता है :
from sklearn.ensemble import VotingClassifier

इस मॉड्यूल के साथ काम करते समय व्यावहारिक विवरण:

1) पहली और सबसे महत्वपूर्ण बात यह है कि इसमें शामिल प्रत्येक मॉडल से भविष्यवाणियां प्राप्त करने के बाद संयुक्त क्लासिफायरियर की एकल लिया गई भविष्यवाणी कैसे प्राप्त करें। वोटिंगक्लासीफायर मापदंडों के बीच दो संभावित मूल्यों के साथ एक वोटिंग पैरामीटर है: 'हार्ड' और 'सॉफ्ट'।

१.१) पहले मामले में, संयुक्त क्लासिफायर का अंतिम उत्तर इसके अधिकांश सदस्यों की "राय" के अनुरूप होगा। उदाहरण के लिए, आपका संयुक्त क्लासिफायर तीन अलग-अलग मॉडलों के डेटा का उपयोग करता है। विशिष्ट अवलोकन पर उनमें से दो प्रतिक्रिया "सकारात्मक प्रतिक्रिया" की भविष्यवाणी करते हैं, तीसरा - "नकारात्मक प्रतिक्रिया।" इस प्रकार, इस अवलोकन के लिए, अंतिम भविष्यवाणी "सकारात्मक प्रतिक्रिया" होगी, क्योंकि हमारे पास 2 - "फॉर" और 1 "विरुद्ध" है।

१.२) दूसरे मामले में, मतदान पैरामीटर के 'नरम' मूल्य का उपयोग करते समय, प्रत्येक वर्ग के लिए मॉडल भविष्यवाणियों का पूर्ण "वोटिंग" और भार होता है, इसलिए संयुक्त क्लासिफायर का अंतिम उत्तर अनुमानित संभावनाओं के योग का औसत होता है। महत्वपूर्ण! इस तरह के "मतदान" पद्धति का उपयोग करने में सक्षम होने के लिए, आपके पहनावा में शामिल लोगों में से प्रत्येक क्लासिफायरियर को प्रत्येक कक्षा में घटना की संभावना का एक मात्रात्मक अनुमान प्राप्त करने के लिए predict_proba () विधि का समर्थन करना चाहिए। कृपया ध्यान दें कि सभी क्लासिफायर मॉडल इस पद्धति का समर्थन नहीं करते हैं और तदनुसार, भारित संभावनाओं (सॉफ्ट वोटिंग) की विधि का उपयोग करते समय वोटिंगक्लासीफायर के ढांचे के भीतर इस्तेमाल किया जा सकता है।

आइए एक उदाहरण देखें : तीन क्लासीफायर हैं और समीक्षाओं के दो वर्ग हैं: सकारात्मक और नकारात्मक। प्रत्येक क्लासिफायरियर, predict_proba पद्धति के माध्यम से, एक निश्चित संभाव्यता मान (p) देगा, जिसके साथ एक विशेष अवलोकन कक्षा 1 को सौंपा गया है और तदनुसार, प्रायिकता (1-p) से कक्षा दो तक। प्रत्येक मॉडल से उत्तर प्राप्त करने के बाद, संयुक्त क्लासिफायर, प्राप्त अनुमानों का भार उठाता है और प्राप्त अंतिम परिणाम देता है।

$ $ प्रदर्शन $ $ अधिकतम (w1 * p1 + w2 * p1 + w3 * p1, w1 * P2 + w2 * P2 + w3 * p3) $$ प्रदर्शन $$

, जहाँ w1, w2, w3 आपके क्लासिफायर के वेट हैं, जो पहनावा में शामिल हैं, डिफ़ॉल्ट रूप से बराबर वेट कर रहे हैं, और p1, P2 उनमें से प्रत्येक के क्लास 1 या क्लास 2 से संबंधित है। कृपया यह भी ध्यान दें कि सॉफ्ट वोट का उपयोग करते समय क्लासिफायर के वज़न को वेट पैरामीटर का उपयोग करके बदला जा सकता है, इसलिए मॉड्यूल कॉल को इस तरह से देखा जाना चाहिए:
. = VotingClassifier(estimators=[('..', clf1), ('..', clf2), ('. ', clf3)], voting='soft', weights=[*,*,*]) , जहां तारांकन प्रत्येक मॉडल के लिए आवश्यक भार का संकेत दे सकता है।

2) पहनावा में शामिल प्रत्येक क्लासिफायर के हाइपरपैरमीटर को अनुकूलित करने के लिए मॉड्यूल VotingClassifier और GridSearch का एक साथ उपयोग करने की क्षमता।

जब आप एक कलाकारों की टुकड़ी का उपयोग करने की योजना बनाते हैं और चाहते हैं कि इसमें शामिल किए गए मॉडल को अनुकूलित किया जाए, तो आप पहले से ही एकीकृत क्लासिफायर पर ग्रिडसर्च का उपयोग कर सकते हैं। और नीचे दिए गए कोड से पता चलता है कि आप इसमें शामिल मॉडल के साथ कैसे काम कर सकते हैं (लॉजिस्टिक रिग्रेशन, भोले बे, स्टोचैस्टिक ग्रेडिएंट डिसेंट) जबकि एकीकृत क्लासिफायर (वोटिंगक्लासीफायर) के ढांचे के भीतर शेष:

इस प्रकार, params डिक्शनरी को सेट किया जाना चाहिए ताकि इसे GridSearch के माध्यम से एक्सेस करते समय, आप यह निर्धारित कर सकें कि मॉडल के कलाकारों की टुकड़ी में कौन सा पैरामीटर एक पैरामीटर को संदर्भित करता है जिसका मूल्य आप अनुकूलित करना चाहते हैं।

यह सब आपको मॉडल के कलाकारों की टुकड़ी के निर्माण और इसे अनुकूलित करने के तरीके के रूप में वोटिंगक्लासीफायर टूल का पूरी तरह से उपयोग करने के लिए जानना आवश्यक है। आइए परिणाम देखें:

मापदंडों के इष्टतम मूल्य पाए जाते हैं, यह इष्टतम मापदंडों के साथ क्लासिफायर्स (वोटिंगक्लासीफायर) के कलाकारों की टुकड़ी के लिए काम के परिणामों की तुलना करने के लिए रहता है, हम प्रशिक्षण नमूने पर क्रॉस-सत्यापन का संचालन करेंगे और इष्टतम मापदंडों के साथ मॉडल की तुलना करेंगे और उनमें से पहनावा शामिल होगा:मॉडल वर्गीकरण

सटीकता: 0.75 (± 0.02) [तार्किक प्रतिगमन]
सटीकता: 0.79 ((0.02) [Naive Bayes]
सटीकता: 0.79 (± 0.02) [SGD]
सटीकता: 0.79 ((0.02) [एनसेंबल_हार्डवोटिंग]

जैसा कि आप देख सकते हैं, मॉडल ने खुद को प्रशिक्षण के नमूने में कुछ अलग दिखाया (मानक मापदंडों के साथ, यह अंतर अधिक ध्यान देने योग्य था)। इसके अलावा, कलाकारों की टुकड़ी का कुल मूल्य (सटीकता मीट्रिक के अनुसार) इसमें शामिल मॉडलों से सर्वोत्तम मूल्य से अधिक नहीं है, क्योंकि पहनावा बल्कि एक अधिक स्थिर मॉडल है, जो टेस्ट सेट में और "लड़ाई" में एक समान परिणाम दिखाने में सक्षम है, जिसका अर्थ है कि रिट्रीटिंग के जोखिम को कम करना, प्रशिक्षण सेट के लिए फिटिंग, और प्रशिक्षण से संबंधित अन्य समस्याओं को वर्गीकृत करना। लागू समस्याओं को हल करने में गुड लक और आपके ध्यान के लिए धन्यवाद!

PS सैंडबॉक्स में प्रकाशन की बारीकियों और नियमों को देखते हुए, मैं इस आलेख में दिए गए विश्लेषण के लिए गिटहब और स्रोत कोड का लिंक प्रदान नहीं कर सकता, साथ ही इनक्लास प्रतियोगिता के ढांचे में कैगले से लिंक भी कर सकता हूं, जिसने इस पर मॉडल की जांच के लिए एक परीक्षण सेट और उपकरण प्रदान किए। मैं केवल यह कह सकता हूं कि यह पहनावा काफी हद तक बेस लाइन को हरा देता है और टेस्ट सेट की जाँच के बाद लीडरबोर्ड पर अपना सही स्थान ले लेता है। मुझे उम्मीद है कि निम्नलिखित प्रकाशनों में मैं साझा कर सकता हूं।

रेटिंग: 4.61
अधिकतम अंक: 5
न्यूनतम अंक: 1
मतदाताओं की संख्या: 74
उत्तर छोड़ दें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा| अपेक्षित स्थानों को रेखांकित कर दिया गया है *