एसोसिएशन रूल लर्निंग एक मशीन लर्निंग तकनीक है जो बड़े डेटासेट में आइटम के सेट के बीच दिलचस्प संबंध, या 'एसोसिएशन' की खोज करने के लिए डेटा माइनिंग का लाभ उठाती है। यह ज्ञान-आधारित दृष्टिकोण विभिन्न डेटा-संचालित क्षेत्रों में एक मौलिक उपकरण है, जैसे कि मार्केट बास्केट विश्लेषण, वेब उपयोग खनन, घुसपैठ का पता लगाना और निरंतर उत्पादन।
अतीत की यात्रा: एसोसिएशन नियम सीखने की शुरुआत
एसोसिएशन रूल लर्निंग, एक डेटा माइनिंग तकनीक के रूप में, 1990 के दशक के मध्य में मान्यता प्राप्त हुई, मुख्य रूप से खुदरा उद्योग में इसके सफल कार्यान्वयन के कारण। एसोसिएशन रूल बनाने के लिए पहला प्रमुख एल्गोरिदम 'एप्रिओरी एल्गोरिदम' था, जिसे 1994 में राकेश अग्रवाल और रामकृष्णन श्रीकांत ने प्रस्तुत किया था। यह अध्ययन बिक्री डेटा की विशाल मात्रा का विश्लेषण करके खरीद पैटर्न को पहचानने के प्रयास से सामने आया।
एसोसिएशन नियम सीखने में गहन गोता
एसोसिएशन रूल लर्निंग एक नियम-आधारित मशीन लर्निंग तकनीक है जिसका उद्देश्य बड़े डेटासेट में आइटम के एक सेट के बीच दिलचस्प एसोसिएशन या सहसंबंध खोजना है। खोजे गए नियमों को अक्सर "अगर-तो" कथनों के रूप में व्यक्त किया जाता है। उदाहरण के लिए, यदि कोई ग्राहक ब्रेड और मक्खन (पूर्ववर्ती) खरीदता है, तो उसके दूध (परिणामी) खरीदने की संभावना है। यहाँ, "ब्रेड और मक्खन" और "दूध" आइटमसेट हैं।
एसोसिएशन रूल लर्निंग में नियम मूल्यांकन के लिए दो प्राथमिक उपाय 'समर्थन' और 'विश्वास' हैं। 'समर्थन' एक आइटमसेट की घटना की आवृत्ति को मापता है, जबकि 'विश्वास' पूर्ववर्ती को देखते हुए परिणामी में आइटम की संभावना को दर्शाता है। एक अन्य उपाय, 'लिफ्ट', पूर्ववर्ती के बेचे जाने पर परिणामी की बिक्री के अनुपात में वृद्धि के बारे में जानकारी प्रदान कर सकता है।
एसोसिएशन नियम सीखने की शारीरिक रचना
एसोसिएशन नियम सीखने में तीन मुख्य चरण शामिल हैं:
- आइटमसेट निर्माण: उन आइटम या घटनाओं के सेट की पहचान करना जो अक्सर एक साथ घटित होते हैं।
- नियम निर्माण: इन आइटमसेट से संबद्धता नियम निर्माण करना।
- नियमों में कटौती: ऐसे नियमों को हटाना जो समर्थन, आत्मविश्वास और उत्थान जैसे मापदंडों के आधार पर उपयोगी होने की संभावना नहीं रखते हैं।
एप्रिओरी सिद्धांत, जो सुझाव देता है कि लगातार आइटमसेट का एक उपसमूह भी लगातार होना चाहिए, एसोसिएशन नियम सीखने का आधार बनाता है। यह सिद्धांत असंभावित एसोसिएशनों को छाँटकर कम्प्यूटेशनल लागत को कम करने में महत्वपूर्ण है।
एसोसिएशन नियम सीखने की मुख्य विशेषताएं
एसोसिएशन नियम सीखने की कुछ परिभाषित विशेषताएं हैं:
- यह अपर्यवेक्षित है: इसमें पूर्व सूचना या लेबलयुक्त डेटा की कोई आवश्यकता नहीं है।
- मापनीयता: बड़े डेटासेट को संसाधित कर सकता है।
- लचीलापन: विभिन्न क्षेत्रों और क्षेत्रों में लागू किया जा सकता है।
- छिपे हुए पैटर्न की खोज: यह उन संबंधों और सहसंबंधों को उजागर कर सकता है जो तुरंत स्पष्ट नहीं हो सकते हैं।
एसोसिएशन नियम सीखने के प्रकार
एसोसिएशन नियम सीखने के एल्गोरिदम को मोटे तौर पर दो प्रकारों में वर्गीकृत किया जा सकता है:
- एकल-आयामी संघ नियम सीखना: इस प्रकार में, एसोसिएशन नियम के पूर्ववर्ती और परिणामी आइटमसेट हैं। इसका उपयोग आमतौर पर मार्केट बास्केट विश्लेषण में किया जाता है।
- बहुआयामी संघ नियम सीखना: यहाँ, नियमों में डेटा के विभिन्न आयामों या विशेषताओं के आधार पर शर्तें शामिल हो सकती हैं। इस प्रकार का उपयोग अक्सर रिलेशनल डेटाबेस में किया जाता है।
कुछ व्यापक रूप से प्रयुक्त एसोसिएशन नियम सीखने के एल्गोरिदम हैं:
कलन विधि | विवरण |
---|---|
संभवतः | उम्मीदवार आइटमसेट की गणना करने के लिए ब्रॉडथ-फर्स्ट खोज रणनीति का उपयोग करता है। |
एफपी-ग्रोथ | यह डेटाबेस को एक सघन, अधिक सघन संरचना में संपीड़ित करने के लिए विभाजन-और-विजय दृष्टिकोण का उपयोग करता है, जिसे एफपी-ट्री के रूप में जाना जाता है। |
शोभा | यह एप्रीओरी एल्गोरिथम के पारंपरिक चौड़ाई-प्रथम दृष्टिकोण के स्थान पर गहराई-प्रथम खोज रणनीति का उपयोग करता है। |
एसोसिएशन नियम सीखने का उपयोग: उपयोग, चुनौतियाँ और समाधान
एसोसिएशन नियम सीखने का अनुप्रयोग विभिन्न क्षेत्रों में होता है, जिनमें शामिल हैं:
- विपणनउत्पाद संघों की पहचान करना और विपणन रणनीतियों में सुधार करना।
- वेब उपयोग खननउपयोगकर्ता व्यवहार की पहचान करना और वेबसाइट लेआउट में सुधार करना।
- चिकित्सा निदानरोगी की विशेषताओं और रोगों के बीच संबंध ढूंढना।
यद्यपि एसोसिएशन नियम सीखने से महत्वपूर्ण लाभ मिलते हैं, लेकिन इसमें निम्नलिखित समस्याएं भी आ सकती हैं:
- बड़ी संख्या में उत्पन्न नियम: बड़े डेटाबेस के लिए बहुत ज़्यादा संख्या में नियम बनाए जा सकते हैं। समर्थन और विश्वास सीमा को बढ़ाकर या नियम निर्माण के दौरान बाधाओं का उपयोग करके इसे कम किया जा सकता है।
- नियमों की व्याख्या करने में कठिनाई: जबकि उत्पन्न नियम एक संबंध का संकेत दे सकते हैं, वे जरूरी नहीं कि कार्य-कारण संबंध दर्शाते हों। सावधानीपूर्वक व्याख्या की आवश्यकता है।
समान तकनीकों के साथ तुलना
यद्यपि एसोसिएशन रूल लर्निंग अन्य मशीन लर्निंग और डेटा माइनिंग तकनीकों के साथ कुछ समानताएं साझा करती है, फिर भी इनमें स्पष्ट अंतर हैं:
तकनीक | विवरण | समानताएँ | मतभेद |
---|---|---|---|
एसोसिएशन नियम सीखना | वस्तुओं के एक समूह के बीच लगातार पैटर्न, संबंध या सहसंबंध ढूंढता है | बड़े डेटासेट के साथ काम कर सकते हैं; अपर्यवेक्षित | लक्ष्य मान का पूर्वानुमान नहीं करता |
वर्गीकरण | श्रेणीबद्ध लेबल की भविष्यवाणी करता है | बड़े डेटासेट के साथ काम कर सकते हैं | पर्यवेक्षित; लक्ष्य मान की भविष्यवाणी करता है |
क्लस्टरिंग | समान उदाहरणों को उनकी विशेषताओं के आधार पर समूहित करें | अपर्यवेक्षित; बड़े डेटासेट के साथ काम कर सकता है | नियमों की पहचान नहीं करता; केवल डेटा को समूहीकृत करता है |
एसोसिएशन नियम सीखने का भविष्य
जैसे-जैसे डेटा की मात्रा और जटिलता बढ़ती जा रही है, एसोसिएशन रूल लर्निंग का भविष्य आशाजनक दिख रहा है। वितरित कंप्यूटिंग और समानांतर प्रसंस्करण में विकास बड़े डेटासेट में एसोसिएशन रूल लर्निंग के लिए प्रसंस्करण समय को तेज कर सकता है। इसके अलावा, आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग में प्रगति से अधिक परिष्कृत और सूक्ष्म एसोसिएशन रूल लर्निंग एल्गोरिदम बन सकते हैं जो जटिल डेटा संरचनाओं और प्रकारों को संभाल सकते हैं।
एसोसिएशन नियम सीखना और प्रॉक्सी सर्वर
प्रॉक्सी सर्वर का उपयोग विभिन्न वेबसाइटों पर उपयोगकर्ता व्यवहार डेटा एकत्र करने और एकत्र करने के लिए किया जा सकता है। उपयोगकर्ता व्यवहार पैटर्न को समझने, सेवा में सुधार करने और सुरक्षा बढ़ाने के लिए एसोसिएशन रूल लर्निंग का उपयोग करके इस डेटा को संसाधित किया जा सकता है। इसके अलावा, प्रॉक्सी डेटा संग्रह को गुमनाम कर सकते हैं, गोपनीयता और नैतिक अनुपालन सुनिश्चित कर सकते हैं।
सम्बंधित लिंक्स
एसोसिएशन रूल लर्निंग के बारे में अधिक जानने में रुचि रखने वालों के लिए, यहां कुछ उपयोगी संसाधन दिए गए हैं: