प्रतिगमन विश्लेषण में सहसम्बन्ध सांख्यिकीय घटना को संदर्भित करता है जहाँ एकाधिक प्रतिगमन मॉडल में दो या अधिक भविष्यवक्ता चर अत्यधिक सहसम्बन्धित होते हैं। यह मजबूत सहसम्बन्ध एक स्वतंत्र चर के सांख्यिकीय महत्व को कमज़ोर कर सकता है। यह प्रत्येक भविष्यवक्ता और प्रतिक्रिया चर के बीच संबंध का अनुमान लगाने में कठिनाइयाँ पैदा करता है, साथ ही मॉडल की व्याख्या करने की क्षमता भी।
समरेखता अवधारणा का विकास
कोलीनियरिटी की अवधारणा का पता 20वीं सदी की शुरुआत में लगाया जा सकता है। इसे शुरू में प्रसिद्ध अर्थशास्त्री, राग्नार फ्रिस्क ने पहचाना था, जिन्होंने अर्थमितीय मॉडलों का अध्ययन करते हुए पाया कि कोलीनियरिटी प्रतिगमन गुणांक में अस्थिरता और अप्रत्याशितता लाती है। इस अवधारणा ने 1970 के दशक में महत्वपूर्ण ध्यान आकर्षित किया, कम्प्यूटेशनल संसाधनों में उन्नति के कारण, जिसने सांख्यिकीविदों को जटिल प्रतिगमन विश्लेषण करने की अनुमति दी। आज, अर्थशास्त्र, मनोविज्ञान, चिकित्सा और सामाजिक विज्ञान जैसे विभिन्न क्षेत्रों में डेटा की बढ़ती जटिलता को देखते हुए, कोलीनियरिटी से निपटना प्रतिगमन मॉडलिंग का एक महत्वपूर्ण पहलू है।
प्रतिगमन विश्लेषण में समरेखता को स्पष्ट करना
बहु प्रतिगमन विश्लेषण में, लक्ष्य कई स्वतंत्र चर और एक आश्रित चर के बीच संबंध को समझना है। स्वतंत्र चर के गुणांक हमें बताते हैं कि उस स्वतंत्र चर में एक इकाई परिवर्तन के लिए आश्रित चर कितना बदलता है, बशर्ते कि अन्य सभी चर स्थिर रखे जाएं।
हालाँकि, जब इनमें से दो या अधिक स्वतंत्र चर अत्यधिक सहसंबद्ध (संरेखीयता) होते हैं, तो आश्रित चर पर प्रत्येक के प्रभाव को अलग करना मुश्किल हो जाता है। पूर्ण संरेखीयता, एक चरम मामला, तब मौजूद होता है जब एक भविष्यवक्ता चर को अन्य के पूर्ण रैखिक संयोजन के रूप में व्यक्त किया जा सकता है। इसके परिणामस्वरूप प्रतिगमन मॉडल विफल हो जाता है क्योंकि गुणांकों के लिए अद्वितीय अनुमानों की गणना करना असंभव हो जाता है।
समरेखता का आंतरिक तंत्र
कोलीनियरिटी के तहत, आश्रित चर में परिवर्तन को सहसंबद्ध स्वतंत्र चर के संयोजन द्वारा समझाया जा सकता है। ये चर मॉडल में अद्वितीय या नई जानकारी का योगदान नहीं करते हैं, जो पूर्वानुमानित गुणांकों के विचरण को बढ़ाता है। यह अस्थिरता प्रतिगमन गुणांक के अविश्वसनीय और अस्थिर अनुमानों की ओर ले जाती है जो डेटा में छोटे बदलावों के लिए काफी हद तक बदल सकते हैं, जिससे मॉडल डेटासेट के प्रति संवेदनशील हो जाता है।
समरेखता की मुख्य विशेषताएं
- विचरण की मुद्रास्फीति: समरेखता प्रतिगमन गुणांकों के विचरण को बढ़ा देती है, जिससे वे अस्थिर हो जाते हैं।
- मॉडल व्याख्या में बाधा: गुणांकों की व्याख्या चुनौतीपूर्ण हो जाती है क्योंकि प्रत्येक चर के प्रभाव को अलग करना कठिन होता है।
- कम हुई सांख्यिकीय शक्ति: इससे मॉडल की सांख्यिकीय शक्ति कम हो जाती है, जिसका अर्थ है कि गुणांकों के सांख्यिकीय रूप से महत्वपूर्ण पाए जाने की संभावना कम हो जाती है।
समरेखता के प्रकार
मुख्यतः समरेखता के दो प्रकार हैं:
- बहुसमरेखता: जब तीन या अधिक चर, जो उच्च लेकिन पूर्णतः रैखिक रूप से सहसम्बन्धित नहीं होते, को किसी मॉडल में शामिल किया जाता है।
- पूर्ण समरेखता: जब एक स्वतंत्र चर एक या अधिक अन्य स्वतंत्र चरों का पूर्ण रैखिक संयोजन होता है।
रिग्रेशन विश्लेषण में कोलिनियरिटी का प्रयोग: समस्याएं और समाधान
मॉडल की विश्वसनीयता और व्याख्यात्मकता को बेहतर बनाने के लिए प्रतिगमन विश्लेषण में कोलिनियरिटी को संभालना महत्वपूर्ण है। यहाँ सामान्य समाधान दिए गए हैं:
- विचरण मुद्रास्फीति कारक (वीआईएफ): एक माप जो यह अनुमान लगाता है कि बहुसमन्वयता के कारण अनुमानित प्रतिगमन गुणांक का प्रसरण कितना बढ़ जाता है।
- रिज रिग्रेशन: एक तकनीक जो संकुचन पैरामीटर के माध्यम से बहुसंरेखता से संबंधित है।
समरेखता और अन्य समान शब्द
समरेखता के समान कुछ शब्द यहां दिए गए हैं:
- सहप्रसरण: मापता है कि दो यादृच्छिक चर एक साथ कितने भिन्न होते हैं।
- सह - संबंध: दो चरों के बीच रैखिक संबंध की शक्ति और दिशा को मापता है।
जबकि सहप्रसरण सहसंबंध का एक माप है, समरेखता उस स्थिति को संदर्भित करती है जहां दो चर अत्यधिक सहसंबंधित होते हैं।
समरेखता पर भविष्य के परिप्रेक्ष्य
मशीन लर्निंग एल्गोरिदम की उन्नति के साथ, कोलिनियरिटी के प्रभावों को कम किया जा सकता है। प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) या रेग्यूलराइजेशन मेथड्स (लासो, रिज और इलास्टिक नेट) जैसी तकनीकें उच्च-आयामी डेटा को संभाल सकती हैं, जहां कोलिनियरिटी एक समस्या हो सकती है। आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग में आगे की प्रगति के साथ इन तकनीकों के और अधिक परिष्कृत होने की उम्मीद है।
प्रॉक्सी सर्वर और रिग्रेशन विश्लेषण में समरेखता
प्रॉक्सी सर्वर क्लाइंट और सर्वर के बीच मध्यस्थ के रूप में कार्य करते हैं, जो गुमनामी और सुरक्षा जैसे विभिन्न लाभ प्रदान करते हैं। रिग्रेशन विश्लेषण में कोलीनियरिटी के संदर्भ में, प्रॉक्सी सर्वर का उपयोग रिग्रेशन विश्लेषण से पहले डेटा एकत्र करने और प्रीप्रोसेस करने के लिए किया जा सकता है। इसमें कोलीनियरिटी की पहचान करना और उसे कम करना शामिल हो सकता है, खासकर जब बड़े डेटासेट को हैंडल करना हो जो कोलीनियरिटी से जुड़े मुद्दों को बढ़ा सकते हैं।
सम्बंधित लिंक्स
प्रतिगमन विश्लेषण में समरेखता के बारे में अधिक जानकारी के लिए, आप निम्नलिखित संसाधनों पर जा सकते हैं: