सह-संबंध

सहसंबंध क्या है:

सहसंबंध का मतलब दो चीजों, लोगों या विचारों के बीच समानता या संबंध है । यह एक समानता या समानता है जो दो अलग-अलग परिकल्पनाओं, स्थितियों या वस्तुओं के बीच मौजूद है।

सांख्यिकी और गणित के क्षेत्र में, सहसंबंध दो या अधिक संबंधित चर के बीच एक माप को संदर्भित करता है।

सहसंबंध शब्द एक स्त्रीलिंग संज्ञा है जो लैटिन कोरेल्टेन से उत्पन्न होती है ।

सहसंबंध शब्द को पर्यायवाची शब्द जैसे: संबंध, समीकरण, सांठगांठ, पत्राचार, सादृश्य, और संबंध से बदला जा सकता है।

सहसंबंध गुणांक

आंकड़ों में, पियर्सन सहसंबंध गुणांक (आर), जिसे उत्पाद-पल सहसंबंध गुणांक भी कहा जाता है, एक ही मीट्रिक पैमाने के भीतर दो चर के बीच संबंध को मापता है।

सहसंबंध गुणांक का कार्य संबंधों की तीव्रता को निर्धारित करना है जो डेटा या जानकारी के ज्ञात सेटों के बीच मौजूद है।

सहसंबंध गुणांक का मान -1 और 1 के बीच भिन्न हो सकता है और प्राप्त परिणाम परिभाषित करता है कि सहसंबंध नकारात्मक है या सकारात्मक।

गुणांक की व्याख्या करने के लिए यह जानना आवश्यक है कि 1 का मतलब है कि चर के बीच सहसंबंध पूर्ण सकारात्मक है और -1 का अर्थ है कि यह पूर्ण नकारात्मक है । यदि गुणांक 0 के बराबर है, तो इसका मतलब है कि चर एक दूसरे पर निर्भर नहीं हैं।

आंकड़ों में स्पीयरमैन सहसंबंध गुणांक भी है, जो सांख्यिकीविद् चार्ल्स स्पीयरमैन के सम्मान में इस नाम को धारण करता है। इस गुणांक का कार्य दो चर के बीच संबंधों की तीव्रता को मापना है, चाहे वे रैखिक हों या नहीं।

स्पीयरमैन सहसंबंध मूल्यांकन करने का कार्य करता है यदि दो विश्लेषण किए गए चर के बीच संबंधों की तीव्रता को एक नीरस फ़ंक्शन (गणितीय फ़ंक्शन जो प्रारंभिक आदेश संबंध को संरक्षित या निष्क्रिय करता है) द्वारा मापा जा सकता है।

पियर्सन सहसंबंध गुणांक की गणना

विधि 1) सहसंयोजक और मानक विचलन का उपयोग करके पियर्सन सहसंबंध गुणांक की गणना।

जहाँ

एस _{एक्सवाई} सहसंयोजक है;

S _x और S _y, चर x और y के क्रमशः मानक विचलन का प्रतिनिधित्व करते हैं।

इस मामले में, गणना में पहले चर के बीच सहसंयोजन और उनमें से प्रत्येक के मानक विचलन को शामिल करना शामिल है। फिर, covariance को मानक विचलन के गुणा से विभाजित किया जाता है।

अक्सर, बयान पहले से ही चर के मानक विचलन, या उनके बीच सहसंयोजक प्रदान करता है, बस सूत्र को लागू करके।

विधि 2) कच्चे डेटा (बिना सहसंबंध या मानक विचलन) के साथ पियर्सन सहसंबंध गुणांक की गणना।

इस विधि के साथ, सबसे प्रत्यक्ष सूत्र इस प्रकार है:

उदाहरण के लिए, यह मानते हुए कि हमारे पास दो चर के n = 6 अवलोकनों के साथ डेटा है: ग्लूकोज स्तर (y) और आयु (x), गणना निम्नलिखित चरणों का पालन करती है:

चरण 1) मौजूदा डेटा के साथ तालिका का निर्माण करें: i, x, y, और xy, x² और y: के लिए रिक्त कॉलम जोड़ें।

चरण 2: "xy" कॉलम को भरने के लिए x और y को गुणा करें। उदाहरण के लिए, पंक्ति 1 में हमारे पास होगा: X1y1 = 43 × 99 = 4257।

चरण 3: स्तंभ x के मान बढ़ाएँ, और स्तंभ x in में परिणाम रिकॉर्ड करें। उदाहरण के लिए, पहली पंक्ति में हमारे पास x ₁ 2 = 43 × 43 = 1849 होगा।

चरण 4: चरण 3 के समान ही करें, अब y कॉलम का उपयोग करें और अपने मूल्यों के वर्ग को y² कॉलम में रिकॉर्ड करें। उदाहरण के लिए, पहली पंक्ति में हमारे पास होगा: y ₁ 2 = 99 × 99 = 9801।

चरण 5: सभी कॉलम संख्याओं का योग प्राप्त करें और परिणाम को कॉलम पाद लेख में रखें। उदाहरण के लिए, आयु X स्तंभ का योग 43 + 21 + 25 + 42 + 57 + 59 = 247 के बराबर है।

चरण 6: सहसंबंध गुणांक प्राप्त करने के लिए उपरोक्त सूत्र का उपयोग करें:

इस प्रकार, हमारे पास:

स्पीयरमैन का सहसंबंध गुणांक

स्पीयरमैन के सहसंबंध गुणांक की गणना कुछ अलग है। इसके लिए, हमें अपना डेटा निम्न तालिका में व्यवस्थित करना होगा:

1. डेटा के 2 जोड़े होने के बाद, हमें उन्हें तालिका में पेश करना चाहिए। उदाहरण के लिए:

2. कॉलम "रैंकिंग ए" में हम उन टिप्पणियों को वर्गीकृत करेंगे जो "तिथि ए" में बढ़ते हुए तरीके से हैं, "1" कॉलम में सबसे कम मूल्य है, एन (टिप्पणियों की कुल संख्या), कॉलम "तिथि ए में उच्चतम मूल्य" "। हमारे उदाहरण में यह है:

3. हम कॉलम "रैंकिंग बी" प्राप्त करने के लिए ऐसा ही करते हैं, अब कॉलम "डेटा बी" में टिप्पणियों का उपयोग कर रहे हैं:

4. कॉलम "डी" में हम दो रैंकिंग (ए - बी) के बीच अंतर रखते हैं। यहां सिग्नल मायने नहीं रखता।

5. कॉलम "d" में प्रत्येक मान बढ़ाएँ और कॉलम d the में रिकॉर्ड करें:

6. कॉलम "d²" से सभी डेटा जोड़ें। यह मान Σd² है। हमारे उदाहरण में ourd² = 0 + 1 + 0 + 1 = 2

7. अब हम स्पीयरमैन के फॉर्मूले का उपयोग करते हैं:

हमारे मामले में, n 4 के बराबर है, जैसा कि हम डेटा की पंक्तियों की संख्या को देखते हैं (जो टिप्पणियों की संख्या से मेल खाती है)।

8. अंत में, हम पिछले सूत्र में डेटा को प्रतिस्थापित करते हैं:

रैखिक प्रतिगमन

रैखिक प्रतिगमन एक चर (y) के संभावित मूल्य का अनुमान लगाने के लिए उपयोग किया जाने वाला एक सूत्र है जब अन्य चर (x) के मान ज्ञात होते हैं। "X" का मूल्य स्वतंत्र या व्याख्यात्मक चर है और "y" निर्भर चर या प्रतिक्रिया है।

रैखिक प्रतिगमन का उपयोग यह सत्यापित करने के लिए किया जाता है कि "y" का मान चर "x" के फ़ंक्शन के रूप में कैसे भिन्न हो सकता है। प्रसरण जाँच के मानों वाली रेखा को रेखीय प्रतिगमन रेखा कहा जाता है।

यदि व्याख्यात्मक चर "x" का एकल मान है, तो प्रतिगमन को सरल रेखीय प्रतिगमन कहा जाएगा।