जब मैं sm.Logit (statsmodel लाइब्रेरी में) द्वारा लॉजिस्टिक रिग्रेशन चलाता हूं, तो परिणाम का हिस्सा इस तरह होता है:

छद्म आर-वर्ग: 0.4335

लॉग-संभावना: -291.08

एलएल-नल: -513.87

एलएलआर पी-वैल्यू: 2.978e-96

मैं मॉडल के महत्व को कैसे समझा सकता हूं? या कहें, समझाने की क्षमता? मुझे किस संकेतक का उपयोग करना चाहिए? मैंने ऑनलाइन खोज की है और छद्म R2 और LLR pvalue के बारे में अधिक जानकारी नहीं है। मैं उलझन में हूं कि मैं कैसे कह सकता हूं कि मेरा मॉडल अच्छा है।

9
R.Yan 12 अक्टूबर 2017, 05:02
stats.idre .ucla.edu/other/multi-pkg/faq/general/… statsmodels छद्म-R2 के लिए McFadden के समायोजित नहीं किए गए संस्करण का उपयोग करता है।
 – 
Josef
13 अक्टूबर 2017, 03:24

2 जवाब

एल्गोरिदमिक ट्रेडिंग के लिए हैंड्स-ऑन मशीन लर्निंग से:

  • Log-Likelihood: यह लॉग-संभावना फ़ंक्शन का अधिकतम मान है।
  • LL-Null: यह अधिकतम लॉग-लाइबिलिटी फ़ंक्शन का परिणाम है जब केवल एक अवरोधन शामिल होता है। यह छद्म-R^2 आंकड़े और लॉग-लाइकेलिहुड अनुपात ( LRR) परीक्षण (नीचे देखें)
  • pseudo-R^2: यह इसका एक विकल्प है परिचित R^2 कम से कम वर्गों में उपलब्ध है। इसकी गणना शून्य मॉडल m0 और पूर्ण मॉडल m1 के लिए अधिकतम लॉग-संभावना फ़ंक्शन के अनुपात के आधार पर की जाती है:

pseudo-R^2

मान 0 से भिन्न होते हैं (जब मॉडल संभावना में सुधार नहीं करता है) से 1 (जहां मॉडल पूरी तरह से फिट बैठता है और लॉग-संभावना 0 पर अधिकतम होती है)। नतीजतन, उच्च मूल्य एक बेहतर फिट का संकेत देते हैं।

  • LLR: एलएलआर परीक्षण आम तौर पर एक अधिक प्रतिबंधित मॉडल की तुलना करता है और इसकी गणना इस प्रकार की जाती है:

llr

शून्य परिकल्पना यह है कि प्रतिबंधित मॉडल बेहतर प्रदर्शन करता है लेकिन कम पी-मान बताता है कि हम इस परिकल्पना को अस्वीकार कर सकते हैं और शून्य मॉडल पर पूर्ण मॉडल को प्राथमिकता दे सकते हैं। यह रैखिक प्रतिगमन के लिए एफ-परीक्षण के समान है (जहां हम एमएलई का उपयोग करके मॉडल का अनुमान लगाते समय एलएलआर परीक्षण का उपयोग कर सकते हैं)।

  • z-statistic: रैखिक प्रतिगमन आउटपुट में t-सांख्यिकी के समान भूमिका निभाता है और समान रूप से गुणांक अनुमान और इसकी मानक त्रुटि के अनुपात के रूप में गणना की जाती है।

  • p-values: ये शून्य परिकल्पना मानते हुए परीक्षण आंकड़ों के अवलोकन की संभावना को इंगित करते हैं H0 कि जनसंख्या गुणांक शून्य है।

जैसा कि आप देख सकते हैं (और जिस तरह से मैं इसे समझता हूं), इनमें से कई मीट्रिक रैखिक प्रतिगमन मामले के समकक्ष हैं। इसके अलावा, जैसा कि रोज़ पहले ही बता चुके हैं, मैं आँकड़े मॉडल दस्तावेज़ की जाँच करने की अनुशंसा करता हूँ।

8
Community 20 जून 2020, 12:12
Z-सांख्यिकी के बारे में बेहतर व्याख्या के लिए, मैं इसका सुझाव देता हूं पोस्ट
 – 
Arturo Moncada-Torres
3 अप्रैल 2019, 17:52

p-value : यह आपको अपनी शून्य परिकल्पना का परीक्षण करने की अनुमति देगा। कम पी-मान (<0.05) इंगित करता है कि आप शून्य परिकल्पना को अस्वीकार कर सकते हैं। यदि आप इससे परिचित नहीं हैं तो मेरा सुझाव है: https://www.khanacademy.org/math/statistics-probability/significance-tests-one-sample/tests-about-population-mean/v/ परिकल्पना-परीक्षण-और-पी-मान

r-squared : मापें कि डेटा फिट की गई प्रतिगमन रेखा के कितने करीब है। यह परिवर्तनशील भिन्नता के प्रतिशत का प्रतिनिधित्व करता है जिसे एक रैखिक मॉडल द्वारा समझाया गया है।

हो सकता है कि यदि आप हमें अपने द्वारा बनाई गई परिकल्पनाओं और अपने प्रतिगमन के संदर्भ के बारे में अधिक विवरण दें, तो हम और अधिक मदद कर पाएंगे।

अन्य 2 (लॉग संभावना और एलएल नल), मैं कम परिचित हूं, लेकिन यहां कुछ संसाधन हैं जिन्हें देखने में मदद मिल सकती है:

https://en.wikipedia.org/wiki/Likelihood_function
http://www.statsmodels.org/stable/index.html
https://github.com/statsmodels/statsmodels
-3
Rose 12 अक्टूबर 2017, 08:33
आपका बहुत बहुत धन्यवाद! लेकिन मुझे लगता है कि p-value और r-squared की आपकी परिभाषा सामान्य प्रतिगमन के बारे में है, जबकि मैं लॉजिस्टिक प्रतिगमन कर रहा हूं। क्या एलएलआर पी-वैल्यू का सामान्य प्रतिगमन में एक ही अर्थ है? मेरा मतलब है, क्या मैं कह सकता हूं कि मेरा मॉडल महत्वपूर्ण है यदि मैं देखता हूं कि एलएलआर पी-वैल्यू 0.05 से कम है?
 – 
R.Yan
12 अक्टूबर 2017, 08:55
मैं सिर्फ sm.Logit का उपयोग करके एक सामान्य लॉजिस्टिक रिग्रेशन कर रहा हूं। मुझे लगता है कि शून्य परिकल्पना बिल्कुल सामान्य है, जैसे H0: मॉडल महत्वपूर्ण नहीं है
 – 
R.Yan
12 अक्टूबर 2017, 08:56
आम तौर पर एक लॉजिस्टिक रिग्रेशन में पी-वैल्यू की व्याख्या अन्य पी-वैल्यू की तरह ही की जा सकती है। मान लें कि आपका H0 कुछ ऐसा है: 2 चर के बीच कोई संबंध नहीं है। यदि p-मान छोटी सीमा से कम है, तो आप H0 को अस्वीकार कर सकते हैं, जिसका अर्थ है कि आप तय करते हैं कि आपके 2 चर के बीच एक संबंध है। आपके मामले में, यह बड़ा है, इसलिए आप H0 को अस्वीकार नहीं कर सकते, जो बताता है कि चरों के बीच कोई संबंध नहीं है। हालाँकि, यह साबित नहीं करता है कि H0 सत्य है, लेकिन इसका सीधा सा मतलब है कि आप इसे अस्वीकार नहीं कर सकते;)
 – 
Rose
12 अक्टूबर 2017, 23:08
एक बार फिर धन्यवाद! लेकिन मेरे मामले में पी-वैल्यू है: एलएलआर पी-वैल्यू: 2.978e-96, क्या यह अभी भी बड़ा है? मुझे लगता है कि यह p मान काफी छोटा है... क्या मैं इस कारण से अशक्त परिकल्पना को अस्वीकार कर सकता हूँ कि p मान 0.05(थ्रेशोल्ड) से कम है? मुझे पूरा यकीन नहीं है कि एलएलआर पी-वैल्यू को समझने का तरीका अन्य पी-वैल्यू जैसा ही है, जैसे रैखिक प्रतिगमन में से एक :)
 – 
R.Yan
13 अक्टूबर 2017, 04:59
ओह हाँ आप सही हैं, यह बहुत छोटा है क्षमा करें :) मैंने गलत पढ़ा है। एलएलआर पी-वैल्यू एक संभावना परीक्षण से जुड़ा है, जो 2 मॉडल की तुलना करता है, एक जो शून्य परिकल्पना को दर्शाता है, और दूसरा एक। जिस तरह से आप पी-वैल्यू की व्याख्या करते हैं, वह इस अर्थ में समान है कि आप एच 0 को अस्वीकार करते हैं यदि यह चुने हुए सीमा से कम है।
 – 
Rose
13 अक्टूबर 2017, 19:34