तो मेरे पास मौसम स्टेशनों की एक सीएसवी फ़ाइल है जिसमें कक्षा है (कक्षा 1 कक्षा 3 के लिए सबसे विश्वसनीय डेटा सबसे खराब है)। मेरे पास निकटतम मौसम स्टेशन से प्रत्येक काउंटी की दूरी है। मैं स्टेशन-काउंटी संबंधों को खत्म करने का प्रयास कर रहा हूं जिनमें अविश्वसनीय डेटा हो सकता है यानी (कक्षा 3 स्टेशन एक काउंटी से दूर)।
मैं ऐसा करने के लिए एक बहुत ही सामान्य तरीके से आने के लिए संघर्ष कर रहा हूं।
मैंने कक्षाओं (कक्षा 1 = 1, कक्षा 2 = .5, कक्षा 3 = .1) के लिए निर्धारित वजन की कोशिश की और फिर दूरी से गुणा किया, लेकिन फिर यह एक करीबी स्टेशन के मुद्दे को निम्न वर्ग में लाता है, एक अविश्वसनीय रीड देता है।
अगर किसी के पास इस पर कोई विचार या सुझाव है तो इसकी बहुत सराहना की जाएगी!
2 जवाब
यदि आप चाहते हैं कि अधिक वजन का अधिक महत्व हो, और आप चाहते हैं कि लंबी दूरी कम वजन से जुड़ी हो, तो आपको वजन के रूप में दूरी के घटते कार्य का उपयोग करना चाहिए, न कि बढ़ते हुए, जैसा कि आपने संकेत दिया था।
भौतिकी में, मात्रा का एक उचित हिस्सा वर्ग दूरी के व्युत्क्रम के साथ घटता है, इसलिए मैं आपको इसे भार के रूप में उपयोग करने की सलाह दूंगा: दूरी से गुणा करने के बजाय वर्ग दूरी से विभाजित करें।
विश्वसनीयता के घटते वर्ग के लिए घटती भारोत्तोलन ठीक है।
बेशक, वास्तविक स्केलिंग और भार समारोह की पसंद की जांच आगे की जा सकती है। उदाहरण के लिए, क्या: दूरी के घन से भाग देना, वर्ग को भारित करने के लिए विभिन्न मानों का उपयोग करना, आदि आपकी समस्या के लिए बेहतर होगा? यह एक ऐसी चीज है जिसकी अधिक जानकारी के बिना हम आसानी से जांच नहीं कर सकते।
मुझे नहीं लगता कि आप यहाँ वज़न का उपयोग करना चाहते हैं। जब तक आपके पास विश्वसनीयता के लिए एक मजबूत आँकड़ा नहीं है जो सभी स्टेशनों पर लागू होता है, केवल कक्षा के आधार पर मनमाने ढंग से भार निर्दिष्ट करना उचित नहीं लगता है।
एक सरल दृष्टिकोण का उपयोग करने के बारे में कैसे? काउंटियों से उनके मौसम केंद्रों की दूरी को तीन श्रेणियों में विभाजित करें:
- पास, मान लें <50 मील / 80 किमी
- मध्यम दूरी, मान लीजिए 50 मील से 100 मील
- दूर, कहते हैं > 100 मील
(ध्यान दें, ये दूरियां आपके डेटा सेट के लिए सबसे अधिक सही नहीं हैं। कुछ उपयुक्त पाने के लिए आपको उनके साथ खेलना होगा।)
फिर, कक्षा x दूरी का एक मैट्रिक्स है और जो भी संयोजन समझ में आता है उसे छोड़ दें। हो सकता है कि मीडियम x क्लास 3 खराब हो लेकिन फार x क्लास 2 ठीक हो।
संबंधित सवाल
नए सवाल
python
पायथन एक बहु-प्रतिमान है, गतिशील रूप से टाइप किया हुआ, बहुउद्देशीय प्रोग्रामिंग भाषा है। यह एक साफ और एक समान वाक्यविन्यास सीखने, समझने और उपयोग करने के लिए त्वरित होने के लिए डिज़ाइन किया गया है। कृपया ध्यान दें कि अजगर 2 आधिकारिक तौर पर 01-01-2020 के समर्थन से बाहर है। फिर भी, संस्करण-विशिष्ट पायथन सवालों के लिए, [अजगर -२.०] या [अजगर -३.x] टैग जोड़ें। पायथन वेरिएंट (जैसे, ज्योथन, PyPy) या लाइब्रेरी (उदा।, पांडस और न्यूमपी) का उपयोग करते समय, कृपया इसे टैग में शामिल करें।