तो मेरे पास मौसम स्टेशनों की एक सीएसवी फ़ाइल है जिसमें कक्षा है (कक्षा 1 कक्षा 3 के लिए सबसे विश्वसनीय डेटा सबसे खराब है)। मेरे पास निकटतम मौसम स्टेशन से प्रत्येक काउंटी की दूरी है। मैं स्टेशन-काउंटी संबंधों को खत्म करने का प्रयास कर रहा हूं जिनमें अविश्वसनीय डेटा हो सकता है यानी (कक्षा 3 स्टेशन एक काउंटी से दूर)।

मैं ऐसा करने के लिए एक बहुत ही सामान्य तरीके से आने के लिए संघर्ष कर रहा हूं।

मैंने कक्षाओं (कक्षा 1 = 1, कक्षा 2 = .5, कक्षा 3 = .1) के लिए निर्धारित वजन की कोशिश की और फिर दूरी से गुणा किया, लेकिन फिर यह एक करीबी स्टेशन के मुद्दे को निम्न वर्ग में लाता है, एक अविश्वसनीय रीड देता है।

अगर किसी के पास इस पर कोई विचार या सुझाव है तो इसकी बहुत सराहना की जाएगी!

0
Coleson White 15 अप्रैल 2020, 05:23
यदि आपको केवल विश्वसनीय/अविश्वसनीय निर्णय लेना है तो आप प्रत्येक वर्ग के लिए अधिकतम दूरी परिभाषित कर सकते हैं। यदि स्टेशन दूर है, तो यह अविश्वसनीय है। यह निश्चित रूप से अनुमान लगाने या किसी तरह उचित अधिकतम गणना करने की आवश्यकता है। दूरियां।
 – 
Michael Butscher
15 अप्रैल 2020, 05:39

2 जवाब

यदि आप चाहते हैं कि अधिक वजन का अधिक महत्व हो, और आप चाहते हैं कि लंबी दूरी कम वजन से जुड़ी हो, तो आपको वजन के रूप में दूरी के घटते कार्य का उपयोग करना चाहिए, न कि बढ़ते हुए, जैसा कि आपने संकेत दिया था।

भौतिकी में, मात्रा का एक उचित हिस्सा वर्ग दूरी के व्युत्क्रम के साथ घटता है, इसलिए मैं आपको इसे भार के रूप में उपयोग करने की सलाह दूंगा: दूरी से गुणा करने के बजाय वर्ग दूरी से विभाजित करें।

विश्वसनीयता के घटते वर्ग के लिए घटती भारोत्तोलन ठीक है।

बेशक, वास्तविक स्केलिंग और भार समारोह की पसंद की जांच आगे की जा सकती है। उदाहरण के लिए, क्या: दूरी के घन से भाग देना, वर्ग को भारित करने के लिए विभिन्न मानों का उपयोग करना, आदि आपकी समस्या के लिए बेहतर होगा? यह एक ऐसी चीज है जिसकी अधिक जानकारी के बिना हम आसानी से जांच नहीं कर सकते।

1
norok2 15 अप्रैल 2020, 05:43

मुझे नहीं लगता कि आप यहाँ वज़न का उपयोग करना चाहते हैं। जब तक आपके पास विश्वसनीयता के लिए एक मजबूत आँकड़ा नहीं है जो सभी स्टेशनों पर लागू होता है, केवल कक्षा के आधार पर मनमाने ढंग से भार निर्दिष्ट करना उचित नहीं लगता है।

एक सरल दृष्टिकोण का उपयोग करने के बारे में कैसे? काउंटियों से उनके मौसम केंद्रों की दूरी को तीन श्रेणियों में विभाजित करें:

  • पास, मान लें <50 मील / 80 किमी
  • मध्यम दूरी, मान लीजिए 50 मील से 100 मील
  • दूर, कहते हैं > 100 मील

(ध्यान दें, ये दूरियां आपके डेटा सेट के लिए सबसे अधिक सही नहीं हैं। कुछ उपयुक्त पाने के लिए आपको उनके साथ खेलना होगा।)

फिर, कक्षा x दूरी का एक मैट्रिक्स है और जो भी संयोजन समझ में आता है उसे छोड़ दें। हो सकता है कि मीडियम x क्लास 3 खराब हो लेकिन फार x क्लास 2 ठीक हो।

0
James McLeod 15 अप्रैल 2020, 06:32