मैं एक लॉग-लीनियर अरिमा मॉडल का अनुमान लगा रहा हूं और मैं https://www.r-bloggers.com/forecasting-from-log-linear-regressions/। मैं अवशिष्ट मानक त्रुटि की गणना चार तरीकों से करता हूं और मुझे चार अलग-अलग उत्तर मिलते हैं। क्या कोई कृपया बता सकता है कि इनमें से कौन सा सही है जिसका मुझे उपयोग करना चाहिए?

library(forecast)

model <- Arima(log(AirPassengers), order = c(0, 1, 3), include.constant = TRUE, lambda = NULL)

resids <- residuals(model)

sqrt(mean(resids^2))

sqrt(var(resids))

sum(resids^2) / (length(resids) - 4)

model$sigma2
1
user1491868 19 मार्च 2020, 22:59

1 उत्तर

सबसे बढ़िया उत्तर

आप जो गणना करना चाहते हैं वह अवशिष्ट मानक त्रुटि (आरएसई) है जो मुझे लगता है। तो, आपको चुकता अवशिष्टों (RSS) के योग की गणना करनी होगी और इसे "n-m" से विभाजित करना होगा, जहाँ "n" अवशिष्टों की संख्या है और "m" अनुमानित मापदंडों की संख्या है। model$sigma2 आपको सही उत्तर देता है। आपने गलती से "5" के बजाय "4" का उपयोग किया था जब आपने RSE की गणना स्वयं की थी sum(resids^2) / (length(resids) - 4). यदि आप RSS को (length(resids)-5) से विभाजित करते हैं तो आपको model$sigma2 जैसा ही परिणाम मिलता है। आपने ड्रिफ्ट के लिए 3 एमए पैरामीटर, 1 स्थिरांक और 1 पैरामीटर का अनुमान लगाया है, जो कि 5 है।

यह समाधान sum(resids^2) / (length(resids) - 5) है।

sqrt(mean(resids^2)) के साथ आप वर्गमूल के माध्य के वर्गमूल की गणना करते हैं जो स्पष्ट रूप से RSE के करीब है, लेकिन गलत मानकीकरण का उपयोग किया क्योंकि यह sqrt(sum(resids^2) / (length(resids))) के समान है।

sqrt(var(resids)) के साथ आप अवशिष्टों के मानक विचलन (sd(resids)) की गणना sqrt(sum((resids-mean(resids))^2)/(length(resids)-1)) के रूप में करते हैं। यह अवशेषों का मानक विचलन है लेकिन मॉडल से अवशिष्ट मानक त्रुटि नहीं है। यहां ध्यान दें कि आर "...-1" के माध्यम से विभाजित करके अनुभवजन्य भिन्नता का उपयोग करता है, न कि सैद्धांतिक एक "...-1" के साथ।

यदि आपको और स्पष्टीकरण की आवश्यकता है तो फ़ाइल में पृष्ठ ६६ के आसपास "सांख्यिकीय शिक्षा के लिए एक परिचय" पर एक नज़र डालें, जो कि पीडीएफ में 75 है।

0
Triss 25 मार्च 2020, 13:56