मैं एक डेटासेट s
से आउटलेर्स को हटाने की कोशिश कर रहा हूं जिसमें 3 चर शामिल हैं:
id consumption period
a 0.1 summer
a 0.2 summer
b 0.3 summer
a 0.4 winter
b 10 winter
c 12 winter
मैंने s
से आउटलेर्स को हटाने के लिए outliers <- s$consumption[!s$consumption %in% boxplot.stats(s$consumption)$out]
का उपयोग किया और कुछ इस तरह मिला:
consumption
0.1
0.2
0.3
0.4
हालांकि, मैं नीचे ऐसा कुछ प्राप्त करना चाहता हूं:
id consumption period
a 0.1 summer
a 0.2 summer
b 0.3 summer
a 0.4 winter
लेकिन $out
फ़ंक्शन केवल मुझे संख्याओं के साथ कॉलम को हटाने की अनुमति देता है (कारकों के साथ नहीं)।
0
SssssssAaaaaaa
21 अगस्त 2021, 03:25
1 उत्तर
सबसे बढ़िया उत्तर
मुझे एक समाधान मिला जो मुझे outliers <- s$consumption[!s$consumption %in% boxplot.stats(s$consumption)$out]
से प्राप्त आउटपुट के min
को खोजने के लिए है, जो इस मामले में l
है:
consumption
0.1
0.2
0.3
0.4
मेरा min
मान जानने के बाद, मैं एक शर्त सेट करके s
का सबसेट ले सकता हूं जहां consumption
को min(l)
से कम होना चाहिए।
new <- subset(s, consumption < min(l))
0
SssssssAaaaaaa
21 अगस्त 2021, 15:16
out <- s[!s$consumption %in% boxplot.stats(s$consumption)$out, ]