आप ऑर्डर या बॉक्सप्लॉट को बदलने के बारे में कैसे जाते हैं ताकि उन्हें कम से कम उनके माध्यम से ऑर्डर किया जा सके।

बॉक्सप्लॉट को उनके माध्यम से पुन: व्यवस्थित करने का यह मेरा प्रयास है:

url <- "http://www.cse.lehigh.edu/~brian/course/2020/datascience/student-teacher-ratios.csv"
df_ratios <- read.csv(url, header=T)
s2 <- with(df_ratios, reorder(region, -student_ratio, mean))
with(df_ratios, boxplot(student_ratio~s2))

0
Robert Kasumi 17 फरवरी 2020, 23:38
2
क्या आप इस लिंक का अनुसरण करके अपने डेटासेट का प्रतिलिपि प्रस्तुत करने योग्य उदाहरण प्रदान कर सकते हैं: stackoverflow.com/questions/5963269/… ? साथ ही, कोड को एक छवि के रूप में चिपकाने के बजाय, क्या आप इसे सीधे अपने प्रश्न में टेक्स्ट के रूप में कॉपी/पेस्ट कर सकते हैं?
 – 
dc37
17 फरवरी 2020, 23:53
ध्यान रखें कि बॉक्सप्लॉट में मध्य मोटी काली रेखा माध्यिका से मेल खाती है, माध्य से नहीं
 – 
maarvd
18 फरवरी 2020, 00:10

2 जवाब

आपकी समस्या यह है कि आपके डेटा में गुम मान हैं। अतः सभी स्तंभों का माध्य NA है। माध्य की गणना करते समय लापता मानों को अनदेखा करने के लिए, आप ऐसा कर सकते हैं

df_ratios <- read.csv(url, header=T)
s2 <- with(df_ratios, reorder(region, -student_ratio, mean, na.rm=TRUE))
with(df_ratios, boxplot(student_ratio~s2))

enter image description here

2
MrFlick 18 फरवरी 2020, 00:57
1
हाँ, लेकिन मैं इसके बारे में खुश नहीं था: /
 – 
MrFlick
18 फरवरी 2020, 01:00

Ggplots2 और forcats पैकेजों का उपयोग करने वाला एक समाधान, यह मानते हुए कि आपका मतलब है कि उन्हें माध्यिका के अनुसार आदेश दिया जाना चाहिए।

library(ggplot2)
library(forcats)

ggplot(df_ratios, aes(x = fct_reorder(region, student_ratio, .fun = median), y = student_ratio)) + geom_boxplot()
1
maarvd 18 फरवरी 2020, 00:28