मुझे एक समस्या है जहाँ मुझे nycflights13 डेटा सेट में अद्वितीय फ़्लाइट टेल नंबर खोजने की आवश्यकता है। फिर, मुझे डेटा सेट में किसी भी हवाई अड्डे में सबसे बड़ी संख्या में अद्वितीय गंतव्यों के साथ टेलनम खोजने की आवश्यकता है।

मैंने अपने पाइप में डालने से पहले एक कॉलम के रूप में टेलनम के लिए अद्वितीय, या टेलनम को अलग से परिभाषित करने की कोशिश की है, लेकिन कोई भी काम नहीं करता है।

flights %>%
    count(tailnum, dest) %>%
    arrange(-n) %>%
    na.omit(tailnum_new) %>%
    print()

यह कोड मुझे विमान की पूंछ संख्या, गंतव्य के साथ एक तालिका देता है, और उस स्थान से उस टेलनम ने कितनी बार उड़ान भरी, लेकिन मैं केवल अपने टेलनम चर में अद्वितीय अवलोकन चाहता हूं। किसी भी मदद की सराहना की जाती है!

2
PageSim 2 अक्टूबर 2019, 00:20

2 जवाब

सबसे बढ़िया उत्तर

हम क्या कर सकते हैं

library(dplyr)
flights %>%
   filter(complete.cases(tailnum)) %>%
   group_by(tailnum) %>% 
   summarise(n = n_distinct(dest)) %>% 
   ungroup %>%
   slice(which.max(n))
# A tibble: 1 x 2
#  tailnum     n
#  <chr>   <int>
#1 N11194     47
0
akrun 2 अक्टूबर 2019, 00:22
त्वरित प्रतिक्रिया की सराहना करें; क्या पूर्ण.केस लाइन एनएएस जैसी चीजों को हटा देती है? फिर संक्षेप में अलग उड़ानें खोजने में सक्षम है?
 – 
PageSim
2 अक्टूबर 2019, 00:28
यह !is.na(tailnum) के समान है। यहां, हम 'टेलनम' द्वारा समूहित करते हैं और 'dest' और slice के विशिष्ट तत्वों की संख्या प्राप्त करते हैं, max 'dest' की संख्या (जो मुझे लगता है कि अपेक्षित आउटपुट का आपका विवरण है) खोजने के लिए
 – 
akrun
2 अक्टूबर 2019, 00:29
flights %>%
    filter(!is.na(tailnum)) %>%
    count(tailnum, dest) %>%
    count(tailnum, sort = TRUE) %>%
    slice(1)
## A tibble: 1 x 2
#  tailnum     n
#  <chr>   <int>
#1 N11194     47
0
d.b 2 अक्टूबर 2019, 00:51