मैंने मूल डेटासेट, df
से पंक्तियों को फ़िल्टर करने वाले दो डेटाफ़्रेम बनाने का प्रयास किया है। विशेष रूप से, मैंने दो फ़ील्ड वाली सभी पंक्तियों का चयन किया, A
और B
, शून्य नहीं, df_train
नामक डेटासेट को परिभाषित करते हुए। मैं एक डेटासेट बनाना चाहता था, df_test
, जिसमें वे सभी पंक्तियाँ शामिल हैं जो df_train
, यानी df-df_train
में शामिल नहीं हैं।
मैंने निम्नानुसार कोशिश की है:
df_test=df[~df.isin(df_train)]
लेकिन मुझे पूरा डेटासेट मिल गया है (df
में 1107 पंक्तियाँ हैं, df_train
479)। डेटासेट में निम्नलिखित कॉलम होते हैं: ID, A, B, C
।
मुझे लगता है कि यह डेटासेट की सामग्री के लिए प्रासंगिक नहीं है, लेकिन अगर आपको इसकी आवश्यकता है, तो कृपया मुझे बताएं और मैं इसे जोड़ दूंगा।
1 उत्तर
जब आप ट्रेन सेट करवाते हैं, तो उसे मूल df index
ले जाना चाहिए
df_test = df.drop(df_train.index)
संबंधित सवाल
नए सवाल
python
पायथन एक बहु-प्रतिमान है, गतिशील रूप से टाइप किया हुआ, बहुउद्देशीय प्रोग्रामिंग भाषा है। यह एक साफ और एक समान वाक्यविन्यास सीखने, समझने और उपयोग करने के लिए त्वरित होने के लिए डिज़ाइन किया गया है। कृपया ध्यान दें कि अजगर 2 आधिकारिक तौर पर 01-01-2020 के समर्थन से बाहर है। फिर भी, संस्करण-विशिष्ट पायथन सवालों के लिए, [अजगर -२.०] या [अजगर -३.x] टैग जोड़ें। पायथन वेरिएंट (जैसे, ज्योथन, PyPy) या लाइब्रेरी (उदा।, पांडस और न्यूमपी) का उपयोग करते समय, कृपया इसे टैग में शामिल करें।