मैंने मूल डेटासेट, df से पंक्तियों को फ़िल्टर करने वाले दो डेटाफ़्रेम बनाने का प्रयास किया है। विशेष रूप से, मैंने दो फ़ील्ड वाली सभी पंक्तियों का चयन किया, A और B, शून्य नहीं, df_train नामक डेटासेट को परिभाषित करते हुए। मैं एक डेटासेट बनाना चाहता था, df_test, जिसमें वे सभी पंक्तियाँ शामिल हैं जो df_train, यानी df-df_train में शामिल नहीं हैं।

मैंने निम्नानुसार कोशिश की है:

df_test=df[~df.isin(df_train)]

लेकिन मुझे पूरा डेटासेट मिल गया है (df में 1107 पंक्तियाँ हैं, df_train 479)। डेटासेट में निम्नलिखित कॉलम होते हैं: ID, A, B, C

मुझे लगता है कि यह डेटासेट की सामग्री के लिए प्रासंगिक नहीं है, लेकिन अगर आपको इसकी आवश्यकता है, तो कृपया मुझे बताएं और मैं इसे जोड़ दूंगा।

0
user13623188 6 सितंबर 2020, 21:29

1 उत्तर

सबसे बढ़िया उत्तर

जब आप ट्रेन सेट करवाते हैं, तो उसे मूल df index ले जाना चाहिए

df_test = df.drop(df_train.index)
0
BENY 6 सितंबर 2020, 21:36