मैं सुविधाओं के महत्व को देखने के लिए अजगर में एक यादृच्छिक वन मॉडल चलाता हूं। हालाँकि, अनुमानित मूल्य (y) को गिराया नहीं जा सकता है और ऐसा लगता है कि यह उन मापदंडों में से एक के रूप में खेलता है जो 98% से अधिक महत्व रखता है।

कोड नीचे के रूप में है:

temp=pd.read_csv('temp_data.csv',sep=',',engine='python')
temp['y'] = temp['temp_actual']
y = temp['y'].values
temp = temp.drop(['y'],axis=1)

#X = temp.loc[:,:]
x= temp.values

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=42)

कृपया कोडिंग को ठीक करने में मदद करें। धन्यवाद!

1
Yiyi.Z 10 जुलाई 2018, 06:17

1 उत्तर

सबसे बढ़िया उत्तर

अपने कोड में आपने कोड का उपयोग करके लक्ष्य सुविधा की एक प्रतिलिपि y कॉलम में बनाई है

temp['y'] = temp['temp_actual']

फिर आप y को उस कॉलम में मान के रूप में सेट करते हैं

y = temp['y'].values

फिर आपने निम्नलिखित कोड के साथ डेटा फ्रेम से कॉलम y को हटा दिया

temp = temp.drop(['y'],axis=1)

अब अगर आप डेटाफ्रेम temp के कॉलम को देखें तो आप देख सकते हैं कि y मौजूद नहीं है लेकिन temp_actual मौजूद है।

आपको उस कॉलम को डेटाफ्रेम से हटाना होगा, ऐसा करने के लिए आप निम्न में से कोई भी तरीका कर सकते हैं।

del temp['temp_actual']

या

temp = temp.drop(['temp_actual'], axis=1)
0
Sreeram TP 10 जुलाई 2018, 07:16