मैं डेटाब्रिक्स रनटाइम 6.3 का उपयोग करता हूं और pySpark का उपयोग करता हूं। मेरे पास डेटाफ्रेम df_1. SalesVolume एक पूर्णांक है लेकिन औसत मूल्य एक स्ट्रिंग है।

जब मैं नीचे दिए गए कोड को निष्पादित करता हूं, तो कोड चलता है और मुझे सही आउटपुट मिलता है।

display(df_1.filter('SalesVolume>10000 and AveragePrice>70000'))

लेकिन, नीचे कोड त्रुटि में समाप्त होता है; "py4j.Py4JException: विधि और ([वर्ग java.lang.Integer]) मौजूद नहीं है"

display(df_1.filter(df_1['SalesVolume']>10000 & df_1['AveragePrice']>7000))

पहला काम क्यों करता है लेकिन दूसरा नहीं?

1
ekan 26 जिंदा 2020, 21:38

1 उत्तर

सबसे बढ़िया उत्तर

आपको अपनी शर्तों को लपेटना होगा ()

display(df_1.filter((df_1['SalesVolume']>10000) & (df_1['AveragePrice']>7000)))

फ़िल्टर SQL को सिंटैक्स की तरह या डेटाफ़्रेम को सिंटैक्स की तरह स्वीकार करता है, पहला काम करता है क्योंकि यह सिंटैक्स की तरह एक मान्य sql है। लेकिन दूसरा नहीं है।

2
Ravi 26 जिंदा 2020, 19:05