यह दो डेटासेट व्यवसाय और समीक्षा फ़ाइलें हैं। उपयोगकर्ता द्वारा एक पाठ में दी गई सभी समीक्षाएं प्राप्त करने के लिए business_id पर एकाधिक समीक्षाओं को समूहबद्ध कैसे करें।

डेटासेट को BusinessID के साथ मर्ज कैसे करें और नीचे दिए गए चित्र के रूप में अंतिम डेटासेट प्राप्त करें?

मैं इसे पंडों पुस्तकालय के साथ कैसे कर सकता हूं?

enter image description here

1
M. Farzalizadeh 1 नवम्बर 2020, 22:45

1 उत्तर

सबसे बढ़िया उत्तर

आप df1 (ऊपरी-बाएं) को df2 के .groupby संस्करण (शीर्ष-दाएं) के साथ मर्ज कर सकते हैं:

df3 = df1.merge(df2.groupby('Business_id')['Review_text'].apply(list).reset_index(),
               how='left', on='Business_id').rename({'Review_text':'All_reviews'}, axis=1)

Out[1]: 
   Business_id       category  star  Review_count               All_reviews
0            1       shopping   3.5             3  [Text_1, Text_2, Text_4]
1            2     restaurant   5.0             1          [Text_3, Text_5]
2            3  Home services   4.0             6                       NaN
1
David Erickson 1 नवम्बर 2020, 20:06